Esta hoja de trabajo le ayudará a entender cómo se obtiene un coeficiente en una regresión utilizando una variable binaria o una variable continua. He construido este ejemplo basado en este post de Vivekandanda Das, pero lo cambio un poco para seguir un ejemplo que hemos estado viendo en clase. Puede obtener los datos para este ejercicio en: https://github.com/dstellotri/rmda
Mean Comparison
Imaginemos que estamos tratando de encontrar el efecto de ir a la escuela Batten en los ingresos. Podemos ejecutar la siguiente regresión:
Digamos que el ingreso es un promedio de ganancias para los 4 años posteriores a Batten.
Así es como se ven los datos, que puede bajar aqui (battenincome.dta)
- El valor de . Obtenga este valor utilizando promedios.
- El valor de . Obtenga este valor mediante la siguiente fórmula
- El valor de . Obtener este valor mediante una regresión
. sum income if batten==1
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
income | 9 184.4444 27.88867 140 220
. sum income if batten==0
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
income | 9 155.2222 27.11908 125 195
. display 184.4444 - 155.2222
29.2222
. * Primero obtenemos la covarianza entre Batten e Ingreso
.
.
. correlate batten income, covariance
(obs=18)
| batten income
-------------+------------------
batten | .264706
income | 7.73529 938.147
. * obtenemos la varianza de Batten
. sum batten, det
batten
-------------------------------------------------------------
Percentiles Smallest
1% 0 0
5% 0 0
10% 0 0 Obs 18
25% 0 0 Sum of Wgt. 18
50% .5 Mean .5
Largest Std. Dev. .5144958
75% 1 1
90% 1 1 Variance .2647059
95% 1 1 Skewness 0
99% 1 1 Kurtosis 1
. * Now we divide:
. display 7.73529/ .2647059
29.222205
. reg income batten
Source | SS df MS Number of obs = 18
-------------+---------------------------------- F(1, 16) = 5.08
Model | 3842.72222 1 3842.72222 Prob > F = 0.0386
Residual | 12105.7778 16 756.611111 R-squared = 0.2409
-------------+---------------------------------- Adj R-squared = 0.1935
Total | 15948.5 17 938.147059 Root MSE = 27.507
------------------------------------------------------------------------------
income | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
batten | 29.22222 12.96672 2.25 0.039 1.734006 56.71044
_cons | 155.2222 9.168855 16.93 0.000 135.7851 174.6593
------------------------------------------------------------------------------
Lo que estos tres ejercicios deberían mostrarle, son formas de obtener el mismo número. Todos llevan la misma interpretación pero ver cómo obtenerlos es importante. Puede hacer esto para una variable continua y también debería funcionar. Tenga en cuenta que para una variable continua, usar promedio podría volverse realmente complejo porque tendría que hacerlo para cada cambio de valor, por lo tanto, el método (2) parece el más sensato para usar para la variable continua.