170 likes | 429 Vues
Universidad de San Andrés Econometría. Profesores: Mariana Marchionni Walter Sosa Escudero Asistentes: María Edo Amely Gibbons. Introducción a Stata - regresiones. Introducción básica a econometría usando Stata .
E N D
Universidad de San Andrés Econometría Profesores: Mariana Marchionni Walter Sosa Escudero Asistentes: María Edo AmelyGibbons
Introducción a Stata- regresiones Introducción básica a econometría usando Stata. Datos: J. Biddle and D. Hamermesh (1990), “Sleep and theallocation of time”, TheJournal of PoliticalEconomy, Vol. 98, No.5, Part 1, pp. 922-943. Objetivo del trabajo: modelar cómo afecta el mercado laboral las horas de sueño
Introducción a Stata- regresiones PASO I: abrimos la base y exploramos las variables cd "C:\Users\DE\Dropbox\Econometría 2014\x - Tutorial 2” use sleep.dta, clear describe totwrkslpnaps male black yrsmarr
Introducción a Stata- regresiones Paso II: estadísticos descriptivos básicos de las variables • sum slpnapstotwrk male black yrsmarr • tab male black, row nofreq Suponganquequierenverquédiferencia de minutosdormidos hay entre los quetrabajanmenos de 20 horas y el resto. ¿Cómoharían?
Introducción a Stata- regresiones a) Generar una variable que distinga a la muestra entre los que trabajan menos de 20 horas y el resto: gen part_time=(totwrk<=1200) b) Miramos cómo se distribuye la muestra de acuerdo a esta clasificación: tabpart_time c) Miramos la diferencia de minutos dormidos entre un grupo y el otro: tablepart_time, c(mean slpnaps)
Introducción a Stata- regresiones Paso III: mirarcorrelación, covarianza y regresiones • corrslpnapstotwrk [correlación entre las variables] • corrslpnapstotwrk, c [covarianza entre las variables] • regress slpnapstotwrkyrsmarr age educ male black
Introducción a Stata- regresiones • k: cantidad de variables • n: cantidad de observaciones • SEC: Suma Explicada de Cuadrados • SRC: Suma de ResiduosCuadrados • STC: Suma Total de Cuadrados
Introducción a Stata- regresiones • InterpretaciónCoeficiente: un aumento en un minutotrabajado, disminuye en 0.197 los minutosque se duermen. • ¿En cuántodisminuyen los minutos de sueñosiaumenta en unahora la cantidad de tiempotrabajado? • Test t: Ho: el coeficienteesigual a 0. Ha: el coeficienteesdistinto de 0. ¿Quéconcluimossi el valorobtenido de t es -9.85?
Introducción a Stata- regresiones RechazoHo con unasignificatividad del 1% RechazoHo con unasignificatividad del 10% • predict yest (gen yest=cons+ *x) [se obtiene la predicción lineal del modelo estimado (sólo después de ejecutar el comando regress). • predictresid, residual (gen resid=y-cons-*x)[genera una variable conlos errores estimados (sólo después de ejecutar el comando regress)]. • test totwrk[testea si los coeficientes son iguales a 0-> Ho: coeficiente=0] • test black=male[testea si los coeficientes son iguales]
Introducción a Stata- regresiones • Después de correr una regresión, Stata guarda información de la misma. Los siguientes son algunos de los comandos que guarda: • Se pueden ver con el comando display • También guarda los coeficientes: • _b[_cons]: es el coeficiente de la constante. • _b[variable]: es el coeficiente de la variable. ¿Cómo podemos obtener una variable idéntica a yest? NOTA: Recuerden que todos estos comandos se refieren a la regresión ejecutada más recientemente.
Introducción a Stata- regresiones • regress slpnapstotwrkyrsmarr age educ male black • finditoutreg2 • outreg2 from http://fmwww.bc.edu/RePEc/bocode/o • click here to install • outreg2 using nombre_archivo, excel • outreg2 using nombre_archivo, word
Test de hipótesis - repaso • El estimador de MC que obtenemos es una realización de una variable aleatoria • Queremos inferir, a partir de este , información acerca del valor del verdadero parámetro . • Por ejemplo, ¿ ? Es decir, ¿ es relevante para explicar Y? • Para responder a preguntas como estas necesitamos recurrir a los test de hipótesis. • El test de hipótesis requiere conocer alguna información sobre • i • ii. • iii. Distribución de
Test de hipótesis - repaso • Esta información ya la tenemos: • (Obtenida utilizando los supuestos 1 y 4). • (Obtenida utilizando los supuestos 1, 2 y 4) • (Obtenida agregando el supuesto 5) • Calculamos: • El t observado (i.e. el valor de dados los datos y la hipótesis nula) • El t crítico (dado el nivel de significatividad del test y las hipótesis planteadas -> tabla)
Test de hipótesis - repaso zcrítico t crítico
Test de hipótesis - repaso • Comparamos t crítico y t observado: • rechazamos la hipótesis nula en caso de que el valor absoluto del t observado fuera mayor al t crítico. • En este caso, como la cantidad de observaciones es grande, el t crítico es igual al z crítico = 1.96 < |-9.85| • Rechazo H0, rechazo la hipótesis de que el coeficiente es igual a 0 al nivel de significatividad del 5%. • Podemos continuar testeando para distintos niveles de significatividad.
P-valor • ¿Cuál es la probabilidad de haber obtenido este resultado (-0.197406 ) si la hipótesis nula es cierta (es decir, si en realidad )? Esta probabilidad es el p-valor. • ¿Es una “casualidad” haber obtenido el valor resultante? • ¿Cómo se calcula el p-valor? Es el área debajo de la curva de la distribución de a partir del valor t observado. Ejemplo: P-valor:
P-valor Nivel de significatividad Una vez obtenido el p-valor, necesitamos fijar un criterio para tomar decisiones acerca de si rechazar o no la hipótesis nula.