class: center, middle, inverse, title-slide .title[ # Econometría (II / Práctica) ] .subtitle[ ## Magíster en EconomíaTema 1: Introducción ] .author[ ### Prof. Luis Chancí ] .date[ ###
www.luischanci.com
] --- layout:true <div style="position:absolute; left:60px; bottom:11px; font-size: 10pt; color:#DDDDDD;">Prof. Luis Chancí - Econometría (II / Práctica)</div> --- # Introducción ## Contenidos 1. Causalidad y aproximación tradicional a econometría (I): 1.1. Experimentos vs supuestos 'usuales´ en econometría I (para dar respuesta a una pregunta de investigación). 1.2. Repaso de algunos conceptos (ej. exogeneidad, identificación). 1.3. Sobre datos (y diseño del programa de econometría II): Estructura, algunos problemas, algunas recomendaciones. 2. Información adicional sobre el syllabus. 3. Comentarios/herramientas adicionales, * gestión de información, _Version Control_ (Github) * computing/programación * presentaciones * sobre la retroalimentación y seminarios de investigación --- # Causalidad y aproximación tradicional a econometría Nota: La siguiente introducción se encuentra inspirada en los primeros capítulos de los siguientes textos: * Angrist, J. D., & Pischke, J. S. (2009). .link-style1[[Mostly harmless econometrics: An empiricist's companion](https://www.mostlyharmlesseconometrics.com/)]. Princeton university press. * Angrist, J. D., & Pischke, J. S. (2014). .link-style1[[Mastering'metrics: The path from cause to effect](https://www.masteringmetrics.com/)]. Princeton university press. * Cameron, A. C., & Trivedi, P. K. (2005). [Microeconometrics: methods and applications](https://cameron.econ.ucdavis.edu/mmabook/mma.html). Cambridge university press. </br> .center[] (¡leerlos!) --- # Causalidad y aproximación tradicional a econometría (cont.) Del modelo estructural (Cowles Comission) * por ejemplo, hay una relación (funcional en `\(g\)`) entre variables explicadas `\(y\)`, variables explicativas `\(z\)`, y un componente aleatorio `\(u\)`: `$$g(\boldsymbol{y}_i,\boldsymbol{x}_i,\boldsymbol{u}_i|\boldsymbol{\theta})=0$$` donde, `\(\boldsymbol{\theta}\)` es un vector de parametros estructurales. Por ejemplo, un modelo en economía de oferta y demanda de mano de obra. al modelo de Rubin .center[</br><span style="color:ligthgray;font-size:50%">Figura: "two roads". Fuente: https://www.masteringmetrics.com/ .</span>] * Desafío: ' _Potential outcome_ ' en el efecto (medio) de un 'tratamiento' (comparación de medias de grupos en un experimento), `$$ATE=\mathbb{E}\left[y|T=1\right]-\mathbb{E}\left[y|T=0\right]$$` experimentos sociales: _RCTs_, _Natural Experiments_, _Quasi-experiments_. --- # Causalidad y aproximación tradicional a econometría (cont.) **Efecto Promedio del Tratamiento ( _Average Treatment Effect_ -ATE)** * Efecto promedio de un tratamiento en toda la población, por lo que es útil para evaluar políticas con impacto generalizado. * Se compara el resultado promedio si todos recibieran el tratamiento versus si nadie lo recibiera. * `\(ATE=\mathbb{E}\left[y|T=1\right]-\mathbb{E}\left[y|T=0\right]\)` puede sufrir sesgo (selección). Sin embargo, la asignación aleatoria (ej. un _RCT_ ) ayuda a atenuar el sesgo (al asignar aleatoriamente el tratamiento) y permite acercarse a `$$\small{ATE=\mathbb{E}\left[Y_1-Y_0\right]}$$` **Efecto Promedio Local del Tratamiento ( _Local Average Treatment Effect_ - LATE)** * Efecto del tratamiento para un subgrupo específico: aquellos influenciados por un "instrumento." * Reconoce que los efectos del tratamiento pueden variar entre grupos. Es útil cuando la asignación al tratamiento no es aleatoria. * Formulación sin considerar y considerando el _potential outcome_ (observado vs teoría -> considerando 'the exclusion restriction'): `$$\small{LATE = \frac{\mathbb{E}[Y | Z = 1] - \mathbb{E}[Y | Z = 0]}{\mathbb{E}[T = 1 | Z = 1] - \mathbb{E}[T = 1 | Z = 0]}\hspace{0.5cm};\hspace{0.5cm}LATE = \frac{\mathbb{E}[Y_1 - Y_0 | Z = 1] - \mathbb{E}[Y_1 - Y_0 | Z = 0]}{\mathbb{E}[T = 1 | Z = 1] - \mathbb{E}[T = 1 | Z = 0]} }$$` Donde, `\(Z\)` es el instrumento usado (ej. la lotería de asignación a tratamiento o control); `\(T\)` corresponde a si la unidad de análisis (la persona) recibió el tratamiento; `\(Y\)` corresponde a la respuesta o resultado ( _outcome_ ) observado. --- # Causalidad y aproximación tradicional a econometría (cont.) .font90[Experimentos sociales para aproximar la respuesta a una pregunta de investigación ('en búsqueda de relación causal'),] .center[] .font60[Aunque los RCTs no siempre estiman perfectamente el _ATE_ debido a problemas como " _non-compliance, attrition_ , y/o _limited generalizability_ ", siguen siendo el método más confiable para estimar los efectos causales y acercarse lo más posible al verdadero ATE.] --- # Causalidad y aproximación tradicional a econometría (cont.) ## Algunos conceptos * **Identificación:** Aislar el efecto causal del tratamiento. * **Estrategia de Identificación:** Métodos para lograr la identificación (ej., variables instrumentales, RCTs). * **Exogeneidad:** La variable explicativa no está correlacionada con el término de error. Implica que el tratamiento se asigna independientemente de los resultados potenciales. Es decir, en notación de Cameron and Trivedi, la f.d.p. conjunta (J) de un conjunto de datos `\(W\)`, particionados en `\(y\)` y `\(\boldsymbol{Z}\)`, puede separarse en las f.d.p. condicional (C) y marginal (M), en donde al particionar el vector de parámetros `\(\boldsymbol{\varphi}\)` se tiene que `$$f_J(\boldsymbol{W}|\boldsymbol{\varphi})=f_C(y|\boldsymbol{Z},\boldsymbol{\varphi}_1)\times f_M(\boldsymbol{Z}|\boldsymbol{\varphi}_2)$$` donde el vector de interés es `\(\boldsymbol{\varphi}_1\)`. Es decir, no se requiere información de la f.d.p. marginal para hacer inferencia respecto a vector de parámetros de interés: La distribución de Z no proporciona información sobre la relación entre `\(y\)` y Z. * **Heterogeneidad:** El efecto del tratamiento varía entre individuos o grupos. Ejemplo: Efectos fijos ('_nuisance parameters_') en datos de panel. --- # Causalidad y aproximación tradicional a econometría (cont.) ## El rol de los supuesto (y organización de temas en el syllabus) * Asumir que se conoce la distribución. Por ejemplo, si se busca el vector de parámetros que tiene la mayor probabilidad haber generado el conjunto de datos que observamos, la técnica es **Máxima Verosimilitud**. En este 'conjunto' se pueden agrupar, por ejemplo, modelos con variables dependiente que es discreta (0,1): Logit (asumir distribución logística) y Probit (asumir distribución normal). También incluimos modelos como el Tobit (latente y normalidad). * Emplear solo algunos momentos de la distribución - **Método (Generalizado) de Momentos** * O basarse en replicar experimentos sociales - **Diff-in-Diff, Control en observables (Matching), Regresión Discontinua, Variables instrumentales.** * O simplemente, aprovechar la estructura de los datos (**panel**) o el desconocimiento de las relaciones (**nonparametrics**). --- # Causalidad y aproximación tradicional a econometría (cont.) ## Estructura de los Datos * **Corte transversal** (Cross-sectional data). Individuos incluidos en la muestra en un punto particular en el tiempo. * **Cortes transversales repetidos (repeated cross-sections).** Las muestras de datos son coleccionadas en diferentes períodos `\(t_1,\,t_2,\,...\)` pero diferentes unidades individuale son incluidas en la muestra cada vez. * **Longitudinales (panel data).** Muestreo ocurre una vez `\(t_1\)` y las mismas unidades `\(i\)` son entrevistadas en subsecuentes periodos de tiempo `\(t_2,...,T\)`. Ventajas: control por heterogeneidad e inclusión de relaciones dinámicas. --- # Causalidad y aproximación tradicional a econometría (cont.) ## Algunos Problemas con Datos * Sesgos en muestreo. Selección. Ej. Encuesta de innovación. Obstáculo para innovar en productos considerando solo empresas que hacen innovación. * No respuesta. * Observaciones faltantes (missing values). * Deserción (attrition). Podría llevar a sesgos en paneles longitudinales. * Errores de medida en variables (measurement error). .center[] --- # Por ende, una idea de contenidos a cubrir: 1. Introducción y (breve) repaso Estimador Mínimos Cuadrados (OLS: _Ordinary Least Squares_) 2. Estimador Máxima Verosimilitud (ML: _Maximum likelihood_) * (Repaso) MLE vs OLS bajo normalidad de residuales: Estimador, Matrix de Información, Cramer Rao, etc. * Variable Dependiente Limitada: Logit y Probit * Truncamiento, Selección, Modelo de Conteo, Modelo de Supervivencia 3. Introducción a Series de Tiempo 4. Modelos para Datos en Panel: Efectos Fijos y Efectos Aleatorios 5. Variables Instrumentales (2SLS: _Two-stage-least-squares_) 6. Método Generalizado de Momentos (GMM: _Generalized Method of Moments_) 7. (Breve) Introducción a métodos inferencia causal: Diferencias en Diferencias (Diif_in_Diff), Propensity Score Matching (PSM), Regresión Discontinua (RDD).(*) 8. (Breve) Introducción a: econometría semi/no-paramétrica, econometría bayesiana.(*) (*) Si nos quedan unas horas al final del curso. --- # Finalmente, algunos tips ## Manejo de la información * Utilizar la nube (Dropbox, Google drive, etc.) o algún software que les permita tener acceso a su trabajo desde cualquier lugar. * Organización de la información en un proyecto: Folders separados. * Version Control: Github. .center[] * Organización de directorios: Tener un directorio organizado será muy apreciado por 'ustedes mismo' en un futuro. - Lectura recomendada: [Code and Data for the Social Sciences: A Practitioner's Guide](https://web.stanford.edu/~gentzkow/research/CodeAndData.xhtml) por Matthew Gentzkow and Jesse M. Shapiro * Ser ordenados al programar (incluir notas). Cuidado con la automatización. - Lectura Recomendada: [Coding for Economists](https://scholar.harvard.edu/files/ristovska/files/coding_for_econs_20190221.pdf) by Ljubica LJ Ristovska --- # Finalmente, algunos tips (cont.) ## Escritura y presentación * ¡El cómo se presente el trabajo importa!. - Recomiento uso de Latex. Una plataforma sencilla es Lyx. Una online fácil de acceder es https://www.overleaf.com/ * ¡El cómo se presente el trabajo importa! - Lectura Recomendada: [How to give an applied micro talk](https://www.brown.edu/Research/Shapiro/pdfs/applied_micro_slides.pdf) por Jesse M. Shapiro - Lectura Recomendada: [Public speaking for academic economists](https://www.dropbox.com/s/4h9soo9dpndjtvt/public_speaking_for_academic_economists.pdf?dl=0) por Rachel Meager. * Finalmente, recordar que: Obtener feedback es un regalo y hay que apreciarlo. --- # Cierre </br></br></br></br> ## <center>¿Preguntas?</center> .center[ ] `$$\,$$` .center[O vía E-mail: [lchanci1@binghamton.edu](mailto:lchanci1@binghamton.edu)]