-
Previas para matrices de covarianzas (08/2017 - a la fecha
)
La estimación de matrices de covarianza surge en problemas multivariados como la distribución normal multivariada o modelos de regresión generalizados mixtos donde los efectos aleatorios son modelados de forma conjunta. La inferencia Bayesiana sobre una matriz de covarianza requiere especificar una distribución de probabilidades para dicha matriz.
El escenario más simple donde esto surge es en el modelado de datos normales multivariados, Una de las opciones más utilizadas es la distribución Wishart inversa, ? ? IW(?,?), debido a que es la previa conjugada (ver sección 3.6 Gelman et al. (2013)). Existen otras previas que no presentan estos problemas (Barnard, McCulloch, and Meng (2000), O?Malley and Zaslavsky (2008), Huang, Wand, and Others (2013)). Sin embargo, las distribuciones que tienen como dominio las matrices de covarianza no han recibido mucha atención en términos de caracterizar sus propiedades (Tokuda et al. 2011).
En Alvarez-Castro, Niemi, and Simpson (2014) mostramos que la inferencia posterior cuando se usa una previa IW puede ser tremendamente sesgada hacia valores altos de las vairanzas y valores cercanos a cero para las correlaciones. Akinc and Vandebroek (2017) extienden este ejercicio al caso de modelos logísticos.
Es interesante profundizar ese trabajo a otros modelos, por ejemplo modelos lineales o lineales generalizados jerárquicos, así como el estudio de las distribuciones previas para matrices de covarianzas, buscando caracterizaciones analíticas y proponiendo nuevas herramientas de visualización de sus principales características.
Mixta
5 horas semanales
Instituto de Estadística , Coordinador o Responsable
Equipo:
Ignacio ALVAREZ CASTRO
-
Modelos jerárquicos en altas dimensiones (08/2017 - a la fecha
)
Uno de los problemas que ha orientado la investigación en estadística en las últimas décadas se conoce como problemas de tipo p >> n, donde p representa los parámetros de interés y n la cantidad de datos disponibles.
Enfocándose en problemas de ciencias sociales, Abadie and Kasy (2017) presentan algunos ejemplos donde es necesario aplicar modelos con gran cantidad de parámetros. Por ejemplo, si la variable de tratamiento tiene muchos niveles como el efecto de un profesor o de un barrio. Adicionalmente, situaciones en que los datos tienen estructura jerárquica, con muchos subgrupos o estudios longitudinales donde hay varias observaciones de un mismo individuo. También en modelos de predicción macroeconómica donde se incluyen gran cantidad de regresores. Fuera de las ciencias sociales, en el análisis de datos de expresión genética es comun estimar el efecto de algún tratamiento sobre la expresión de cada gen y se cuenta con la expresión de miles de genes para unos pocos individuos. Enfoques Bayesiano empíricos han sido aplicados con mucho éxito en este contexto, modelando datos de experimentos de microarray y también para expresión RNA-seq (Efron 2010).
En este contexto los métodos de inferencia estadística tradicional no generan buenos resultados o directamente no son aplicables. Uno de los ejemplos con mayor impacto es lo que se conoce
ind 2
como el Problema James-Stein. Supongamos que Xij ? N(?j,? ) con i = 1,...,n y
j = 1, . . . , p, con ?2 conocida. Durante mediados del siglo pasado, varios trabajos mostraron que las soluciones frecuencistas para hacer inferencia sobre ?j son inapropiadas (ver Ghosh, Delampady, and Samanta (2006), cap 9).
Una forma de atacar la modelización estadística en este contexto es utilizar modelos jerárquicos, porque permiten reducir sustancialmente la cantidad de parámetros independientes, y al mismo tiempo, mantener la flexibilidad necesaria para realizar inferencia de cada parámetro de interés. En particular para el Problema James-Stein, Lindley (1962) utiliza una distribución previa ?j ? N(?,?2) cuyos parámetros son estimados. Utilizar una estimación de la distribución previa se conoce como enfoque Bayesiano-empírico.
Mixta
5 horas semanales
Instituto de Estadística , Coordinador o Responsable
Equipo:
Ignacio ALVAREZ CASTRO
-
Indicadores adelantados de la actividad económica (06/2008 - 08/2011 )
El objetivo del proyecto es combinar la información macroeconómica de frecuencia trimestral y mensual mediante técnicas de Machine Learning. Parte de mi carga horaria en IESTA esta dedicada a ttrabajar en la confección de un indicador que permita adelantar la evolución del Producto Interno Bruto agregado para Uruguay. Actualmente este tipo de indicadores no es muy utilizado en el pais ya que existe un úncio ejemplo del cual no es pública su metodología.
5 horas semanales
, Integrante del equipo
Equipo:
DA SILVA,N.
, CASTRILLEJO, A.
Palabras clave:
Machine Learning
Indicadores adelantado, random forest
Areas de conocimiento:
Ciencias Sociales / Economía y Negocios /
Economía, Econometría /
Indicadores Adelantados
-
Psicometría (07/2008 - 08/2011 )
En conjunto con un equipo de la facultad de psicología he trabajado desde IESTA en varios proyectos que involucran herramientas estadísticas aplicadas a problemas psicológicos.
Durante 2008 se realizó la baremación del test de inteligencia para niños WISC III. En el año 2009 se realizó el procesamiento de los datos y la edición de la publicación financiada por CSIC. En el año 2010 el estudio se concentra en analizar los resultados obtenidos por los escolares uruguayos.
10 horas semanales
, Integrante del equipo
Equipo:
ÁLVAREZ, R
Palabras clave:
Psicometría
Areas de conocimiento:
Ciencias Naturales y Exactas / Matemáticas /
Estadística y Probabilidad /
Psicometría
Ciencias Sociales / Psicología /
Psicología especial /
Area Diagnóstico
-
Estimación del Ciclo de la economía Uruguaya (03/2007 - 03/2009 )
El objetivo es evaluar los distintas técnicas estadísticas para estimar el componente cíclico del producto agregado. En una primera instancia se se estudiaron las propiedades de los métodos de descompocición de series temporales, luego se desarrollaron medidas que permitan evaluar la señal cícilica estimada independientemente de su método de estimación. Más recientemente hemos trabajado para la confección de intervalos de confianza para los ciclos estimados.
15 horas semanales
, Integrante del equipo
Equipo:
DA SILVA,N.
, RODRIGUEZ,S
Palabras clave:
Ciclo del PIB
Areas de conocimiento:
Ciencias Sociales / Economía y Negocios /
Economía, Econometría /
Series temporales macroeconómicas