Story Transcript
Regresión Cuantílica o “Quantile Regression”
A. Cameron and P. Trivedi, (2005), Macroeconometrics, Methods and Applications, Cambridge University Press. R. Koenker, (2005), Quantile Regression, Econometric Society Monographs C. M. Kuan, (2004), An Introduction to Quantile Regression, Institute of Economics, Academia Sinica, Taiwan. www.sinica.edu.tw/as/ssrc/ckuan
Introducción En general , en estudios empíricos se está interesado en analizar el comportamiento de una variable dependiente dada la información contenida en un conjunto de regresores o variables explicatorias.
Un enfoque estándar es especificar un modelo de regresión lineal y estimar sus parámetros no conocidos mediante el método OLS o el método LAD. •El método OLS estima los parámetros minimizando la suma de los errores al cuadrado y lleva a una aproximación de la función media de la distribución condicional de la variable dependiente. •El método LAD minimiza la suma de los errores absolutos y conduce a una aproximación de la función de la mediana Condicional.
Aunque la media y la mediana son dos medidas de localización importantes que representan el comportamiento promedio o la tendencia central de una distribución, cuentan muy poco acerca del comportamiento en las colas de la distribución. 2
El solo análisis de los comportamientos de la media o de la mediana condicional no darán el panorama completo del verdadero comportamiento subyacente de la distribución Ejemplo:
3
¿Qué sucede si no solo se está interesado en la media?
4
Un nuevo punto en el análisis de regresión es el enfoque de regresión por cuantiles propuesta por Koenker y Bassett (1978)
•Este enfoque permite estimar distintas funciones cuantílicas de la distribución condicional, entre ellas la función mediana como caso especial. •Cada función cuantílica caracteriza un punto particular de la distribución condicional.
Así, combinando diferentes regresiones cuantílicas se tiene una descripción más completa de la distribución condicional subyacente Análisis particularmente útil cuando la distribución condicional no presenta la forma estándar: -asimetría -colas más gruesas -truncamientos
5
Algunas ventajas y desventajas
Algunas ventajas: •Robustez de los resultados frente a valores atípicos de la variable regresada •Eficiencia para un conjunto amplio de distribuciones del error
Algunas desventajas: •Alto grado de trabajo computacional •En contraste con OLS la función objetivo es no diferenciable en el origen y por consiguiente no puede darse una solución cerrada •No se cuenta aún con un buen desarrollo de la teoría asintótica •Un agran cantidad de autores están trabajando en este punto
6
Función cuantílica Para cualquier τ ∈ (0,1) y para cualquier variable aleatoria Y (contínua o discreta): El
τ − ésimo
cuantil de Y puede definirse como:
ξτ ∈ ℜ P(Y < ξτ ) ≤ τ ≤ P(Y ≤ ξτ )
τ
ξτ
ξτ
Al menos τ por ciento de la masa de la probabilidad de Y es menor o igual a ξτ y por lo menos (1 − τ ) porciento de la masa de probabilidad de Y es mas alto que ξτ 7 http://www.stat.wvu.edu/SRS/Modules/Normal/normal.html
Tal probabilidad: •Siempre existe •Es única siempre la variable aleatoria Y sea una variable contínua •La igualdad siempre se alcanza al ser la variable aleatoria contínua
Algunas distribuciones y algunas funciones cuantílicas
8
Si Y es una variable aleatoria se define: CDF QF
P(Y ≤ y ) = FY ( y )
Función contínua a la derecha
QY (τ ) = FY−1 ( y ) = inf {y FY ( y ) ≥ τ }
Función contínua a la izquierda
F Q
Q
τ ∈ (0,1) → ℜ
F Inverso de la de acumulación
ℜ → (0,1) 9
Para cualquier τ no condicional
∈ (0,1) , QY (τ ) nos proporciona el τ − ésimo cuantil de
Y
Algunas propiedades interesantes: • Creciente monotónica • g función continua a la izquierda
∀τ ∈ (0,1) P(Y ≤ QY (τ )) = P(g (Y ) ≤ g (QY (τ ))) = τ
•Para una variable aleatoria continua Y , se define la función de densidad de de probabilidad (PDF):
dFY ( y ) dy •De forma similar, para la función cuantílica se tiene: fY ( y ) =
SY (τ ) =
dQY (τ ) dτ
Función de densidad cuantílica
10
Algunas fórmulas adicionales
(
)
dFY FY−1 (τ ) dFY−1 (τ ) −1 = f Y FY (τ ) =1 dτ dτ
(
)
dFY−1 (τ ) 1 = dτ f Y FY−1 (τ )
(
)
dQY (τ ) 1 = dτ f Y FY−1 (τ )
(
)
Recíproco de la función de densidad evaluado en el cuantil de interés
SY (τ ) =
1 f Y FY−1 (τ )
(
)
11
Cuantiles empíricos Sea y1 , y 2 ,L, y n una muestra aleatoria su función de distribución empírica está definida por la razón entre el numero de observaciones menores o iguales al valor de interés y el número total de observaciones:
# ( yi ≤ y ) FˆY ( y ) = n De igual manera, se puede definir la función cuantílica empírica como:
# ( yi ≤ y ) −1 ˆ ˆ ≥ τ ,0 < τ < 1 QY (τ ) = FY ( y ) = inf y n Con el propósito de obtener el cuantil deseado: •Ordenar la muestra •Revisar en que observación se alcanza el umbral •Método para el cálculo de los cuantiles
ˆ QY (τ ) = arg min ∑τ yi − ξτ + ∑ (1 − τ ) yi − ξτ ξτ ∈ℜ i∈{i y ≥ξ i∈{i y i