Story Transcript
Test de Kolmogorov-Smirnov Georgina Flesia FaMAF
2 de junio, 2011
Test de Kolmogorov-Smirnov
El test chi-cuadrado en el caso continuo I
H0 : Las v.a. Y1 , Y2 , . . . , Yn tienen distribución continua F .
I
Particionar el rango de Y = Yj en k intervalos distintos: [y0 , y1 ), [y1 , y2 ), . . . , [yk −1 , yk ),
I
Considerar las n v.a. discretizadas Y1d , Y2d , . . . , Ynd dadas por Yjd = i
I
I
si Yi ∈ [yj−1 , yj ).
La hipótesis nula es entonces H0 ) P(Yjd = i) = F (yi ) − F (yi−1 ),
i = 1, . . . , k .
Proceder ahora como en el caso discreto.
Test de Kolmogorov Smirnov I
Inconveniente: No es sencillo construir los intervalos a partir de las probabilidades.
I
Se pierde información al agrupar los datos en intervalos.
I
Aconsejable: Utilizar el test de Kolmogorov-Smirnov.
Test de Kolmogorov Smirnov I
Compara las funciones de distribución empírica de la muestra y la que se desea contrastar.
I
Es aplicable a distribuciones continuas.
I
Para distribuciones discretas, los valores críticos no están tabulados. Para distribuciones continuas, los valores críticos están tabulados para:
I
I I
distribuciones con parámetros especificados, algunas distribuciones con parámetros no especificados (normal, Weibull, gamma, exponencial).
Aplicación del test K-S
I
Observar Y1 , Y2 , . . . , Yn y considerar la distribución empírica Fe (x) =
#{i | Yi ≤ x} . n
I
Fe (x): proporción de valores observados menores o iguales a x.
I
Hipótesis nula: Fe (x) es “cercana” a F (x).
I
Estadístico de Kolmogorov-Smirnov D ≡ max |Fe (x) − F (x)| , x
−∞ < x < ∞.
Implementación I
Ordenar los datos observados Y1 = y1 , Y2 = y2 , . . . , Yn = yn en orden creciente: y(j) = j − ésimo valor más pequeño y(1) < y(2) < · · · < y(n) .
I
Por ejemplo: y1 = 3, y2 = 5, y3 = 1 y n = 3, entonces y(1) = 1, y(2) = 3, y(3) = 5. 0 1 n ... Distribución empírica ⇒ Fe (x) = j n .. . 1
x < y(1) y(1) ≤ x < y(2) y(j) ≤ x < y(j+1) y(n) ≤ x
Gráficamente 1
F (x)
y(1)
y(2)
y(3)
y(4)
y(5)
Estadístico de Kolmogorov-Smirnov D≡
sup −∞