Story Transcript
Test de Kolmogorov Smirnov
Técnicas de validación estadística Bondad de ajuste Kolmogorov-Smirnov
◮
Inconveniente: No es sencillo construir los intervalos a partir de las probabilidades.
◮
Se pierde información al agrupar los datos en intervalos.
◮
Aconsejable: Utilizar el test de Kolmogorov-Smirnov.
Test de Kolmogorov Smirnov ◮
Patricia Kisbye
◮ ◮
FaMAF
29 de mayo, 2008
◮
Compara las funciones de distribución empírica de la muestra y la que se desea contrastar. Es aplicable a distribuciones continuas. Para distribuciones discretas, los valores críticos no están tabulados. Para distribuciones continuas, los valores críticos están tabulados para: ◮ ◮
Test de Kolmogorov-Smirnov
distribuciones con parámetros especificados, algunas distribuciones con parámetros no especificados (normal, Weibull, gamma, exponencial).
Aplicación del test K-S
El test chi-cuadrado en el caso continuo ◮
H0 : Las v.a. Y1 , Y2 , . . . , Yn tienen distribución continua F .
◮
Particionar el rango de Y = Yj en k intervalos distintos:
◮
Observar Y1 , Y2 , . . . , Yn y considerar la distribución empírica Fe (x) =
[y0 , y1 ), [y1 , y2 ), . . . , [yk −1 , yk ), ◮
Considerar las n v.a. discretizadas Y1d , Y2d , . . . , Ynd dadas por Yjd = i
◮
◮
si Yi ∈ [yj−1 , yj ).
La hipótesis nula es entonces H0 ) P(Yjd = i) = F (yi ) − F (yi−1 ),
i = 1, . . . , k .
Proceder ahora como en el caso discreto.
#{i | Yi ≤ x} . n
◮
Fe (x): proporción de valores observados menores o iguales a x.
◮
Hipótesis nula: Fe (x) es “cercana” a F (x).
◮
Estadístico de Kolmogorov-Smirnov D ≡ max |Fe (x) − F (x)| , x
−∞ < x < ∞.
Implementación ◮
Estadístico de Kolmogorov-Smirnov
Ordenar los datos observados Y1 = y1 , Y2 = y2 , . . . , Yn = yn en orden creciente: D≡
y(j) = j − ésimo valor más pequeño y(1) < y(2) < · · · < y(n) . ◮
◮
Por ejemplo: y1 = 3, y2 = 5, y3 = 1 y n = 3, entonces
sup −∞