Story Transcript
ESTADISTtCA ESPAÑOLA Vol. 34, Núm. 130, 1992, págs. 247 a 260
Una paradoja en el test de bondad de ajuste ALDO J. VIOLLAZ y ELENA BRU DE LABANDA Instituto de Matemática Facultad de Ciencias Exactas y Tecnología Universidad Nacional de Tucumán Consejo Nacional de Investigaciones Científicas y Técnicas
RESUMEN Sea el problema de bondad de ajuste correspondiente a la hipótesis nula Ho: F(x)=Fo[(x-µ)lcs], donde Fo es una función dada y µ y a son parámetros indeterminados. Si µ y cr son conocidos se tienen dos opciones: 1) usar tests de bondad de ajuste correspondientes a una hipótesis nula simple, y 2) usar tests de bondaci de ajuste correspondientes a una hipótesis nula compuesta donde los parámetros son estimados en base a las observaciones. En este trabajo mostrarnos que, contrariamente a lo que sería de esperar, para los clásicos tests de bondad de ajuste de Cramer-von Mises, Kolmogoroff, Anderson-Darling, Kuiper y Watson, aplicados para docimar normalidad, con la segunda opción se obtienen procedimientos mós potentes que con la primera, siendo la diferencia de potencias realmente importante. Palabras clave: Test de bondad de ajuste, paradoja, modelos de posición y escala, potencia. Clasificación AMS: 62G 10.
F^^r.^ui^ric .^ r ^r:^w^ ^ i..^
1.
INTRODUCCION
Sean X,, X2, ..., Xn observaciones independientes de una variable aleatoria con media µ y varianza a2 conocidas. Supongamos que deseamos docimar la bondad del ajuste de estos datos a una distribución normal. Puesto que la media y la varianza de la distribución se suponen conocidas, el estadístico probablemente se preguntará: ^debo usar un test de bondad de ajuste para una hipbtesis nula simple (parámetros conocidos) o debo usar un test de bondad de ajuste correspondiente a una hipótesis compuesta (donde los parámetros son desconocidos y deben ser estimados)? La respuesta debería ser: usar un test correspondiente a una hipótesis nula simple, a fin de sacar ventaja de la información extra debido al hecho de que se conocen los parámetros de la distribución. Sin embargo, ésta es la elección equivocada, corno lo mostraron Stephens (1974) y Dyer (1974) calculando la potencia para un conjunto de alternativas por el método Monte Carlo. En este trabajo se proporciona una explicación a esta aparente paradoja. EI trabajo está organizado como sigue: en la Sección 2 se presentan los tests estudiados, se explican las simulaciones realizadas y se presentan los resultados de estas simulaciones. En la Sección 3 se realiza un análisis de los resultados de las sirnulaciones. ^a Sección 4 proporciona una explicación de la aparente paradoja implicada por los resultados de las Secciones 2 y 3. La Seccián 5 contiene comentarios y las conclusiones de este estudio.
2.
TESTS ESTUDIADOS Y SIMULACIONES
Sean X^, X2, ..., X„ observaciones independientes de una variable aleatoria y consideremos el problema de bondad de ajuste definido por las hipótesis nula Hp y alternativa H^ siguientes: Ho: X^, X2, ..., X son i.i.d. con distribución normal; H^: X^, X2, ..., Xn son i.i.d. con distribución distinta de la normal. Supongamos que se tiene la información adicional que consiste en que la rnedia µ y la varianza a2 de las variables X^ son conocidas bajo la hipótesis al#ernativa, y que se está considerando la posibilidad de emplear alguno de los clásicos tests de bondad de ajuste para contrastar la bondad de ajuste de los datos a la hipátesis Ho. En esta situación tenemos dos posiblidades: 1) calcular los tests de bondad de ajuste correspondientes a una hipótesis compuesta, ignorando la informa-
UNA PARAI)(1JA h:N F.L Th:ST t)E F3ONUAI) Uf^ ,^^.Jl'ti I f^
?49
ción adicional disponible, y 2) calcular los tests de bondad de ajuste correspondientes a una hipótesis nula simple que especifica que las variables X^ son independientes con distribución normal de media µ y varianza a^ conocidas. En este trabajo estudiarnos la potencia de los tests de bondad de ajuste: W2 de Crarner-von Mises, A2 de Anderson-Darling, © de Kolmogoroff, U2 de Watson y K de Kuiper, para cada una de estas dos posibilidades. Utilizando el subíndice s para indicar que se trata de un test correspondiente a una hipátesis sirnple (parámetros conocidos) y el subí ndice c cuando el test corresponde a una hipótesis compuesta (donde los parámetros son estimados), los tests mencionados están definidos por:
W^ =n [F„(x)-^t(x-µ)l6)]2d ^((x-µ)l6)
[^ ]
d^((x-µ)/6)
A ^ =n [ Fn(x)-^((x-µ)la)] 2
[2]
c^( (x--µ)/a) ( ^ -^( ( X-µ )/a) DS=^]ñ SUP I F„(x)-^((x-µ)16)^
U^ =n^ { F^ (x)-d> ( x-µ \
6
K S =Jn ^ su p [ F„ ^x)-^D
[3] x-µ
^ J ^ F^ ^Y)-^ \
\ X6µ 1J
+su p
aµ ^^ d^ ^ yaµ ^ J d
^^ \ X6µ / -F" ^X) ^ ^
[4]
^
[5]
donde Fn es la función de distribución empírica correspondiente a la muestra X^, X2, ..., X^, ^ denota la función de distribucíón de una variable aleatoria normal estándar y µ y 6^ son la media y la varianza de las variables X, las que se suponen conocidas. Los tests W^2, A^ , D^, U^ y K^ se definen por las expresiones correspondientes en las cuales se reemplazan los parámetros por los estimadores µ=X=n-'FX; y c^2=n-'^(X;-X)2. Los subíndices s de simple y c de compuesto que hemos usado para distinguir los tests no deben hacernos perder de vista que la hipótesis nula a docimar es siempre la misma, se conozcan o no los parámetros. Lo que cambia no es la hipótesis, sino el procedimiento que usamos para docimarla. Coma hipátesis alternativas, nosotros consideramos varias familias de posición y escala, Ilamadas tipos de leyes por Loéve ( 1963), p. 202. Por definición, el tipo generado por una función de distribución F está constituido por las
t^s^rA[^ttit^ic^^ H:s^A!v^^i_,^
? ti O
funciones de distribución de todas las variables aleatorias X, tales que aX+b tiene función de distribución F para afgún b y algún a^0. Se calcularon empíricamente por simulación Monte Carlo las potencias de !os tests, para tamaños muestrales n=20, 40 y 100, y niveles de significación a=0,05, 0,10 y 0,15 para las hipótesis alternativas consistentes en los tipos de leyes generados por las siguientes distribuciones: Ji-Cuadrado con 1 y 4 grados de libertad, t de Student con 4 grados de libertad, Uniforme, Beta (2, 2), Beta (1 / 2, 1) y Beta ( 1 /2, 1/2). Como las hipótesis Ho y H1 son invariantes por cambios de posición y de escala aplicados a las variables X^, sin pérdida de generalidad a los efectos de la simulación Monte Carlo, se han seleccionado de cada uno de los tipos aquellas distribuciones con media cero y varianza unidad.
Tabla 1 VALURES CRITICOS ASlNTOTICOS xS y xr Nivel a
1%
2, 5%
5%
10%
15%
xS x^ xs/x^
0.743 0.178 4.174
0.581 0.148 3.926
0.461 0.126 3.659
0.347 0.104 3.337
0.284 0.091 3.120
xs x^
3.857 1.029
3.070 0.870
2.492 0.751
1.933 O.fi32
1.610 0.560
xS/x^
3.748
3.529
3.318
3.059
2.875
xs x^
1.608 1.049
1.464 0.961
1.347 0.894
1.200 0.819
1.120 0.772
xs/x^
2.350
2.320
2.270
2.147
2.105
U 2*
xs x^ xs/x^
0.267 0.163 1.638
0.221 0.136 1.625
0.187 0.116 1.612
0.152 0.096 1.583
0.131 0.085 1.541
K#
xs x^ xS/x^
1.951 1.678 1.352
1.865 1.573 1.406
1.715 1.477 1.348
1.581 1.374 1.324
1.502 1.305 1.325
W 2*
T A 2*
E D*
S
T
(*)
De tablas de Stephens {1976).
#
Simulados para n=100.
11N^ PARA(_)t)JA FN FL TE^T UF^^: t3ON[^)AU Uf^. AJl!S-f^l^
?5I
Los valores críticos para los tests Vh, A2 y lJ^ fueron obtenidos de las tablas publicadas por Stephens (1976), y los de los tests D y K fueron simulados por Monte Carlo para tamaños muestrales n=20, 40, 100 en base a 10.000 replicaciones. Estos valores críticos se dan en la tabla 1. Las potencias fueron calculadas en base a 1.000 replicaciones. En la generación de números aleatorios se usaron las siguientes subrutinas del IMSL {1980): GGNML para la distribución normal, GGCHS para la distribución Ji-Cuadrado, GGNML y GGGHS para la distribución t de Student, GGUBS para la distribución uniforme y GGBTR para la distribución Beta. Las tablas 2-4 dan las potencias de los cinco tests para las siete alternativas y sus correspondientes niveles de significación empíricos, para tamaños muestrales n=20, 40 y 100 y niveles de significación a=0.05, 0.10 y 0.15.
3.
ANALISIS DE LOS RESULTADOS
Si bien las tablas 2-4 contienen toda la información del estudio realizado sobre la potencia de los cinco pares de tests frente a las siete alternativas seleccionadas, esta información tiene una forma no apropiada para extraer de ella conclusiones sobre la eficiencia relativa de los tests. Para poder realizar este tipo de comparaciones es conveniente calcular la eficiencia de los tests definida por Cochran (1952) como el tamaño muestral necesario para obtener una potencia igual a 1/2. Con los datos de las tablas 2-4 se calcularon estas eficiencias para las alternativas Ji-Cuadrado con cuatro grados de libertad y nivel de significación a=0.05 y t de Student con cuatro grados de libertad y Uniforme y nivel de significación a=0.15, los que se presentan en la tabla 5. EI cálculo se realizó mediante interpolación cuadrática basada en IQs tres puntos determinados por las potencias para tamaños muestrales 20, 40 y 100. Se necesitarían valores de la potencia para otros valores de n, con el fin de poder emplear este método de interpolación, si se quisiera calcular las eficiencias en el sentido de Cochran para otras alternativas y otros niveles. Sin embargo, se puede mostrar empíricarnente que la eficiencia relativa de dos tests cualesquiera es más o menos independiente del nivel, de modo que es suficiente calcular las eficiencias relativas para un cierto nivel.
I^^f Al)Iti1l('A l;.ti('AN( ^ I A
Tabla 2 POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.05 n
Alternativa
T
E S
T
100
40
20
Norm. Beta Beta Beta Norm. Beta Beta Beta Norm. Beta Beta Beta (0^ 1) (2^ 2) ('72 .1) i'72 .'7^1 (0,1) (2, 2) ('72 ,1) i7? ^'7^1 (0^ 1) (2^ 2) ('^z .1) ('^2 ^'^^1 .71 1.00
.68 1.00
.041 .052
.071 .11
.27 .92
.24 .91
.050 .041
.088 .26
.16
.043
.083
.34
.33
.053
.11
.91
.87
.62
.047
.12
.96
.96
.041
.35
1.00
1.00
W^ W^
.037 .046
.067 .060
.14 .61
.14 .54
A ^
.033
.071
.16
A^
.038
.070
.67
DS
.038
.071
.16
.16
.043
.064
.29
.29
.047
.10
.66
.68
D^
.042
.038
.40
.30
.051
.071
.78
.66
.038
.16
1.00
1.00
U^ U^
.040 .053
.087 .083
.37 .61
.33 .57
.049 .058
.11 .13
.65 .92
.65 .93
.039 .051
.21 .30
.98 1.00
.97 1.00
KS K^
.034 .030
.062 .050
.36 .50
.30 .43
.046 .030
.071 .097
.72 .90
.64 .84
.037 .048
.17 .25
.99 1.00
.98 1.00
Tabla 2 (continuación) POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.05 n Alternativa
x2^^^
x2^^^
100
40
20 t^4^
U
x2^^^
x2^4^
t^4^
U
x2^^^
x2^4)
t^4^
U
W^
.37
.10
. 030
.068
. 78
.18
.050
.095
1.00
.46
.14
.20
W^
.96
. 41
.17
.16
1.00
.75
. 31
.35
1.00
.99
.58
.85
T A ^
.47
.099
. 043
.071
. 92
.21
.063
.099
1.00
.63
.20
.28
E
A^
.97
. 45
.18
.18
1.00
.82
.34
. 45
1.00
1.00
.65
.96
DS
.35
.12
. 045
.080
1.00
.22
.070
.12
1.00
.43
.18
.25
S
D^
.88
. 32
.13
.12
1.00
.57
.24
.20
1.00
.95
.45
.58
U ^
.83
.22
. 12
.15
.99
. 45
.23
.24
1.00
.85
.53
.57
U^
.94
. 36
.16
.19
1.00
.67
. 30
.38
1.00
.97
.60
.88
Ks
.90
.22
. 12
.14
1.00
. 47
.23
. 25
1.00
.90
.51
.56
K^
.95
. 34
.14
.18
1.00
.63
. 27
.35
1.00
.98
.53
.79
T
(INA PARADOJA EN f^^L Tt^tiT C^)t^ Bl)N[.)A[) Ut^ AJtlti"(^t^
Tabla 3 POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.10 n
20
A/temativa
40
Norm. Beta Bsta Beta Norm. Beta Beta Beta Norm. Beta Beta Beta (Or ^) (2^ 2) ('72 . ^) i72 .'7^1 (0,1) (2. 2) ('72 . ^) ('72 ^'7^1 (0> >) (2^ 2) ('72 ^ ^) ('7^ .'^,^
T
W^ W^
.078 .10
A ^
.070
.13
.27
E
A^
.10
.14
.79
S
Ds D^
.069 .093
.13 .089
.27 .56
T
100
.13 .13
.24 .73
.24 .67
.092 .087
.13 .20
.42 ,96
.42 .96
.28
.083
.13
.53
.52
.10
.20
.98
.95
.76
.096
.21
.99
.98
.084
.50
1.00
1.00
.28 1.00
.095 .092
.13 .14
.43 .88
.48 .81
.096 .10
.19 .27
1.00 1.00
.84 .45
.10 .093
.19 .41
.88 1.00
.86 1.00
U^
.097
.16
.50
.48
.094
.19
.77
.76
.080
.33
1.00
.99
U^
.10
.16
.73
.70
.092
.22
.96
.96
.10
.45
1.00
1.00
K^ K^
.080 .079
.12 .10
.48 .63
.44 .59
.099 .083
.14 .18
.81 .95
.75 .92
.094 .10
.28 .39
1.00 1.00
1.00 1.00
Tabla 3 (continuación) POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.10 n
20
A/ternativa
40
x2^^^
x2^4^
t^4)
W^
.54
.18
. 096
.14
W^
.98
.53
.25
. 28
U
x2^^^
100
x2 ^ 4^
t ^4^
. 92
.29
. 12
.18
1.00
. 85
.40
. 50
U
%(2 ^ 4 )
t (4)
1.00
.60
.31
.36
1.00
1.00
.69
^ .93
x2
{ ^^
U
T
E
A ^
.66
.21
.10
.15
.99
. 37
.14
. 21
1.00
.84
.38
.46
A^
.99
. 59
.27
. 32
1.00
. 90
.43
.59
1.00
1.00
.72
.99
DS
.47
.21
.10
.15
1. 00
. 31
.14
. 21
1.00
.57
. 36
. 39
S
D^
.93
. 43
. 21
. 21
1.00
. 71
. 34
. 35
1.00
.98
.57
. 76
U ^
.91
.33
. 21
.23
1.00
. 56
.35
. 34
1.00
.92
.67
.68
T
U^
.97
. 50
.23
. 30
1.00
. 77
.39
. 54
1.00
.99
.69
.94
KS
.95
.35
. 19
.23
1.00
. 59
.34
. 36
1.00
.95
.63
.69
K^
.97
. 45
.21
. 30
1.00
. 74
.36
. 48
1.00
. 99
.64
.90
1^^;TAU1^+"i^l('A ^^.SF'AÑ(1LA
Tabla 4 POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.15 n
20 Norm. Beta
Altematíva
T
E S
T
(0^ 1)
40
Beta
Beta Norm. Beta
100
Beta
Beta Norm. Beta
(2^ 2^ ('^2 ^ 1) if^ ,'f^1 (0^ i)
(2^ 2) ('72 ^ 1) ('^2 ^ '^^1 (0.1)
Beta
Beta
(2^ 2) ('^2 ,1) ('^^ ^ '^^
W^
.13
.19
.36
.33
.14
.20
.56
.56
.15
.26
.95
.93
W^
.16
.18
.80
.75
.14
.27
.98
.97
.15
.51
1.00
1.00
A ^
.13
.19
.39
.38
.14
.20
.66
.65
.15
.30
1.00
.98
A^
.16
.21
.85
.83
.14
.30
.99
1.00
.15
.60
1.00
1.00
DS
.11
.17
.35
.36
.14
.17
.51
.58
.15
.26
1.00
.90
D^
.13
.16
.65
.55
.14
.21
.92
.89
.15
.38
1.00
1.00
U^ U^
.14 .16
.21 .22
.60 .79
.56 .77
.14 .14
.26 .29
.83 .97
.82 .98
.13 .15
.43 .54
1.00 1.00
.99 1.00
KS
.12
.17
.56
.53
.13
.20
.87
.81
.14
.35
1.00
1.00
K^
.12
.16
.73
.69
.14
.26
.97
.96
.14
.49
1.00
1.00
Tabla 4 (continuación) POTENCIA DE LOS TESTS W 2, A 2, D, U 2 Y K CON NIVEL DE SIGNIFICACION 0.15 n
20
Alternatíva
40
100
x2^,^
xz^4^
t^4j
U
x2^,^
x2^4^
t^4^
U
x2^,^
x2r4^
t^4^
U
.67 .99
.25 . 62
. 15 .31
.22 . 36
. 97 1.00
.38 .90
.21 .47
.26 .59
1.00 1.00
.71 1.00
.44 .74
.49 .96
A ^
.80
.30
. 18
.22
1.00
.48
. 24
.30
1.00
.93
.52
.58
A^
.99
. 67
.33
. 40
1.00
. 93
.49
.70
1.00
1.00
.78
1.00
W^ W^ T
E S
T
DS
.58
.26
. 16
.22
1.00
.37
.22
.29
1.00
.67
.47
.49
D^
.97
.53
.24
.30
1.00
. 78
.43
.48
1.00
.99
.65
.85
U ^
.94
.43
. 27
.30
1.00
. 65
.43
.43
1.00
.95
.76
.75
U^
.98
. 57
.30
. 39
1.00
.82
.47
.62
1.00
.99
.75
. 96
KS
.98
.43
. 26
.28
1.00
.69
.40
.45
1.00
.96
.71
.76
K^
.99
. 51
.27
.37
1.00
.83
. 43
.58
1.00
1.00
.70
.94
UN.A f'AKAt)OJA E^N Fl. TE-:ST [}f^; 8ONUA[) [)i- :1.i('tiTE^
^SS
Tabla 5 TAMAÑOS DE MUESTRAS NECESARIOS PARA OBTENER UNA POTENCIA IGUAL A 1 /2 Alternativa Nive/ a ns n^ n^/n^
W2
ns
T A2
x2^,^^
t^,^^
U
x?^^^
. 05
.15
.15
.05
110 24 4.6
110 45 2.4
1q1 22 4.6
22 8 2.7
82
97
85
20
n^ n^n^
22 3.7
41 2.4
25 3.4
8 2.5
n^
120
107
101
30
n^
35
58
50
10
ns/n^
3.4
1.8
2.0
3
ns n^ ns/n^
46 26 1.8
50 45 1.1
49 29 1.7
9 8 1.1
ns n^
45 33
60 57
52 36
10 9
1.4
1.1
E D S
T
U2
K
ns/nC
1.4
1.1
Tabla 6 ORDEN DE MERITO SEGUN EL TAMAÑO DE MUESTRA NECESARIO PARA OBTENER UNA POTENCIA IGUAL A 1/2
A/ternativa
Parámetros conocidos
Parámetros estimados
x2 ^,^
U2 KA2 W2 D
AZ W2 U2 K D
x2 ^4}
U2 KA2 W2 D
A2 W2 U2 K D
t^a^
U2 KA2 D W2
A2 Wz U2D K
U
U2 KA2 W2D
W2 A2 U2KD
' ^(^
t,^^^r^ni^i^;^r^i