Story Transcript
ESTADISTICA ESPAÑOLA Vol. 36, Núm. 136, 1994, págs. 183 a 203
Comportamiento del test de los signos y del test de la mediana para una muestra frente a cambios en el modelo por ALFONSO GARCIA PEREZ Departamento de Estadística e I. O. Facultad de Ciencias, UNED
RESUMEN EI test de los signos y el test basado en la mediana muestral tienen un comportamiento asintótico equivalente; ésto implica que también sean equivalentes desde el punto de vista de la robustez, al tener éstas un carácter asintótico.
EI presente trabajo demuestra, sin embargo, que cuando los tarnaños muestrales son pequeños el comportarniento de la función de potencia de ambos tests, ante cambios en la distribución modelo, puede ser notablemente diferente. Este hecho justifica la definición de una nueva medida de robustez en test de hipótesis con la cual el test de la mediana para una muestra es más robusto que el test de !os signos.
Pa/abras clave: robustez, tamaño muestral finito, contraste de hipótesis. Clasificación AMS: 62F04, 62F35, 62G 10.
r^ti r.•^1^^^7 ^c ^A t^.^;r ^ Ahc,^..1
INTRQDUCCION EI lema de Neyman-Pearson para tests maximin entre entornos de medidas de probabilidad dominadas por capacidades alternas de orden dos, debido a Huber (1965) y Huber-Strassen (1973), es el único resultado en robustez para contraste de hipátesis que conduce a una solución de óptimo, en el caso de muestras finitas. De él se han obtenido resultados posteriores tales como Rieder ^ 1977), Bednarski { 1984), Lambert (1985) y Bu ja (1984, 1985, 1986), de gran riqueza matemática pero de aplicación muy limitada. Por esta razón, la mayoría de los trabajos en robustez para contraste de hipótesis abordan el problema desde un punto de vista asintótico, aumentando así sus posibilidades de aplicación. No obstante, tests con el mismo grado de robusted asintótica pueden tener un comportamiento notablemente diferente con muestras de tamaño pequeño. En este artícula ponemos de manifiesto la necesidad de evaluar el comportamiento de los tests de hipótesis en el caso de muestras finitas mediante una nueva medida de robustez, al demostrar que dos tests asintóticamente equivalentes, según por ejemplo de! criterio de Rousseeuw y Ronchetti (1979, 1981) basado en ia curva de influencia de Hampel, pueden tener un comportamiento notablemente diferente en muestras finitas.
2.
PRELIMINARES
Sea X una variable aleatoria con distribución F^ depend'+ente de un parámetro de localización 6 el cual pertenece a un espacio paramétrico O. En el trabaja consideraremos contrastes de la hipótesis nula Ho : 9 eo, aunque los resultados que obtendremos pueden extrapolarse a otro tipo de hipótesis. Supondremos que la distribución de X pertenece a la clase `y= *_{ FH b: F^ b es una función de distribución (a) con densidad f^, b con respecto a la medida de
Lebesgue, (b) una familia de localización en H y de escala en b, estando el parámetro de escala determinado por la condición [1 ] fH b(8) = c, con c una constante conocida, (c) simétrica en e, (d) estrictamente creciente en un entorno de 8, (e) fuertemente unimvdal}. Esta clase incluye como miembros, por ejemplo, a la distribución normal, a la logística, a la doble exponencial, o(como límite) a la distribución uniforme.
En ocasiones exigiremos que la distribución de X pertenezca a una subclase de ^ y^ *, la de las farnilias en ^i de distribuciones de potencia exponencial, introducidas por Box y Tiao (1973, p. 15 r) con densidades,
('( )M!'Oft'! ^IMIF^.N"I'O [)l^l. T'!^ti"T I)F^: l.Oti ^1C;NOS ti' l)f^l. 1"f-.ti"I !)!: t_.1 !^1l^:UTAN ^^ ^
f ^ (x) _
1
Í
,^^ b r^ 1+'+ a^ 2^+__ 2_. 2
1
x -- H
2
b
^ x5
con - 1 g H^ (k^ ), por lo que existirá un entorno (0, d), tal que
F^o(k^ -x) 9'^0 (k^ (a'))
existiendo, en consecuencia, un intervalo a la izquierda de k^ (cx') = k^ - d en el que se seguirá manteniendo la desigualdad
('O !^1POFt"I^,A!^11F^:N"('O I)F:I. TF^:S"1^ l)E^ Ll)ti SI(i^i(')S lr"' UH:I I F:^^I UF L.1 ti1F-.C)I^^!ti;1
^ ^)%
F^o(k^ -x) eo. La función de potencia del test de la mediana, ^i^m (6), es igual a la función de distribución, B, de una beta R((n + 1)/2, (n + 1)/2) en el punto 1 - F^(k^ ) ^3 ^m (8) = f3
1 - F^( k^ ) .
Por el lerna 2, si F_ 1 - G^(k^ ), con lo que por la monotonía de las funciones de distribución se tendrá el resultado.
5.
ROBUSTEZ DEL TEST DE LOS SIGNOS Y DEL TEST DE LA MEDIANA PARA UNA M U ESTRA
Como la mediana muestral M es el estadístico de Hodges-Lehmann asociado al test de los signos, el comportamiento asintótico de dicho test y el basado en M será el mismo cuando los comparemos mediante las medidas habituales de robustez. En concreto, ambos tendrán las rnismas curvas de infiuencia en el sentido definido por Rousseeuw y Ronchetti (1979, 1981): sign(x-9) IF^ (x , S
lF^m (x ; T, F^y) .
2 f (e)
Por tanto, las funciones de influencia, en el sentido de Lambert ( 1981), también coincidirán, ya que la función de influencia del contraste y la de su estadístico de contraste difieren solamente en un factor que depende del funcional aplicado en el modelo, T(F^). (Véase Lambert, 1981, p. 651 y García Pérez, 1993.)
5.1.
Robustez en muestras finitas
Cuando los tamaños muestrales son finitos, la sensibilidad de la función de potencia de ambos tests a cambios en 1a distribución modelo puede diferir nota-
i:ti"fA[)IS°i'I(:'A f^Sf'A^IC)t.A
blemente. Así por ejemplo, para contrastar Ho :^< 0 frente a H^ : 8> 0, con un tamaño muestral n = 5 y un nivel de significación a= 0,1875, la función de potencia del test de los signos en el caso de una distribución uniforme y una doble exponencia! ( líneas discontinuas), parece más sensible que la del test de la mediana ( líneas continuas) bajo ambas distribuciones (figura 4}, las cuales, por las proposicianes 1 y 3, son las distribuciones extremas.
Figura 4 2.5
3.
1
0.8 o.s
0.4
0.2
A continuación definimos una nueva medida de robustez para contraste de hipótesis en muestras finitas, la cual tiene en consideración estas diferencias. Se limita a considerar tests que alcancen potencia 1 con objeto de evitar que entren en comparación contrastes tales como el test trivial ^(x} = oc d x, el cual es insensible a cualquier cambio de distribución, aunque a costa de tener una potencia constantemente iguai a a. Además, como en los dos tests que han sido analizados en este trabajo la mayor sensibilidad se tiene lejos de 90 (por ejemplo, en el caso de ^S la derivada de su función de potencia en 8= eo es independiente del modelo), sólo consideraremos su robustez en valores grandes de fa potencia. Definici©n 2 Sea ^a la clase de los tests ^ de nivel a con función de potencia ^i^ continua, creciente (para e tal que a