Story Transcript
ESTAD´ISTICA I Tema 5: Contraste de hip´ otesis I Planteamiento del problema I Conceptos b´asicos: hip´ otesis nula y alternativa, tipos de errores, nivel de significaci´on, regi´ on cr´ıtica o de rechazo, tama˜ no del test, potencia I Contrastes para la media de una distribuci´ on I Consistencia de tests. Tests insesgados y UMP I p-valor I Contrastes para dos muestras. Distribuci´ on F de Fisher-Snedecor I Lema de Neyman-Pearson. Tests ´ optimos I Construcci´on de tests: test de raz´ on de verosimilitudes, test bayesiano. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
1
Planteamiento del problema. Conceptos b´ asicos El objetivo de la teor´ıa de contraste de hip´ otesis es elegir entre dos posibilidades excluyentes (hip´ otesis nula e hip´ otesis alternativa) relativas al valor de un par´ametro poblacional, a partir de la informaci´on proporcionada por los datos muestrales. Sea X1 , . . . , Xn una muestra aleatoria de una v.a. X con funci´on de distribuci´on Fθ , donde θ ∈ Θ. Objetivo: Dada una partici´ on del espacio param´etrico Θ = Θ0 ∪ Θ1 , deseamos decidir, en base a la muestra obtenida, si θ ∈ Θ0 o si θ ∈ Θ1 . Queremos contrastar H0 : θ ∈ Θ0
(hip´ otesis nula)
H1 : θ ∈ Θ1
(hip´ otesis alternativa)
Un test para contrastar estas dos hip´ otesis consiste en proporcionar una regla de decisi´on que, a cada posible observaci´on de la muestra (x1 , . . . , xn ), le asigne una decisi´ on: aceptar o rechazar H0 . Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
2
Los contrastes habituales (no aleatorizados) se definen mediante una regi´on cr´ıtica o regi´ on de rechazo R ⊂ Rn , de tal manera que, cuando (x1 , . . . , xn ) ∈ R, se rechaza la hip´ otesis nula.
Espacio muestral Decisión Región crítica o de rechazo R (x1,...,xn)
Rechazo H0
TEST
Región de aceptación A (x1,...,xn) Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Acepto H0 Tema 5: Contraste de hip´ otesis
3
Es importante destacar que la metodolog´ıa de contraste de hip´otesis no ”demuestra” la validez de la hip´ otesis que se acepta en cada caso (en el sentido en el que se demuestra algo mediante un m´etodo deductivo, por ejemplo). La manera correcta de interpretar los resultados es decir que “los datos disponibles proporcionan (o no proporcionan) evidencia estad´ıstica suficiente en contra de la hip´ otesis nula”. En todo caso, la conclusi´on depende de informaci´ on incompleta y aleatoria, procedente de una o varias muestras, y siempre existe la posibilidad de cometer un error aceptando una hip´ otesis equivocada. Los procedimientos que se utilizan habitualmente se suelen denominar “contrastes o tests de hip´ otesis”.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
4
Posibles errores de un test: I
Error de tipo I: Rechazar H0 cuando H0 es cierta.
I
Error de tipo II: Aceptar H0 cuando H0 es falsa.
La funci´on de potencia de un test con regi´ on de rechazo R para contrastar H0 : θ ∈ Θ0 frente a H1 : θ ∈ Θ1 es la funci´on βn : Θ −→ [0, 1] θ 7−→ βn (θ) = Pθ {(X1 , . . . , Xn ) ∈ R} Lo que nos gustar´ıa: Potencia = 1
Potencia = 0
Θ0
Θ
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
θ Θ1
Tema 5: Contraste de hip´ otesis
5
Lo que en realidad se suele hacer (teor´ıa de Neyman-Pearson): 1. Acotar la m´ axima probabilidad de error de tipo I. • Se fija un nivel de significaci´ on α ∈ (0, 1). T´ıpicamente α = 0, 05. • Se define el tama˜ no de un test como la m´axima probabilidad de error de tipo I: max Pθ (R) = max βn (θ). θ∈Θ0
θ∈Θ0
• Se busca una regi´ on de rechazo R tal que max Pθ (R) ≤ α. θ∈Θ0
2. Minimizar la probabilidad de error de tipo II. Se intenta buscar una regi´on de rechazo R que maximice la funci´on de potencia cuando θ ∈ Θ1 . Las hip´ otesis H0 y H1 no son sim´ etricas.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
6
Como vemos, los test de hip´ otesis est´an dise˜ nados para controlar la probabilidad m´axima de rechazar H0 cuando es cierta. En consecuencia, suelen ser “conservadores” con la hip´otesis nula: hace falta mucha evidencia muestral para rechazar H0 . Observemos que es posible que, con los mismos datos, H0 se rechace para un nivel de significaci´ on α = 0.05 y se acepte para α = 0.01. En una primera aproximaci´ on, los problemas de contraste de hip´otesis pueden clasificarse en problemas de una muestra (cuando hay una sola poblaci´on de inter´es) y problemas de dos muestras (cuando se quiere comparar dos poblaciones y se dispone de una muestra de cada una de ellas). Presentaremos las ideas b´asicas en el caso de los problemas de una muestra pero pueden extenderse de modo an´alogo a los de dos muestras.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
7
Un ejemplo ilustrativo y sus consecuencias Ejemplo: Se analiza un env´ıo de botellas de aceite envasado con un mecanismo del que se afirma que, en media, rellena las botellas con 100 cl. de aceite. Examinada una muestra de 5 botellas se obtiene que el promedio es 95 cl. y la cuasivarianza es 1.1. Suponemos que la v.a. X = “contenido de aceite (en cl.) en una botella” sigue una distribuci´ on N(µ, σ). ¿Hay suficiente evidencia emp´ırica para afirmar que el contenido medio de las botellas no es 100 cl.? Queremos contrastar H0 : µ = 100, frente a H1 : µ 6= 100. Otra posibilidad ser´ıa preguntarse si existe evidencia emp´ırica suficiente para afirmar que el consumidor recibe, en promedio, menos cantidad de la que indica la etiqueta. En ese caso, el planteamiento correcto ser´ıa contrastar H0 : µ ≥ 100, frente a H1 : µ < 100. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
8
Ejemplo (cont.): Tenemos, por tanto, un problema del tipo: contrastar H0 : µ = µ0 frente a H1 : µ 6= µ0 (siendo µ0 un valor prefijado) a partir de una muestra X1 , . . . , Xn extra´ıda de N(µ, σ). Para ello prefijamos el nivel de significaci´ on del test α ∈ (0, 1) (por ejemplo, α = 0.05) y observamos que, si H0 fuera cierta, ¯ − µ0 X √ ∼ tn−1 . s/ n
(1)
Por otra parte, est´a claro que deber´ıamos sospechar que H0 es falsa (y, por tanto, H1 es cierta) cuando x¯ resulte estar “suficientemente alejada” de µ0 . El resultado (1) nos ayuda a decidir, de un modo racional, que es lo que significa “suficientemente alejada”.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
9
Ejemplo (cont.): En efecto, dada una muestra x1 , . . . , xn , parece muy natural decidir que H0 es falsa cuando tengamos x¯ − µ0 √ > tn−1;α/2 . (2) s/ n ya que, en este caso, tenemos una muestra que ser´ıa “muy rara” si realmente H0 fuera cierta. Obs´ervese que, de todos modos, hay una probabilidad α, prefijada, de cometer un error de tipo I (rechazar H0 siendo cierta). An´alogamente, si el problema hubiera sido contrastar H0 : µ ≥ µ0 frente a H1 : µ < µ0 , un criterio razonable para rechazar H0 con un nivel de significaci´on α ser´ıa x¯ − µ0 √ < −tn−1;α . (3) s/ n
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
10
Ejemplo (cont.): En el ejemplo del envasado de aceite x¯ = 95, s 2 = 1.1, n = 5. Por tanto, x¯ − µ0 √ = 10.66 s/ n y como 10.66 > t4;0.025 = 2.776445, H0 : µ = 100 se rechaza al nivel de significaci´on α = 0.05 y, dado que 10.66 > t4;0.005 = 4.604095, tambi´en se rechaza al nivel 0.01. Sin embargo, supongamos que hubi´eramos obtenido x¯ = 98, s 2 = 1.1, n = 5. Entonces x¯ − µ0 √ = 4.264014 s/ n y la hip´otesis H0 se rechazar´ıa al nivel α = 0.05 pero NO se rechazar´ıa al nivel 0.01. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
11
Ejemplo (cont.): En el ejemplo de las botellas, supongamos que queremos contrastar H0 : µ ≥ 100 frente a H1 : µ < 100. Entonces el criterio para rechazar H0 con un nivel de significaci´on α ser´ıa x¯ − 100 √ < −t4;α . s/ 5 Supongamos que hubi´eramos obtenido x¯ = 98. Entonces x¯ − 100 √ = −4.2640. Como −t4;0.01 = −3.7469, la hip´otesis nula s/ 5 H0 : µ ≥ 100 se rechaza al nivel 0.01 (y tambi´en por supuesto, al nivel 0.05, ya que −t4;0.05 = −2.1318).
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
12
Algunas consecuencias y observaciones: El anterior ejemplo es un s´ olo un caso particular de contraste de hip´otesis, pero nos permite extraer algunas consecuencias y dar algunas definiciones generales sobre la metodolog´ıa del contraste de hip´otesis. I Asimetr´ıa de las hip´ otesis: H0 se acepta a menos que “se haya obtenido suficiente evidencia estad´ıstica en contra de ella”. Por esta raz´on, cuando H0 se acepta no debe pensarse que “se ha demostrado su validez”. H0 representa la hip´ otesis que estamos dispuestos a aceptar a menos que se obtengan fuertes indicios en contra. I Errores de tipo I y II: En todo caso siempre hay una probabilidad positiva de cometer uno de los dos posibles errores: rechazar H0 cuando es cierta (error de tipo I) o aceptar H0 cuando es falsa (error de tipo II).
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
13
I El nivel de significaci´ on: Los tests usuales est´an construidos de modo que la m´axima probabilidad de cometer el error de tipo I est´a acotada por un valor prefijado α, el nivel de significaci´on (no confundir con el nivel de confianza de los intervalos). I La decisi´on de rechazar o aceptar H0 depende del nivel de significaci´on elegido. Cu´anto m´as peque˜ no es α m´as “conservador” se hace el test a favor de H0 , es decir, que para aceptar H1 cuando α es muy peque˜ no, debemos tener “mucha evidencia estad´ıstica”. I Cuando se toma una decisi´ on (aceptar o rechazar H0 ) debe indicarse siempre el nivel de significaci´ on del test que se ha utilizado. I Cuando se acepta H0 no debe pensarse que se ha demostrado H0 sino que “no se ha encontrado suficiente evidencia emp´ırica (al nivel prefijado α) en contra de H0 ”.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
14
I Cuando se acepta H1 debe recordarse tambi´en que la interpretaci´on correcta es que “los datos obtenidos proporcionan suficiente evidencia estad´ıstica al nivel α para aceptar H1 ”. Una muestra diferente (o un nivel de significaci´on m´as bajo) podr´ıan haber llevado a conclusiones distintas. I Dualidad con los intervalos de confianza: en algunos casos de hip´otesis nula simple (i.e. del tipo H0 : θ = θ0 ) el test usual rechaza H0 (al nivel de significaci´ on α) si y s´ olo si el intervalo de nivel de confianza 1 − α no contiene al valor θ0 . Ejemplo: Si X ∼ N(µ, σ) la regi´ on de rechazo s R = (x1 , . . . , xn ) : |¯ x − µ0 | ≥ tn−1;α/2 √ n del contraste equivale a
H0 : µ = µ 0 H1 : µ 6= µ0
α
R = {(x1 , . . . , xn ) : µ0 ∈ / IC1−α (µ)} . Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
15
Contrastes para la media de una distribuci´ on En cada caso se rechaza H0 cuando (x1 , . . . , xn ) ∈ R. • Distribuci´ on normal con varianza conocida: Sea X1 , . . . , Xn una muestra aleatoria de X ∼ N(µ, σ) con σ conocido. σ H0 : µ = µ 0 R = (x1 , . . . , xn ) : |¯ x − µ0 | ≥ zα/2 √ n σ H0 : µ ≤ µ 0 R = (x1 , . . . , xn ) : x¯ − µ0 ≥ zα √ n σ H0 : µ ≥ µ 0 R = (x1 , . . . , xn ) : x¯ − µ0 ≤ z1−α √ n donde zβ es tal que Φ(zβ ) = 1 − β siendo Φ la funci´on de distribuci´on de la N(0, 1).
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
16
• Distribuci´ on normal con varianza desconocida: Sea X1 , . . . , Xn una muestra aleatoria de X ∼ N(µ, σ) con σ desconocido. s H0 : µ = µ 0 R = (x1 , . . . , xn ) : |¯ x − µ0 | ≥ tn−1;α/2 √ n s H0 : µ ≤ µ 0 R = (x1 , . . . , xn ) : x¯ − µ0 ≥ tn−1;α √ n s √ H0 : µ ≥ µ 0 R = (x1 , . . . , xn ) : x¯ − µ0 ≤ tn−1;1−α n
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
17
• Tests de nivel aproximado α (muestras grandes) para la media de cualquier distribuci´ on: Sea X1 , . . . , Xn una muestra aleatoria de X con E(X ) = µ < ∞. H0 : µ = µ0 , frente a H1 : µ 6= µ0 x¯ − µ0 R = (x1 , . . . , xn ) : √ > zα/2 s/ n H0 : µ ≤ µ0 , frente a H1 : µ > µ0 x¯ − µ0 √ > zα R = (x1 , . . . , xn ) : s/ n H0 : µ ≥ µ0 , frente a H1 : µ < µ0 x¯ − µ0 √ < −zα R = (x1 , . . . , xn ) : s/ n
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
18
• Tests de nivel aproximado α (muestras grandes) para el par´ ametro p en una Bernoulli: Sea X1 , . . . , Xn una muestra aleatoria de X ∼ Bernoulli(p). H0 : p = p0 , frente a H1 : p 6= p0 . El criterio de rechazo es (x1 , . . . , xn ) ∈ R, siendo x¯ − p0 > zα/2 R = (x1 , . . . , xn ) : q p0 (1−p0 ) n
y an´alogamente para los tests con hip´ otesis H1 unilaterales. En el formulario que se puede descargar de la p´agina web hay una lista de las regiones cr´ıticas correspondientes a los contrastes de uso m´as frecuente.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
19
Contrastes para la varianza de una normal Sea X1 , . . . , Xn una muestra aleatoria de X ∼ N(µ, σ) con σ desconocido. (n − 1)s 2 2 2 H0 : σ = σ0 R= ∈ / (χn−1;1−α/2 , χn−1;α/2 ) σ02 = {σ02 ∈ / IC1−α (σ 2 )} H0 : σ ≤ σ0 H0 : σ ≥ σ0
(n − 1)s 2 ≥ χ2n−1;α σ02
(n − 1)s 2 ≤ χ2n−1;1−α σ02
R= R=
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
20
El concepto de p-valor Dado un test, definido para todos los niveles de significaci´on posibles, se define el p-valor, para unos datos prefijados, como el ´ınfimo de los valores α para los cuales se rechaza la hip´otesis nula a un nivel de significaci´ on α. P(x1 , . . . , xn ) = inf{α : H0 es rechazada al nivel α}.
Cu´anto m´as peque˜ no es el p-valor, m´as evidencia estad´ıstica aportan los datos a favor de H1 . El p-valor se puede interpretar como la probabilidad de obtener un valor “al menos tan raro” como el que se ha obtenido cuando H0 es cierta.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
21
Ejemplo: Los lagartos del desierto se esconden del calor en verano para evitar que su temperatura corporal interna llegue al nivel letal de 45o C. Se ha tomado una muestra para estudiar el tiempo X (en minutos) requerido para que la temperatura de un lagarto alcance los 45o C, partiendo de su temperatura normal mientras estaban en la sombra. Se han obtenido los siguientes datos: 10,1 11,2
12,5 11,4
12,2 10,7
10,2 14,9
12,8 13,9
12,1 13,3
Suponiendo que X sigue una distribuci´ on N(µ, σ) y, en base a estos datos, ¿puede concluirse que el tiempo medio requerido para alcanzar la temperatura letal es menor que 13 minutos?
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
22
Contrastes para dos muestras Caso de muestras independientes: Se tienen dos muestras X1 , . . . , Xn1 e Y1 , . . . , Yn2 de dos v.a. X e Y . Ambas muestras se suponen independientes entre s´ı. Se desea contrastar hip´otesis del tipo H0 : µ 1 = µ 2 H0 : µ 1 ≤ µ 2 H0 : σ1 = σ2 En los ejercicios propuestos se pueden encontrar varios ejemplos.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
23
Uno de los tests m´as usuales es el de igualdad de medias para dos poblaciones normales “homoced´asticas”, es decir, con σ1 = σ2 : Se puede probar que, bajo H0 : µ1 = µ2 , ¯ − Y¯ X q sp n11 +
1 n2
∼ tn1 +n2 −2
y, por tanto, una regi´on cr´ıtica al nivel α es r 1 1 + R = |¯ x − y¯ | > tn1 +n2 −2;α/2 sp n1 n2 siendo sp2 =
(n1 − 1)s12 + (n2 − 1)s22 n1 + n2 − 2
la varianza combinada (pooled variance).
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
24
Para contrastar la hip´otesis de homocedasticidad (igualdad de varianzas) de dos poblaciones normales presentamos una nueva distribuci´on auxiliar.
1.5
2.0
Sean Q1 y Q2 v.a. independientes con distribuciones χ2n1 y χ2n2 , Q1 /n1 se denomina F de respectivamente. La distribuci´ on de Q2 /n2 Fisher-Snedecor con n1 y n2 grados de libertad, Fn1 ,n2 .
n1=1, n2=1 n1=2, n2=1
1.0
n1=100, n2=1 n1=100, n2=100
0.0
0.5
c(0, 2)
n1=5, n2=2
0
1
2
3
4
5
range(x)
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
25
Si s12 , s22 son la cuasi-varianzas de dos muestras independientes de tama˜ no n1 y n2 extra´ıdas, respectivamente, de dos poblaciones N(µ1 , σ1 ) y N(µ2 , σ2 ), se tiene (n2 − 1)s22 (n1 − 1)s12 2 ∼ χ , ∼ χ2n2 −1 , n −1 1 σ12 σ22 Por tanto, bajo H0 : σ1 = σ2 , s12 ∼ Fn1 −1,n2 −1 . s22 De este resultado se derivan los tests para comparar σ1 y σ2 .
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
26
s12 R= ∈ / (Fn1 −1;n2 −1;1−α/2 , Fn1 −1;n2 −1;α/2 ) s22 2 σ1 = 1∈ / IC1−α σ22 2 s1 R= > Fn1 −1;n2 −1;α s22 2 s1 R= < Fn1 −1;n2 −1;1−α s22
H0 : σ1 = σ2
H0 : σ1 ≤ σ2 H0 : σ1 ≥ σ2
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
27
Caso de muestras emparejadas: Surge en aquellas situaciones con n1 = n2 en que Xi e Yi no son independientes (porque corresponden, por ejemplo, a mediciones sobre el mismo individuo antes y despu´es de un tratamiento). Se reducen a problemas de una muestra para la muestra de diferencias Di = Xi − Yi . Puede verse un ejemplo en los problemas de la Relaci´on 5.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
28
Consistencia de tests. Tests insesgados y UMP Se dice que una sucesi´ on de tests con un nivel prefijado α es consistente cuando lim βn (θ) = 1, ∀θ ∈ Θ1 = Θ \ Θ0 .
n→∞
Se dice que un test es insesgado cuando βn (θ) ≤ α ∀θ ∈ Θ0
y βn (θ) ≥ α ∀θ ∈ Θ1 .
Se dice que un test con funci´ on de potencia βn es uniformemente m´as potente (UMP) dentro de una clase Bn,α de tests de nivel α basados en muestras de tama˜ no n cuando βn (θ) ≥ β˜n (θ), ∀θ ∈ Θ1 siendo β˜n la funci´on de potencia de cualquier otro test de la clase Bn,α . Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
29
El lema de Neyman-Pearson Se considera el problema de hip´ otesis simple y alternativa simple H0 : θ = θ0 frente a H1 : θ = θ1 . Q Denotemos fn (x1 , . . . , xn ; θ) = ni=1 f (xi ; θ). Dado α ∈ (0, 1), supongamos que la regi´ on fn (x1 , . . . , xn ; θ1 ) ∗ >k R = (x1 , . . . , xn ) : fn (x1 , . . . , xn ; θ0 ) verifica Pθ0 (R ∗ ) = α. Entonces Pθ1 (R ∗ ) ≥ Pθ1 (R), siendo R la regi´on cr´ıtica de cualquier otro test tal que Pθ0 (R) ≤ α. En otras palabras, R ∗ es el test ´ optimo de nivel α para el problema considerado. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
30
Demostraci´ on del lema de Neyman-Pearson: Denotemos x = (x1 , . . . , xn ) Z Z fn (x; θ1 )dx − fn (x; θ1 )dx, Pθ1 (R ∗ ) − Pθ1 (R) = R ∗ ∩R c R ∗,
R ∗c ∩R
pero, por definici´on de Z Z fn (x; θ1 )dx ≥ k R ∗ ∩R c
R ∗ ∩R c
fn (x; θ0 )dx
y tambi´en Z R ∗c ∩R
Z fn (x; θ1 )dx ≤ k
R ∗c ∩R
fn (x; θ0 )dx.
Por lo tanto Z
∗
fn (x; θ0 )dx − Pθ1 (R ) − Pθ1 (R) ≥ k ∗ c Z Z R ∩R =k fn (x; θ0 )dx − fn (x; θ0 )dx R∗
Z R ∗c ∩R
f (x; θ0 )dx
R
= k [Pθ0 (R ∗ ) − Pθ0 (R)] ≥ 0. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
31
Familias param´ etricas con cociente de verosimilitudes mon´ otono y tests ´ optimos I ¿C´ omo construir tests ´ optimos en problemas que no sean de hip´otesis simple y alternativa simple? I Consideremos el caso en que el modelo es de la forma f (·; θ), siendo θ ∈ Θ, donde Θ ⊂ R es un intervalo. Qn I Sea fn (x1 , . . . , xn ; θ) = i=1 f (xi ; θ). I Supongamos que queremos contrastar H0 : θ ≤ θ0 frente a H1 : θ > θ0 .
´ n.- Se dice que f (·|θ) es una familia param´etrica con Definicio cociente de verosimilitudes mon´ otono (CVM) si existe un estad´ıstico Tn (x1 , . . . , xn ) tal que, para todo θ1 , θ2 , con θ1 < θ2 , la raz´on de verosimilitudes fn (x1 , . . . , xn ; θ2 ) fn (x1 , . . . , xn ; θ1 ) es una funci´on mon´otona no decreciente de Tn (x1 , . . . , xn ). Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
32
Como consecuencia directa del Lema de Neyman-Pearson y de la anterior definici´on se tiene Teorema.- Supongamos que f (·; θ) cumple la propiedad CVM y que kα es tal que Pθ0 {Tn > kα } = α. Supongamos adem´as que Pθ {Tn = c} = 0, para todo θ y c. Entonces, R = {(x1 , . . . , xn ) : Tn (x1 , . . . , xn ) > kα } es la regi´on cr´ıtica de un test ´optimo (uniformemente m´as potente) de nivel α para contrastar H0 : θ ≤ θ0 frente a H1 : θ > θ0 . Un resultado an´alogo es v´alido para H0 : θ ≥ θ0 frente a H1 : θ < θ0 aunque en este caso la propiedad CVM debe cumplirse cambiando “no decreciente” por “no creciente”.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
33
Ejemplo: Sea f (·; θ) una uniforme en (0, θ). La propiedad CVM se cumple con Tn (x1 , . . . , xn ) = max{x1 , . . . , xn }. Por tanto, el test o´ptimo de nivel α para H0 : θ ≤ θ0 frente a H1 : θ > θ0 es n kα =α R = {(x1 , . . . , xn ) : max{x1 , . . . , xn } > kα }, donde 1 − θ0 es decir, kα = exp n1 log(1 − α) + log(θ0 ) . Ejemplo: Si f (x; θ) = θe −θx 1[0,∞) Pn(x), la propiedad CVM se cumple con Tn (x1 , . . . , xn ) = 1/ i=1 xi . Por tanto, el test ´optimo de nivel α para H0 : θ ≤ θ0 frente a H1 : θ > θ0 es n X 1 > kα } donde Pθ0 { } = α. Xi < x k α i=1 i
1 R = {(x1 , . . . , xn ) : Pn
i=1
El valor kP α se puede calcular teniendo en cuenta que, si θ = θ0 , entonces ni=1 Xi ∼ γ(θ0 , n) porque X ∼ exp(θ0 ) = γ(θ0 , 1). Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
34
Construcci´ on de tests. Test de cociente de verosimilitudes Sea f (·; θ) donde θ = (θ1 , . . . , θk ) ∈ Θ ⊂ Rk , siendo Θ un “intervalo” de Rk . Q Dada una muestra x = (x1 , . . . , xn ), sea fn (x; θ) = ni=1 f (xi ; θ). Consideremos el problema de contrastar H0 : θi = ci , para i = 1, . . . , r (con r ≤ k) H1 : θi 6= ci para alg´ un i = 1, . . . , r El estad´ıstico del contraste de raz´ on de verosimilitudes es Λn =
supθ∈Θ0 fn (x; θ) , supθ∈Θ fn (x; θ)
donde Θ0 = {θ ∈ Θ : θ = (c1 , . . . , cr , θr +1 , . . . , θk )}. El contraste de raz´on de verosimilitudes tiene como regi´on de rechazo R = {(x1 , . . . , xn ) : Λn (x1 , . . . , xn ) ≤ kα }. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
35
Teorema.- Supongamos que ˆ n es estimador consistente (en probabilidad) del (i) El emv θ par´ametro θ. (ii) Para todo x, la funci´ on log f (x; θ) tiene derivadas parciales terceras (respecto a las componentes θj de θ) continuas. (iii) En las integrales que involucran a la funci´ on f (x; θ) se pueden permutar las derivadas con el signo integral. (iv) La matriz on de Fisher de2 informaci´ ∂ es invertible para cada θ. I(θ) = ∂θi ∂θj log f (X ; θ) 1≤i,j≤k
Entonces, bajo H0 , d
−2 log Λn −→ χ2r .
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
(4)
36
Aplicaci´ on a tests de bondad de ajuste Sea X una v.a. discreta que toma los valores a1 , . . . , ak . Denotemos pi = P(X = ai ). Supongamos que se desea contrastar H0 : pi = pi0 , i = 1, . . . , k basado en una muestra x1 , . . . , xn . Obs´ervese que, en este caso, con la notaci´on del teorema, r = k − 1 porque cuando se fijan k − 1 probabilidades pi queda fijada la probabilidad restante. Por tanto, H0 se rechaza al nivel α cuando −2 log Λn > χ2k−1;α ,
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
37
Aqu´ı el numerador de Λn es n! Ok p O1 . . . pk0 , O1 ! . . . Ok ! 10 siendo Oj = #{i : xi = aj } las “frecuencias observadas” de los distintos valores de la variable [n´ otese que, bajo H0 , (O1 , . . . , Ok ) tiene distribuci´ on multinomial M(n; p10 , . . . , pk0 )]. El denominador de Λn es n! O1 ! . . . Ok !
O1 n
O1
...
Ok n
Ok .
Sustituyendo en Λn es inmediato ver que el estad´ıstico de contraste se puede expresar en la forma −2 log Λn = 2
k X i=1
Oi log
Oi ei
,
donde ei = npi0 , i = 1, . . . , k son las “frecuencias esperadas (bajo H0 )” de los distintos valores de la variable en una muestra de tama˜ no n. Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
38
Un ejemplo cl´ asico: el experimento de Mendel En el famoso experimento de Mendel se cruzaron plantas de guisantes con fenotipo rugoso-amarillo con otras de fenotipo lisoverde. En la segunda generaci´ on se pod´ıan observar cuatro fenotipos (liso-amarillo, rugoso-amarillo, liso-verde, rugoso-verde) cuyas respectivas probabilidades, seg´ un la teor´ıa de la herencia mendeliana, deb´ıan ser p10 =
3 3 1 9 , p20 = , p30 = , p40 = . 16 16 16 16
Observados n = 556 guisantes en la segunda generaci´ on del experimento se obtuvieron los siguientes n´ umeros de guisantes con estos fenotipos: O1 = 315, O2 = 101, O3 = 108, O4 = 32.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
39
¿Proporcionan estos resultados alguna evidencia en contra de la teor´ıa mendeliana? Aplicamos el test para contrastar H0 : p1 = e1 = 556·
9 16 , . . . , p4
=
1 16 :
9 3 1 = 312.75, e2 = e3 = 556· = 104.25, e4 = 556· = 34.75 16 16 16
En definitiva, el test de cociente de verosimilitudes compara las Oi con las ei y rechaza la hip´ otesis nula cuando hay “demasiadas diferencias” entre ellas. Esto se hace formalmente mediante el estad´ıstico −2 log Λn = 2
k X
Oi log
i=1
Oi ei
= 0.4754
El p-valor (calculado a partir de la distribuci´ on χ23 ) es 0.9281 lo que, por supuesto, no indica ninguna evidencia estad´ıstica en contra de H0 . Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
40
Hay una controversia cl´asica en la historia de la ciencia en el sentido de que los resultados de Mendel eran “demasiado buenos”, es decir, hab´ıa demasiada concordancia entre las Oi y las ei (por ejemplo, R.A. Fisher era de esta opini´ on; ver su art´ıculo de 1936, “Has Mendel’s work been rediscovered?”, en The Annals of Science). Se ha sugerido que este supuesto “exceso de concordancia” pod´ıa deberse a un “sesgo de repetici´ on” (confirmation bias) producido por la repetici´on de los resultados hasta que las Oi concordasen fuertemente con las ei . Tambi´en se ha conjeturado que alg´ un ayudante de Mendel pudo actuar con “exceso de celo” manipulando los resultados. En todo caso, las ideas b´asicas de Mendel eran acertadas y han tenido una influencia decisiva.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
41
Construcci´ on de tests. Test bayesianos Se desea contrastar H0 : θ ∈ Θ0 frente a H1 : θ ∈ Θ \ Θ0 . Como siempre, la informaci´ on procede de una muestra x1 , . . . , xn . La metodolog´ıa bayesiana supone que la densidad que ha generado los datos es f (·|θ) y que el par´ametro θ puede considerarse como una v.a. con distribuci´ on a priori π(θ). A partir de aqu´ı se calculan la distribuci´on a posteriori π(θ|x1 , . . . , xn ) dada por π(θ|x1 , . . . , xn ) = R donde fn (x1 , . . . , xn |θ) =
fn (x1 , . . . , xn |θ)π(θ) , Θ fn (x1 , . . . , xn |θ)π(θ)dθ
Qn
i=1 f (xi ; θ).
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
42
El elemento fundamental en la inferencia bayesiana es siempre la distribuci´on a posteriori. A partir de ella se pueden calcular las probabilidades a posteriori de ambas hip´ otesis Z P{θ ∈ Θ0 |x1 , . . . , xn } = π(H0 |x1 , . . . , xn ) = π(θ|x1 , . . . , xn )dθ, Θ0
P{θ ∈ Θ1 |x1 , . . . , xn } = π(H1 |x1 , . . . , xn ) = 1 − π(H0 |x1 , . . . , xn ), y decidir dependiendo de sus valores. T´ıpicamente se optar´a por H1 cuando π(H1 |x1 , . . . , xn ) ≥ β, donde β ∈ (0, 1) es un valor que se fija dependiendo de la gravedad que se atribuya al error de tipo I (rechazar H0 cuando es cierta). Observemos que la metodolog´ıa bayesiana de contraste de hip´otesis depende fuertemente de la elecci´ on de la distribuci´on a priori π.
Estad´ıstica I (Mat/DG). Profesora: Amparo Ba´ıllo
Tema 5: Contraste de hip´ otesis
43