Story Transcript
Tema 2. Contraste de hip´otesis en una poblaci´on
Contenidos I
Introducci´ on, las hip´ otesis nula y alternativa
I
El procedimiento de contraste de hip´ otesis
I I
Errores de Tipo I y Tipo II, potencia del contraste Estad´ısticos del contraste, nivel de significaci´ on y regiones de aceptaci´ on/rechazo en contrastes bilaterales y unilaterales
I
Contrastes de hip´ otesis: procedimiento
I
p-valor
I I
Contrastes bilaterales e intervalos de confianza Ejemplos para distintos par´ametros
I
Potencia y tama˜ no muestral
Tema 2. Contraste de hip´otesis en una poblaci´on Objetivos de aprendizaje Al final de este tema debieras ser capaz de: I
Llevar a cabo un contraste de hip´ otesis sobre una poblaci´on
I
Formular las hip´ otesis nula y alternativa de un contraste
I
Entender los errores de tipo I y tipo II, definir el nivel de significaci´ on, definir la potencia del contraste
I
Seleccionar un estad´ıstico del contraste adecuado e identificar las regiones cr´ıticas correspondientes a contrastes unilaterales y bilaterales
I
Utilizar el p-valor para llevar a cabo un contraste
I
Conocer la relaci´ on entre un contraste bilateral y un intervalo de confianza asociado
I
Calcular la potencia de un contraste y encontrar el tama˜ no muestral necesario para obtener una potencia dada
Tema 2. Contraste de hip´otesis en una poblaci´on
Referencias I
Newbold, P. “Estad´ıstica para administraci´ on y econom´ıa” I
I
Cap´ıtulo 9 (9.1-9.5)
Ross, S. “Introducci´ on a la Estad´ıstica” I
Cap´ıtulo 9
Contrastes de hip´otesis: introducci´on Un contraste de hip´ otesis es un procedimiento que: I
se basa en datos muestrales
I
para proporcionarnos informaci´ on cara a tomar una decisi´on
I
sobre la validez de una conjetura o hip´ otesis sobre una poblaci´on X ; t´ıpicamente, el valor de un par´ametro de la poblaci´on θ (θ puede ser uno cualquiera de los par´ametros que hemos considerado hasta ahora: µ, p, σ 2 , etc)
Esta hip´ otesis a confrontar se conoce como la hip´ othesis nula (H0 ): I
Podemos pensar en ella como la hip´ otesis considerada correcta (antes de llevar a cabo el test)
I
Ser´a mantenida a menos que la muestra aporte suficiente evidencia contraria
I
La informaci´ on recogida en la muestra se emplea para confrontar (o contrastar) esta hip´ otesis
La hip´otesis nula: ejemplos 1. Un fabricante de paquetes de cereales afirma que, en promedio, cada paquete pesa al menos 400 g. Quieres contrastar esta informaci´on a partir de los pesos de los paquetes en una muestra aleatoria. Poblaci´ on: X = ’peso de un paquete de cereales (en g)’ µ0 z}|{ MAS Hip´ otesis nula, H0 : µ ≥ 400
'
¿Proporciona la muestra suficiente evidencia para dudar de (rechazar) H0 ? 2. Una compa˜ n´ıa recibe env´ıos de componentes, que acepta si el porcentaje de componentes defectuosos es como m´aximo del 5%. La decisi´ on se basa en una muestra aleatoria de estos componentes. Poblaci´ on: X = 1 si un componente es defectuoso y 0 en otro caso X ∼ Bernoulli(p), p = proporci´ on de componentes defectuosos en todo el env´ıo p0 z}|{ Hip´ otesis nula, H0 : p ≤ 0.05 MAS
'
¿Proporciona la muestra evidencia suficiente para rechazar H0 ?
La hip´otesis nula, H0 I
Define la hip´ otesis a contrastar
I
Se asume inicialmente que la hip´ otesis nula es correcta (semejante a suponer inocencia a menos que se pruebe la culpa)
I
Habitualmente corresponde al estatus quo
I
Su definici´ on matem´ atica siempre contiene los s´ımbolos ’=’, ’≤’ o ’≥’ (conjunto cerrado)
I
Puede ser rechazada como resultado del contraste, o no serlo
I
Hip´ otesis simples: µ0 p0 σ02 z}|{ z}|{ z}|{ H0 : µ = 5 , H0 : p = 0.6 , H0 : σ 2 = 9 En general: H0 : θ = θ0 Espacio param´etrico asociado a esta hip´ otesis nula: Θ0 = {θ0 }
I
Hip´ otesis compuestas (especificadas mediante un rango de valores): µ0 p0 z}|{ z}|{ H0 : µ ≤ 5 , H0 : p ≥ 0.6 En general: H0 : θ ≤ θ0 o ´ H0 : θ ≥ θ0 Espacio param´etrico asociado a esta hip´ otesis nula: Θ0 = (−∞, θ0 ] o Θ0 = [θ0 , ∞)
Hip´otesis alternativa, H1 Si la hip´ otesis nula no es v´ alida, alguna alternativa debe ser correcta. Para realizar el contraste, el investigador debe especificar una hip´ otesis alternativa frente a la que se contrasta la hip´ otesis nula. La hip´ otesis alternativa H1 : I
Es la opuesta a la hip´ otesis nula
I
Habitualmente confronta el estatus quo
I
Su formulaci´ on matem´ atica no contiene los s´ımbolos ’=’, ’≤’ o ’≥’
I
Puede ser soportada por los datos o no serlo
I
Habitualmente es la hip´ otesis por la que se inclina el investigador
I
Hip´ otesis unilaterales: (cola derecha) H1 : µ > 5, (cola izquierda) H0 : p < 0.6 En general: H1 : θ > θ0 o ´ H1 : θ < θ0 Espacio param´etrico bajo esta alternativa: Θ1 = (θ0 , ∞) o ´ Θ1 = (−∞, θ0 )
I
Hip´ otesis bilaterales: H1 : σ 2 6= 9
En general: H1 : θ 6= θ0
Espacio param´etrico bajo esta alternativa: Θ1 = (−∞, θ0 ) ∪ (θ0 , ∞)
La hip´otesis alternativa: ejemplos 1. Un fabricante de paquetes de cereales afirma que, en promedio, cada paquete pesa al menos 400 g. Quieres contrastar esta informaci´ on a partir de los pesos de los paquetes en una muestra aleatoria. Poblaci´ on: X = ’peso de un paquete de cereales (en g)’ Hip´ otesis nula, H0 : µ ≥ 400 frente a Hip´ otesis alternativa, H1 : µ < 400
'
MAS
¿Proporciona la informaci´ on de la muestra suficiente evidencia en contra de H0 y a favor de H1 ? 2. Una compa˜ n´ıa recibe env´ıos de componentes, que acepta si el porcentaje de componentes defectuosos es como m´ aximo del 5%. La decisi´ on se basa en una muestra aleatoria de estos componentes. Poblaci´ on: X = 1 si un componente es defectuoso y 0 en otro caso X ∼ Bernoulli(p), p = proporci´ on de componentes defectuosos en el env´ıo Hip´ otesis nula, H0 : p ≤ 0.05 frente a Hip´ otesis alternativa, H1 : p > 0.05
'
MAS
¿Proporciona la informaci´ on de la muestra suficiente evidencia contra H0 y a favor de H1 ?
Procedimiento de contraste de hip´otesis
xyyxxxxyy Poblaci´ on: X = ’altura de un estudiante de la UC3M (en m)’ Afirmaci´ on: En promedio, los estudiantes miden menos de 1.6 m ⇒ Hip´ otesis: H0 : µ ≤ 1.6 frente a H1 : µ > 1.6
'
MAS
yyxx
Muestra: Supongamos que la media muestral es 1.65 m, x¯ = 1.65
¿Es extra˜ no observar una media muestral igual a x¯ = 1.65 si la media de la poblaci´on es µ ≤ 1.6?
Si no es razonable, rechazamos la hip´ otesis nula en favor de la alternativa.
Procedimiento de contraste de hip´otesis I
Una vez especificadas las hip´ otesis nula y alternativa y recogida la informaci´ on muestral, se toma una decisi´ on sobre la hip´otesis nula (rechazar o no rechazar H0 ).
I
La regla de decisi´ on se basa en el valor de una “distancia” entre los datos muestrales de que disponemos y aquellos valores que tienen alta probilidad si se cumple la hip´ otesis nula.
I
Esta distancia se calcula como el valor de un estad´ıstico del contraste, relacionado con las cantidades pivotales mencionadas en el Tema 1. M´as adelante se mencionar´an casos espec´ıficos. Para cualquier decisi´ on que pueda tomarse, existe la posibilidad de llegar a una conclusi´ on equivocada sobre el valor del par´ametro de la poblaci´ on, porque no disponemos m´as que de una muestra aleatoria y con ella no podemos tener la certeza de que la hip´otesis nula sea correcta o no.
I
I
Existen dos posibles estados en la naturaleza y por tanto se pueden cometer dos errores: los errores de Tipo I y de Tipo II.
Errores de Tipo I y de Tipo II, potencia I
Error de Tipo I: rechazar una hip´ otesis nula correcta. El error de Tipo I se considera importante. La probabilidad de un error de Tipo I es igual a α y se denomina nivel de significaci´ on, α = P(rechazar la nula|H0 es correcta)
I
Error de Tipo II: no rechazar una hip´ otesis nula incorrecta. La probabilidad de un error de Tipo II es igual a β. β = P(no rechazar la nula|H1 es correcta)
I
potencia: probabilidad de rechazar una hip´ otesis nula (cuando es incorrecta). potencia = 1 − β = P(rechazar la nula|H1 es correcta)
Decisi´ on No Rechazar H0 Rechazar H0
Situaci´ on actual H0 correcta H0 incorrecta Sin error Error de Tipo II (1 − α) (β) Error de Tipo I Sin error (α) (1 − β = potencia)
Errores de Tipo I y de Tipo II, potencia I
I
I
Los errores de Tipo I y de Tipo II no se pueden cometer simult´aneamente I
El error de Tipo I solo puede darse si H0 es correcta
I
El error de Tipo II solo puede darse si H0 es incorrecta
Si la probabilidad del error de Tipo I, α ⇑, entonces la probabilidad del error de Tipo II, β ⇓ Si todo lo dem´as no cambia: I
I I I I
I
β ⇑ cuando la diferencia entre el valor supuesto para el par´ ametro y su valor real ⇓ β ⇑ cuando α ⇓ β ⇑ cuando la variabilidad en la poblaci´ on (σ) ⇑ β ⇑ cuando el tama˜ no muestral (n) ⇓ Para θ ∈ Θ1 potencia(θ) = 1 − β(θ) Para θ ∈ Θ0 potencia(θ) ≤ α
Estad´ıstico del contraste, nivel de significaci´on y regi´on de rechazo Estad´ıstico del contraste, T I
Nos permite decidir si es “probable” o “improbable” que se observen los datos muestrales, suponiendo que la hip´ otesis nula sea cierta.
I
Es la cantidad pivotal vista en el Tema 1, calculada bajo la hip´otesis nula.
I
La decisi´ on del contraste de hip´ otesis se basa en el valor observado del estad´ıstico del contraste, t.
I
Si los datos muestrales proporcionan evidencia contraria a la hip´ otesis nula, el valor observado del estad´ıstico del contraste debiera ser “extremo”, esto es, muy poco probable. En otro caso, este valor debiera ser “usual”. Distinguimos entre valores “usuales” y “extremos” sobre la base de:
I
I I
la distribuci´ on del estad´ıstico del contraste para la muestra, el nivel de significaci´ on α, que define la llamada regi´ on de rechazo o cr´ıtica y la regi´ on de aceptaci´ on.
Estad´ıstico del contraste, significaci´on y regi´on de rechazo Regi´ on de rechazo (RR) y de aceptaci´ on (RA) en contrastes de tama˜ no α:
Contraste unilateral derecho H1 : θ > θ0 RRα = {t : t > Tα }
RAα = {t : t ≤ Tα }
Contraste unilateral izquierdo H1 : θ < θ0 RRα = {t : t < T1−α }
RAα = {t : t ≥ T1−α }
Contraste bilateral H1 : θ 6= θ0 RRα = {t : t < T1−α/2 o t > Tα/2 } RAα = {t : T1−α/2 ≤ t ≤ Tα/2 }
α ●
RA
VALOR CRITICO
RR
α RR
● VALOR CRITICO
α 2 RR
● VALOR CRITICO
RA
α 2 RA
●
VALOR RR CRITICO
Estad´ısticos del contraste Sea X n una m.a.s. de una poblaci´ on X con media µ y varianza σ 2 , α un nivel de significaci´ on, zα el cuantil α de N(0,1), µ0 la media de la poblaci´ on bajo H0 , etc. Par´ ametro
Media
Hip´ otesis
Estad´ıstico contraste
Datos normales Varianza conocida
¯ −µ X √0 ∼ N(0, 1) σ/ n
Datos no normales Muestra grande
¯ −µ X √0 ∼ap. N(0, 1) σ/ ˆ n
Datos Bernoulli Muestra grande
Datos normales Varianza desconocida
p
p ˆ−p0 ∼ap. N(0, 1) p0 (1−p0 )/n
¯ −µ X √ 0 ∼ tn−1 s/ n
Varianza
Datos normales
(n−1)s 2 ∼ χ2 n−1 σ2 0
Desv. T´ıp.
Datos normales
(n−1)s 2 ∼ χ2 n−1 σ2 0
RRα contraste bilateral 9 z > > z }| { > > > = x¯ − µ0 x¯−µ0 √ > zα/2 z : < z1−α/2 o √ > > σ/ n > > σ/ n > > > > > > : ; ff x¯−µ0 x¯−µ0 √ < z1−α/2 o √ > zα/2 z : σ/ ˆ n σ/ ˆ n 8 > > > > > <
p ˆ−p0 p ˆ−p0 < z1−α/2 o p > zα/2 p0 (1−p0 )/n p0 (1−p0 )/n 8 9 t > > > > z }| { > > > > > > < = x¯ − µ0 x¯−µ0 √ < tn−1;1−α/2 o > tn−1;α/2 t : √ > > s/ n > > s/ n > > > > > > : ;
z :
ff
p
8 9 χ2 > > > > > > > > z }| { > > > > > > > > < = 2 (n − 1)s 2 (n−1)s 2 χ2 : < χ2 o > χ 2 n−1;1−α/2 n−1;α/2 > > 2 σ > > σ > > 0 0 > > > > > > > > > > : ; ( ) 2 2 (n−1)s (n−1)s 2 2 χ2 : < χ > χ o n−1;1−α/2 n−1;α/2 σ2 σ2 0 0
Pregunta: ¿C´ omo definir´ıas RRα para contrastes unilaterales?
Contraste de hip´otesis: procedimiento
1. Especificar las hip´ otesis nula y alternativa. 2. Calcular el valor observado del estad´ıstico del contraste (ver transparencia anterior). 3. Para un nivel de significaci´ on α dado, definir la regi´on de rechazo (RRα ). I
Rechazar H0 , la hip´ otesis nula, si el valor del estad´ıstico del contraste est´ a en RRα y no rechazar H0 en otro caso.
4. Escribir las implicaciones para nuestro caso en una frase.
Contraste unilateral para la media de datos normales con varianza conocida: ejemplo Ejemplo: 9.1 (Newbold) Los pesos de los rodamientos fabricados en un proceso siguen una distribuci´ on normal con media 250 g. y desviaci´ on t´ıpica 5 g. Tras reajustar el mismo, el encargado sospecha que el peso promedio ha aumentado, pero su desviaci´ on t´ıpica no ha cambiado. Se selecciona una muestra aleatoria simple de diecis´eis rodamientos, con un peso medio de 251.9 g. ¿Tiene raz´ on el encargado? Lleva a cabo el contraste para un nivel de significaci´ on del 5%. Poblaci´ on: X = ”peso de un rodamiento (en g)” Estad´ıstico del contraste: ¯ X ∼ N(µ, σ 2 = 52 ) √ 0 ∼ N(0, 1) Z = X −µ
'
σ/ n
MAS: n = 16
Muestra: x¯ = 251.9 Objetivo: contrastar µ0 z}|{ H0 : µ = 250 frente a H1 : µ > 250 (contraste unilateral)
Valor observado del estad´ıstico: σ=5
µ0 = 250
n = 16 z
= =
x¯ = 251.9 x¯ − µ0 √ σ/ n 251.9 − 250 √ = 1.52 5/ 16
Contraste unilateral para la media de datos normales con varianza conocida: ejemplo Ejemplo: 9.1 (cont.) Regi´ on de rechazo (o regi´ on cr´ıtica): RR0.05
= {z : z > z0.05 }
z= 1.52
= {z : z > 1.645} Como z = 1.52 ∈ / RR0.05 no rechazamos H0 a un nivel de significaci´ on del 5%. Densidad N(0,1)
RA
●
RR zα = 1.645
Conclusi´ on: Los datos muestrales no proporcionan suficiente evidencia para rechazar la afirmaci´ on de que el peso promedio de los rodamientos es 250 g.
Definici´on de p-valor
I
Es la probabilidad de que se obtenga un valor del estad´ıstico del contraste que sea al menos tan extremo (≤ o ≥) como el observado, suponiendo que H0 sea cierta.
I
Se conoce tambi´en como el nivel de significaci´ on observado
I
Es el menor valor de α para el que se puede rechazar H0 . Se puede emplear en el paso 3) del procedimiento de contraste de hip´ otesis con la regla siguiente:
I
I I
I
Si el p-valor < α, rechazamos H0 Si el p-valor ≥ α, no rechazamos H0
Como resumen: I I
p-valores “peque˜ nos” proporcionan evidencia en contra de H0 p-valores “grandes” proporcionan evidencia a favor de H0
p-valor C´alculo del p-valor: t valor observado del estad´ıstico del contraste T :
Contraste unilateral derecho H1 : θ > θ0 p-valor = P(T ≥ t)
Contraste unilateral izquierdo H1 : θ < θ0 p-valor = P(T ≤ t)
Contraste bilateral H1 : θ 6= θ0 p-valor = P(T ≤ −|t|) + P(T ≥ |t|)
estad. de contr. p−valor =area
estad. de contr. p−valor =area
−|estad.|
|estad.|
p−valor =areas izq.+der.
p-valor: ejemplo Ejemplo: 9.1 (cont.) Poblaci´ on: X = ”peso de un rodamiento (en g)” X ∼ N(µ, σ 2 = 52 )
'
p-valor
MAS: n = 16
Muestra: x¯ = 251.9 Objetivo: contrastar µ0 z}|{ H0 : µ = 250 frente a H1 : µ > 250 (contraste unilateral) Estad´ıstico del contraste: ¯ √ 0 ∼ N(0, 1) Z = Xσ/−µ n Valor observado del estad´ıstico: z = 1.52 densidad N(0,1)
=
P(Z ≥ z) = P(Z ≥ 1.52)
=
0.0643 donde Z ∼ N(0, 1)
Como se cumple que p-valor = 0.0643 ≥ α = 0.05 no rechazamos H0 (pero rechazar´ıamos para cualquier α mayor que 0.0643, por ejemplo, α = 0.1).
z= 1.52 p−valor =area
El p-valor y la probabilidad de la hip´otesis nula1 I
El p-valor: I I
I
no es la probabilidad de H0 ni la del error de Tipo I, α; se puede utilizar como un estad´ıstico del contraste comparando su valor con el de α (i.e. rechazar H0 si p-valor < α).
Queremos responder la pregunta: ¿cu´al es la probabilidad de la hip´ otesis nula dadas las observaciones? I
I I
1 Selke,
Recordemos que definimos el p-valor como la probabilidad de obtener las observaciones (o valores mas extremos) dada la hip´ otesis nula. No podemos responder de manera exacta, Pero bajo condiciones generales y asumiendo que sin los datos Pr(H0 ) = Pr(H1 ) = 1/2, entonces para p-valores, p, tales que p < 0.36: −ep ln(p) . Pr(H0 |Observaciones) ≥ 1 − ep ln(p)
Bayarri and Berger, The American Statistician, 2001
El p-valor y la probabilidad de la hip´otesis nula La siguiente tabla permite calibrar el p-valor como una funci´on de la probabilidad de la hip´ otesis nula: p-valor 0.1 0.05 0.01 0.001 0.00860 0.00341 0.00004 ≤ 0.00001
Pr(H0 |Observaciones) ≥ 0.39 0.29 0.11 0.02 0.1 0.05 0.01 0.001
I
Para un p-valor igual a 0.05 la hip´ otesis nula tiene una probabilidad de al menos el 29% de ser cierta.
I
Mientras que si queremos que la probabilidad de que sea cierta no supere el 5%, el p-valor tiene que ser m´as peque˜ no que 0.0034.
Intervalos de confianza y contrastes bilaterales: dualidad
Un contraste bilateral a un nivel de significaci´ on α puede realizarse a partir de un intervalo (sim´etrico) con nivel de confianza 100(1 − α)% de la manera siguiente: 1. Especificar las hip´ otesis nula y alternativa: H0 : θ = θ0
frente a
H1 : θ 6= θ0
2. Calcular un intervalo de confianza al 100(1 − α)% para θ. 3. Si θ0 no pertenece a este intervalo, rechazamos H0 . Si θ0 pertenece al intervalo, no rechazamos H0 . 4. Escribir las implicaciones para nuestro caso en una frase.
Contraste bilateral para la media con varianza conocida: ejemplo Ejemplo: 9.2 (Newbold) Un taladro produce agujeros cuyos di´ametros siguen una distribuci´ on normal con media 2 cm y desviaci´on t´ıpica 0.06 cm. Para verificar su correcto funcionamiento se miden aleatoriamente nueve taladros, con un di´ametro medio de 1.95 cm. Realiza un contraste bilateral para un nivel de significaci´ on del 5% utilizando ICs. Poblaci´ on: Intervalo de confianza al X = ”di´ametro de un agujero (en cm)” 100(1 − α)% = 95% para µ: X ∼ N(µ, σ 2 = 0.062 ) σ IC0.95 (µ) = x¯ ∓ 1.96 √ n MAS: n = 9 0.06 √ = 1.95 ∓ 1.96 Muestra: x¯ = 1.95 9 = (1.9108, 1.9892) Objetivo: contrastar µ0 z}|{ Como µ0 = 2 ∈ / CI0.95 (µ), H0 : µ = 2 frente a H1 : µ 6= 2 rechazamos H0 a un nivel de (contraste bilateral) significaci´ on del 5%.
'
Contraste bilateral para la proporci´on: ejemplo Ejemplo: 9.6 (Newbold) En una muestra aleatoria de 199 socios auditores de empresas de auditor´ıa americanas, 104 socios se mostraron de acuerdo con la afirmaci´ on: “Los flujos de caja operativos son una medida v´alida de rentabilidad”. Contrasta al 10% frente a una alternativa bilateral la hip´ otesis nula de que la mitad de los miembros de la poblaci´ on estar´ıan de acuerdo con esta afirmaci´ on. Poblaci´ on: X = 1 si un socio est´a de acuerdo con la Estad´ıstico del contraste: afirmaci´ on y 0 en otro caso Z = √ pˆ−p0 ∼aprox. N(0, 1) p0 (1−p0 )/n X ∼ Bernoulli(p) Valor observado del estad´ıstico:
'
MAS: n = 199 n grande
Muestra: pˆ =
104 199
= 0.523
Objetivo: contrastar p0 z}|{ H0 : p = 0.5 frente a H1 : p 6= 0.5 (contraste bilateral)
p0 = 0.5 n = 199 z
pˆ = 0.523 pˆ − p0 = p p0 (1 − p0 )/n 0.523 − 0.5 = p 0.5(1 − 0.5)/199 = 0.65
Contraste bilateral para la proporci´on: ejemplo Ejemplo: 9.6 (cont.) Regi´ on de rechazo o regi´ on cr´ıtica: RR0.10
= {z : z > z0.05 } ∪ {z : z < −z0.05 } = {z : z > 1.645} ∪ {z : z < −1.645}
Como z = 0.65 ∈ / RR0.10 no rechazamos H0 a un nivel de significaci´ on del 10%. Densidad N(0,1)
z= 0.65
● ● RR RA RR − zα2 = − 1.645 zα2 = 1.645
Conclusi´ on: Los datos muestrales no dan evidencia suficiente para dudar que la mitad de los socios auditores piensen que el flujo de caja operacional es una medida v´alida de rentabilidad.
Contraste unilateral, media con var. desconocida: ejemplo Ejemplo: 9.4 (Newbold, modificado) Una cadena de centros comerciales cree que el aumento de ventas entre Noviembre y Diciembre es del 20%. Una muestra aleatoria de seis centros tuvo incrementos de ventas de 19.2, 18.4, 19.8, 20.2, 20.4, 19.0. Suponiendo la poblaci´ on normal, contrasta que el incremento promedio es al menos del 20% frente a una alternativa unilateral, para α = 10%. Emplea el p-valor. Poblaci´ on: X = “incremento de ventas en un centro Estad´ıstico del contraste: entre Nov. y Dic. (en %)” ¯ √ 0 ∼ tn−1 T = Xs/−µ 2 2 n X ∼ N(µ, σ ) σ desconocida
'
Valor observado del estad´ıstico: MAS: n = 6 n peque˜ no
Muestra: x¯ = 117 = 19.5 6 2284.44−6(19.5)2 2 s = = 0.588 6−1 Objetivo: contrastar µ0 z}|{ H0 : µ ≥ 20 frente a H1 : µ < 20 (contraste unilateral)
µ0 = 20 x¯ = 1.95 t
= =
n=6 √ s = 0.588 = 0.767 x¯ − µ0 √ s/ n 19.5 − 20 √ = −1.597 0.767/ 6
Contraste unilateral, media con var. desconocida: ejemplo Ejemplo: 9.4 (cont.) p-valor = P(T ≤ −1.597) ∈ (0.05, 0.1) porque −t5;0.05 −t5;0.10 z }| { z }| { −2.015 < −1.597 < −1.476
t= −1.597 p−valor =area
Dado que p-valor < α = 0.1, rechazamos la hip´ otesis nula a este nivel. Densidad tn−1
||
−2.015 −1.476
Conclusi´ on: Los datos muestrales proporcionan suficiente evidencia para rechazar que el incremento promedio de las ventas haya sido al menos del 20%. Interpretaci´ on del p-valor: si la hip´ otesis nula fuese cierta, la probabilidad de que hubi´esemos obtenido estos datos muestrales ser´ıa como m´ aximo del 10%, lo que es bastante improbable, y por tanto rechazamos la hip´ otesis nula.
Contraste unilateral para la media con varianza desconocida: ejemplo Ejemplo: 9.4 (cont.) en Excel: Selecciona la opci´ on de men´ u: Datos, submenu: An´ alisis de datos, escoge la funci´ on: prueba t para dos muestras suponiendo varianzas desiguales. Columna A (datos), Columna B (n repeticiones de µ0 = 20), en amarillo (estad´ıstico observado t, p-valor y tn−1;α ).
Contraste unilateral para la varianza: ejemplo Ejemplo: 9.5 (Newbold) Para cumplir con la normativa, la varianza del nivel de impurezas en tanto por ciento en los env´ıos de un cierto producto qu´ımico no puede superar el valor 4. Una muestra aleatoria de veinte env´ıos ha proporcionado una cuasi-varianza muestral del nivel de impurezas de 5.62. a) Lleva a cabo un contraste de hip´ otesis adecuado (α = 0.1). b) Calcula la potencia del contraste. ¿Cu´ al es la potencia para σ12 = 7? c) ¿Qu´e tama˜ no muestral garantizar´ıa una potencia de 0.9 para σ12 = 7? Poblaci´ on: X = “nivel de impurezas del producto en un Estad´ıstico del contraste: env´ıo (en %)” 2 2 χ2 = (n−1)s ∼ χ2n−1 X ∼ N(µ, σ ) σ2
'
0
Valor observado del estad´ıstico: MAS: n = 20
2
Muestra: s = 5.62 Objetivo: contrastar σ02 z}|{ H0 : σ 2 ≤ 4 frente a H1 : σ 2 > 4 (contraste unilateral)
σ02 = 4
n = 20
2
s = 5.62 χ2
= = =
(n − 1)s 2 σ02 (20 − 1)5.62 4 26.695
Contraste unilateral para la varianza: ejemplo Ejemplo: 9.5 a) (cont.) p-valor = P(χ2 ≥ 26.695)
χ2 =
∈ (0.1, 0.25) porque
26.695
χ219;0.25
χ219;0.1 z}|{ z}|{ 22.7 < 26.695 < 27.2
p−valor =area
Como el p-valor es mayor que α = 0.1, no podemos rechazar la hip´ otesis nula a este nivel. Densidad
χ2n−1
●● 22.7
27.2
Conclusi´ on: Los datos muestrales no proporcionan suficiente evidencia para rechazar la afirmaci´ on de que la varianza del porcentaje de impurezas en los env´ıos de este producto no es mayor que 4.
Contraste unilateral para la varianza: potencia
0.8
1.0
Ejemplo: 9.5 b) Recuerda que: potencia = P(rechazar H0 |H1 es cierta) ¿Cu´ ando rechazamos H0 ? ff (n − 1)s 2 2 RR0.1 = > χ n−1;0.1 potencia(σ 2 ) funci´ on de σ 2 σ02 9 8 27.2 · 4 = 108.8> > > }| { > z = < potencia(σ2 2) = = (n − 1)s 2 > χ2n−1;0.1 · σ02 1 − β(σ ) > > > > ; :
σ20 = 4
0.0 α 0.2
0.4
0.6
La potencia viene dada por: “ ” potencia(σ12 ) = P rechazar H0 |σ 2 = σ12 “ ” = P (n − 1)s 2 > 108.8|σ 2 = σ12 „ « (n − 1)s 2 108.8 =P > σ12 σ2 „ « „ 1 « 0 Θ0 2 108.8 108.8 = P χ2 > = 1 − Fχ2 σ12 σ12 (Fχ2 es la funci´ on de distribuci´ on de χ2n−1 ) Por tanto, ` 2 ´ 108.8 power(7) = P χ > 7 = 0.6874.
● 4
6 Θ1 8
σ2
10
Contraste unilateral para la varianza: c´alculo de tama˜no muestral Ejemplo: 9.5 c) De nuestros c´ alculos“anteriores, sabemos que ” 2 σ2 potencia(σ12 ) = P (n−1)s > χ2n−1;0.1 σ02 , σ2 1
1
(n−1)s 2 σ12
∼ χ2n−1
Nuestro objetivo es encontrar el menor n tal que: 1 0.571 z}|{ C B 2 4 C B (n − 1)s > χ2n−1;0.1 potencia(7) = P B C ≥ 0.9 2 7 A σ1 @ 0
La u ´ltima ecuaci´ on implica que queremos trabajar con una distribuci´ on χ2n−1 2 2 cuyo cuantil 0.9 debe cumplir χn−1;0.9 ≥ 0.571χn−1;0.1 . tabla chi-cuadrado
χ243;0.9 /χ243;0.1 = 0.573 > 0.571 ⇒ n − 1 = 43
Por tanto, si disponemos de 44 observaciones podremos detectar el valor alternativo σ12 = 7 correctamente con una probabilidad superior al 90%.
Otro ejemplo sobre potencia: contraste unilateral para la media, poblaci´on normal y σ 2 conocida
1.0
potencia(µ) = 1 − β(µ)
0.8
1.0
I
0.0
0.2
0.4
0.6
µ0 = 5
0.4
α 0.2 0.0
4.85
n=16 n=9 n=4
0.8
I
H0 : µ ≥ µ0 frente a H1 : µ < µ0 para α = 0.05 Supongamos µ0 = 5, n = 16, σ = 0.1 x¯−µ √ 0 < −zα = −1.645, esto es, cuando Rechazamos H0 si σ/ n x¯ ≥ 4.96, por tanto 4.96−µ √ 1 potencia(µ1 ) = P Z < 0.1/ 16
0.6
I
●
4.95
Θ1
5.05
Θ0
µ
4.85
4.95
5.05
Otro ejemplo sobre potencia: contraste unilateral para la media, poblaci´on normal y σ 2 conocida La funci´ on potencia = 1 − P(error Tipo II) tiene las siguientes propiedades (si todo lo dem´as se mantiene constante): I
Cuanto m´as alejada est´e la media verdadera µ1 del valor supuesto µ0 , mayor es la potencia.
I
Cuanto menor sea α, menor es la potencia, esto es, si se reduce la probabilidad de un error de Tipo I, se incrementa la probabilidad de un error de Tipo II.
I
Cuanto mayor es la varianza de la poblaci´ on, menor es la potencia (cuando tenemos m´as variabilidad, resulta m´as dif´ıcil detectar peque˜ nas desviaciones del valor real respecto del valor supuesto µ0 ).
I
Cuanto mayor sea el tama˜ no muestral, mayor es la potencia del contraste (cuanto m´as informaci´ on tengamos sobre la poblaci´on, m´as sencillo resultar´a detectar peque˜ nas desviaciones del valor real respecto de la hip´ otesis nula).