CONCEPTOS FUNDAMENTALES

TEMA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS PRIMERA PARTE: Conceptos fundamentales 8.1. Hipótesis estadística. Tipos de hipótesis 8.2. Región crítica

Author: Germán Arroyo Carmona

1 downloads 324 Views 256KB Size

Report

DOWNLOAD PDF

Recommend Stories

CONCEPTOS FUNDAMENTALES

Manuel García Ávila – Desequilibrio Hidroeléctrico y Ácido-Base TEMA: DESEQUILIBRIO HIDROELÉCTRICO Y ÁCIDO-BASE CONCEPTOS FUNDAMENTALES • • • • •

CONCEPTOS FUNDAMENTALES

CONCEPTOS FUNDAMENTALES DE QUÍMICA

CONCEPTOS FUNDAMENTALES DE QUÍMICA 1- CONCEPTO DE CIENCIA: LA QUÍMICA. - La CIENCIA es el conocimiento organizado y sistematizado del mundo físico. -

CONCEPTOS FUNDAMENTALES SOBRE

LUMINOTECNIA Conceptos fundamentales

Conceptos fundamentales de Algoritmos

Repaso de conceptos fundamentales

CONCEPTOS FUNDAMENTALES CONTABILIDAD AGROPECUARIA

Story Transcript

TEMA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS PRIMERA PARTE: Conceptos fundamentales 8.1. Hipótesis estadística. Tipos de hipótesis 8.2. Región crítica y región de aceptación 8.3. Errores tipo I y tipo II 8.4. Test uniformemente más potentes. Metodología de Neyman-Pearson 8.5. Concepto de p-valor: cálculo e interpretación 8.6. Etapas en la realización de un contraste SEGUNDA PARTE: Contrastes para variables Normales y para proporciones 8.7. Contrastes en una población Normal 8.8. Contrastes en dos poblaciones Normales MUESTRAS INDEPENDIENTES: Contrastes de igualdad de medias Contraste de igualdad de varianzas MUESTRAS PAREADAS : Contraste de igualdad de medias

8.9. Contrastes de proporciones 2

PRIMERA PARTE: CONCEPTOS FUNDAMENTALES

3

8.1. HIPÓTESIS ESTADÍSTICA. TIPOS DE HIPÓTESIS 

Hipótesis estadística: afirmación sobre la distribución que genera los datos o sobre alguna característica concreta de dicha distribución.



En inferencia paramétrica: Modelo paramétrico: X F(x;)  las hipótesis son afirmaciones sobre un(os) parámetro(s) desconocido(s), , del modelo Ejemplo 1: el partido A no obtendrá mayoría absoluta en las elecciones del 20N 1

si gana A

0

si no gana A 1  p

X= 

p

 b(p)  hipótesis: p≤0.5

Ejemplo 2: una moneda es perfecta 1

si sale cara

0

si sale cruz 1  p

X= 

p

 b(p)  hipótesis: p=0.5

Ejemplo 3: hay discriminación salarial entre hombres y mujeres X1=log(salario hombres)  N(1,1) X2=log(salario mujeres)  N(2,2)

hipótesis: 1 2 4



En inferencia no paramétrica (Tema 9): no se supone a priori un modelo paramétrico, sino que se contrastan hipótesis más generales. Ejemplo 3: hay discriminación salarial entre hombres y mujeres X1=salario hombres  F1(x) X2=salario mujeres  F2(x)



Hipótesis: F1F2

Hipótesis simple: asigna valores puntuales concretos a todos los parámetros del modelo  Bajo dicha hipótesis, la distribución queda totalmente especificada. Ejemplo 2:



Xb(p)  hipótesis: p=0.5

Hipótesis compuesta: asigna un rango de valores a los parámetros Ejemplo 1:

Xb(p)  hipótesis: p≤0.5

Ejemplo 3:

X1=log(salario hombres)  N(1,1) X2=log(salario mujeres)  N(2,2)

Ejemplo 4:

hipótesis: 1 2

XN(,)  hipótesis: =2 (realmente es: =2, >0 ¡compuesta!) 5



Hipótesis nula H0: hipótesis que se somete a prueba y se matendrá como cierta a menos que los datos muestren suficiente evidencia en su contra. (En general, H0 corresponde al modelo más sencillo: incluye el =)



Hipótesis alternativa H1: posibles alternativas a la hipótesis nula

TIPOS DE CONTRASTES

H0: 0 H1: >0

H0: 0 H1: 0.5? H0: p=0.5 H1: p>0.5

Estadístico de contraste: pˆ = X

0.75 Rechazo si X 0.75 7



Región crítica=C={valores muestrales que conllevan rechazar H0}  Valor(es) crítico(s)= valor(es) a partir del (de los) cual(es) se rechaza H0 Ejemplo 5: (continuación) Rechazo H0 si la proporción de caras en la muestra es mayor que 0.75, ¿por qué? Porque observar una proporción de caras superior al 75% sería harto improbable si H0 fuera cierta (moneda perfecta)  los datos no sustentan H0, por eso rechazo H0



Región aceptación=A= ={valores muestrales que conllevan no rechazar H0} Ejemplo5: (continuación) Muestra concreta: n=30, x =0.3 < 0.75  No rechazo H0

 OBSERVACIÓN:  No rechazar H0 no implica que H0 sea cierta (no se “demuestra” que H0 sea cierta)

sino que no hay evidencia suficiente en los datos muestrales para rechazarla.  Rechazar H0 no significa que H0 sea falsa, sino que resulta muy difícil creer

que se haya podido observar algo tan improbable bajo H0. 8

8.3. ERRORES TIPO I Y TIPO II ¿Qué consecuencias puede conllevar la regla de decisión establecida? ¿Cuál es el “coste” de equivocarse tomando una decisión errónea? Estado de la naturaleza Decisión

H0 es cierta

H0 es falsa

“Aceptar” H0

correcto

Error tipo II

Rechazar H0

Error tipo I

correcto



α() = p(Error tipo I) = p(rechazar H0/H0 cierta) =



() = p(Error tipo II) = p(“Aceptar” H0/H0 falsa) =

 Potencia=

p(rechazar H0/H0 falsa) =

=

9

Objetivo minimizar p(Error tipo I)

minimizar p(Error tipo II)

Para una muestra de tamaño n dada, ¡ IMPOSIBLE !

Veamos un ejemplo con HIPÓTESIS SIMPLES H0: =0 H1: =1

En este caso: 

p(Error tipo I) = p(rechazar H0/H0 cierta) =

=α

¡ un único valor !



p(Error tipo II) = p(“Aceptar” H0/H0 falsa) =

=

¡ un único valor ! 10

Ejemplo 6: (X1,...,X16) m.a.s. de una distribución N(,5) H0 : =10 H1 : =15  Estimador máximo verosímil de   ˆ = X  Intuitivamente: región crítica en la dirección de la alternativa  C={X   }  Fijamos =0.1  Determinar  para que = pH (C)=0.1 0

0.1 = pH (C) = p10(X   )= 0





 X  10



X  10    10 = p  1 0  5/ 16  5/ 16  = p 10  1.25  z   Tablas: z=1.28    

Bajo H0 :=10  X  N(10, 5/ 16 )  0.1

X 10 H0   N(0,1) 1.25

X  10

Rechazar H0 cuando: 1.25 1.28  X ≥ 11.6

0.90 z

Región crítica 11

 X  15

 = p(Error tipo II) = pH1 (C) = p 15 ( X  11,6) = p  15  1.25   H0

11,6  15   1.25  =(-2.72)=0.0033

H1

=0.0033

=0.1

=10 =15 =11,6

R. Aceptación 

Región crítica

Si =p(Error tipo I) disminuye  aumenta = p(Error tipo II) (y viceversa) H0

H1

=0.0465

=0.01

=10

=12,9

R. Aceptación

=15

Región crítica 12

8.4. METODOLOGÍA “CLÁSICA” DE NEYMAN-PEARSON 

Dado H0, fijar el tamaño máximo tolerable de p(Error tipo I)=

, que

llamaremos nivel de significación :

Valores habituales: ={0.01, 0.05, 0.1} 

Entre todos las posibles regiones críticas de nivel , elegir la que:

minimice p(Error tipo II)  maximice {1-p(Error tipo II)}  maximice la potencia

Región crítica del test uniformemente más potente (T.U.M.P.) ¿Cómo obtenerla? 13

H0 : =0 H1 : =1

HIPÓTESIS SIMPLES:

La región crítica del test más potente, entre todos los de nivel , es: 

C= ( x1 ,..., xn ) /   

 L ( x1 ,..., xn ;  0 )  k , L ( x1 ,..., xn ; 1 ) 

con pH (C ) =. 0

H0 : 0 H1 : 1

HIPÓTESIS COMPUESTAS

Si la región crítica C definida previamente para las hipótesis simples: (a) No depende del valor concreto de  especificado en la hipótesis alternativa (b) Mantiene el mismo nivel de significación al ampliar H0, es decir: max p (C )  0

 C es la región crítica del T.U.M.P. para las hipótesis compuestas

ATENCIÓN: ¡ no siempre existe región crítica U.M.P.!, pero cuando existe coincide con lo “razonable”: región crítica en el sentido de la alternativa 14

Ejemplo 6: (continuación) ¿Qué ocurriría si las HIPÓTESIS fueran COMPUESTAS? Por ejemplo: H0 : =10 H1 : >10 X  10 Región crítica de nivel α=0.1  C ={ 1.25 1.28}={ X ≥11.6} con p=10(C)=α=0.1

H0 : 10 H1 : >10

p(Error tipo I) =

=

 { p=10(C)} = α =0.1; (ver dibujo)

La máxima probabilidad de Error tipo I que se comete es α: H0 : =10 H1 : >10

H0 : 10 H1 : >10 15

RELACIÓN ENTRE CONTRASTES E INTERVALOS DE CONFIANZA

Contrastar las hipótesis H0:=0 H1:0 con un nivel de significación  EQUIVALE A: Construir un intervalo de confianza para , con nivel de confianza 1-, y: rechazar H0 si 0 no está en dicho intervalo.

16

8.5. CONCEPTO DE P-VALOR: CÁLCULO E INTERPRETACIÓN Limitaciones de la selección del nivel de significación: Ejemplo 6: (continuación) H0 : =10 H1 : =15 X  10 0   N(0,1)  Si =0.10  Rechazo H0 si Z*= 1.25 1.28 Estadístico: Z*= X  10 H

1 . 25

a) Si x obs=15  zobs= 1510=4 ≥ 1.28 1.25  Rechazo H0 al 10% (zobs “significativo” al 10%) 12.5 10 b) Si x obs=12.5  zobs= 1.25 =2≥1.28  Rechazo H0 al 10% (zobs “significativo” al 10%)

Misma decisión, pero…¿poseen las dos muestras la misma evidencia contra H0? 17

El p-valor se define, para una muestra concreta, como la probabilidad de observar, bajo H0, un valor del estadístico de contraste igual o más extremo (en la dirección de la alternativa) que el observado en la muestra  probabilidad de obtener más discrepancia con H0 que la obtenida con la muestra

Cuanto menor el p-valor  más extremo el resultado muestral  más evidencia contra H0

Ejemplo 6: (continuación) a) x obs=15  zobs=4  p-valor = p(Z*  zobs) = p(N(0,1)  4) = 0.00003 Obtener el valor observado, zobs, o alguno mayor es casi imposible bajo la hipótesis nula  rechazo H0 (no creo que H0 haya generado mis datos).

b) x obs=12.5  zobs=2  p-valor = p(Z*  zobs) = p(N(0,1)  2) = 0,0228 El valor observado tiene una probabilidad de aparecer muy pequeña si H0 es cierta, pero no es tan improbable como antes  rechazo H0 pero con “menos garantías”. 18



p-valor muy pequeño  sería muy improbable observar lo observado si H0 hubiera generado mis datos  los datos proporcionan evidencia suficiente en contra de H0  rechazo H0



p-valor grande  nuestros datos no proporcionan evidencia suficiente en contra de H0 (es probable que H0 haya generado mis datos) y no rechazo. Alternativa unilateral izquierda

zobs

Alternativa unilateral derecha

zobs

Alternativa bilateral

-zobs

zobs 19

RELACIÓN ENTRE “nivel de significación” y “p-valor” ¿Qué ocurriría en el ejemplo anterior si el nivel de significación fuera =0.01? X  10  El valor crítico sería zα=2.33  rechazaríamos H0 si Z*= 1.25  2.33

 Si x obs=12.5  zobs=2 < 2.33  No rechazo al 1% (Si rechazaba al 10%) =0.10 p-valor=0.0218 =0.01

1-

1.28 2

2.33

Rechazo H0 al 1% Rechazo H0 al 10% 

Rechazamos H0 para niveles  ≥ p-valor



No rechazamos H0 para niveles  < p-valor

p-valor = menor nivel de significación al que se rechaza H0 20

8.6. ETAPAS EN LA REALIZACIÓN DE UN CONTRASTE 1. Describir el modelo y formular la hipótesis nula y la alternativa 2. Definir un estadístico de contraste que cuantifique la discrepancia entre los datos y la hipótesis nula, y cuya distribución sea conocida bajo H0 3. Definir la región crítica: ¿Qué valores del estadístico de contraste rechazan H0? 4. Determinar el valor crítico para un nivel de significación α dado 5. Tomar los datos y calcular el valor del estadístico de contraste 4.' Tomar los datos y calcular el valor del estadístico de contraste 5.' Calcular el p-valor 6. Tomar la decisión de rechazar o no H0 21

Recommend Stories

Story Transcript

Get in touch

Social