Inferencia estadística

UNIDAD 10 I n f e r e n c i a estadística Objetivos A l f i n a l i z a r la u n i d a d , el a l u m n o : • • determinará s i u n e s t i m a d o

29 downloads 17 Views 4MB Size

Recommend Stories


V. INFERENCIA ESTADÍSTICA
V. I NFERENCIA ESTADÍSTICA . V.1. Concepto de inferencia estadística. Es el procedimiento por medio del cual se llega a conclusiones acerca de una p

7. INFERENCIA ESTADÍSTICA
7. INFERENCIA ESTADÍSTICA Dr. Edgar Acuña http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ INFERENCIA ESTADÍ

Inferencia estadística. Estimación por intervalos
12 Inferencia estadística. Estimación por intervalos 1. La distribución normal N(µ, q) ■ Piensa y calcula Y En el dibujo de la gráfica, el área com

LA INFERENCIA SOCIAL EN EDUCACIÓN
ISSN 1988-6047 DEP. LEGAL: GR 2922/2007 Nº 40 – MARZO DE 2011 “LA INFERENCIA SOCIAL EN EDUCACIÓN” AUTORÍA ÁLVARO DÍAZ ORTIZ TEMÁTICA INFERENCIAS E

Inferencia Estadística: Prueba de Hipótesis
Inferencia Estadística: Prueba de Hipótesis Inferencia Estadística: Hemos estudiado cómo a partir de una muestra de una población podemos obtener u

LA LÓGICA Y LA INFERENCIA
LA LÓGICA Y LA INFERENCIA Fernando Córdova Freyre Universidad de San Martín de Porres Ciclo Regular 2011-II Centro Preuniversitario Semana 09 fcordova

Story Transcript

UNIDAD

10

I n f e r e n c i a estadística Objetivos A l f i n a l i z a r la u n i d a d , el a l u m n o : • •

determinará s i u n e s t i m a d o r e s s e s g a d o o i n s e s g a d o resolverá p r o b l e m a s d e i n t e r v a l o s d e c o n f i a n z a

para

la m e d i a , diferencia d e m e d i a s , v a r i a n z a y p r o p o r c i o n e s •

llevará a c a b o p r u e b a s d e hipótesis p a r a l a m e d i a , diferencia d e medias, varianza y proporciones e n p r o b l e m a s d e aplicación

Introducción E n

l a u n i d a d 9 , s e a n a l i z a r o n l a s b a s e s p a r a d i s t r i b u c i o n e s muéstrales, c o n l a s c u a l e s s e

r e a l i z a n e s t i m a c i o n e s d e parámetros e n e s t u d i o ; l a s m u l t i v a r i a b l e s a l e a t o r i a s ; s e definió f o r m a l m e n t e e l muestreo e l teorema

a l e a t o r i o , y s e e s t u d i a r o n a l g u n a s d i s t r i b u c i o n e s muéstrales e m p l e a n d o

c e n t r a ! d e ! ¡imite. E l o b j e t i v o g e n e r a l d e d i c h o s t e m a s e s l a construcción d e l a s b a s e s

teóricas p a r a l a i n f e r e n c i a estadística. E n e s t a u n i d a d s e analizará e ! p r o c e s o d e inferencia

estadística, e l c u a l s e p u e d e h a c e r

d e t r e s m a n e r a s : p o r estimación p u n t u a l , i n t e r v a l o d e c o n f i a n z a o p o r p T u e b a d e Hipótesis. L o s estimadores

p u n t u a l e s , c o m o s e verá, t i e n e n g r a n i m p o r t a n c i a teórica e n l a i n f e -

r e n c i a estadística, p e r o e n l a cuestión práctica n o e s a p r o p i a d o l l e v a r l o s a c a b o c o n b a s e e n u n s o l o p u n t o ; p o r c o n s i g u i e n t e s e harán e s t i m a c i o n e s basadas

en i n t e r v a l o s .

L a o t r a área d e i n f e r e n c i a estadística q u e s e analizará e s l a p r u e b a d e hipótesis. E s d e c i r , se f o r m u l a u n a suposición d e l parámetro y b a j o c o n d i c i o n e s d e t e r m i n a d a s s e comprobará s i es válida o n o . E n l a u n i d a d 1 s e determinó q u e l a estadística d e s c r i p t i v a t r a b a j a c o n t o d o s l o s i n d i v i d u o s d e l a población o l a m u e s t r a . E n e s t a u n i d a d s e verá q u e l a estadística i n f e r e n c i a l se basa en el e s t u d i o d e m u e s t r a s , a p a r t i r d e l a s cuales

se p r e t e n d e inferir

aspectos

r e l e v a n t e s d e t o d a l a población. E n l a u n i d a d 9 s e determinó q u e e l método d e s e l e c c i o n a r m u e s t r a s t i e n e g r a n i m p o r t a n c i a e n e l d e s a r r o l l o d e l a estadística. C ó m o s e r e a l i z a l a i n f e r e n c i a y qué g r a d o d e c o n f i a n z a s e p u e d e t e n e r e n l a m u e s t r a s o n a s p e c t o s f u n d a m e n t a l e s q u e s e analizarán e n e s t a u n i d a d .

1 0 . 1 I n f e r e n c i a estadística L a i n f e r e n c i a estadística c o n s i s t e e n c r e a r métodos c o n l o s c u a l e s s e p u e d a n r e a l i z a r c o n c l u s i o n e s o i n f e r e n c i a s a c e r c a d e l a población, c o n b a s e e n información m u e s t r a l o a priori.

T a l e s métodos s e d i v i d e n e n d o s g r u p o s : 1.

Clásico.

2.

Bayesiano.

E n e l métodc clásico l a i n f e r e n c i a s e r e a l i z a m e d i a n t e l o s r e s u l t a d o s d e u n m u e s t r e o a l e a t o r i o . M i e n t r a s q u e e n e l método b a y e s i a n o l a s i n f e r e n c i a s s e r e a l i z a n ( d e f o r m a análoga a l a asignación d e p r o b a b i l i d a d e s e n l a c o r r i e n t e b a y e s i a n a ) c o n b a s e e n e l c o n o c i m i e n t o p r e v i o s o b r e l a distribución d e l o s parámetros d e s c o n o c i d o s . E l d e s a r r o l l o d e l a i n f e r e n c i a estadística e n l a p r e s e n t e u n i d a d s e hará sólo c o n e l método clásico. E l análisis c o m i e n z a c o n l a estimación d e parámetros.

286

ESTADÍSTICA Y PROBABILIDAD

10.1.1 Estimación p u n t u a l U n e s t i m a d o r es u n e l e m e n t o d e s c r i p t i v o b a s a d o e n las m e d i c i o n e s c o n t e n i d a s e n u n a m u e s t r a . P o r e j e m p l o , la m e d i a de la m u e s t r a

es u n e s t i m a d o r p u n t u a l para

la m e d i a de la población

¡JL . Q

Supóngase q u e s e q u i e r e o b t e n e r u n a i n f e r e n c i a r e s p e c t o d e l a calificación m e d i a d e t o d o s l o s a l u m n o s q u e c u r s a n l a m a t e r i a d e cálculo, p a r a e s t o s e a n a l i z a u n a m u e s t r a aleatoria de diez de ellos, cuyas calificaciones

son

8 , 4 , 9, 9, 6 , 8 , 2, 7, 3 y 6 M e d i a n t e e l p r o m e d i o d e l o s d a t o s d e u n a m u e s t r a s e c a l c u l a u n v a l o r p a r a .el estadístico X x = — ( 8 + 4 + 9 + 9 + 6 + 8 + 2 + 7 + 3 + 6) = 6.2 10 C o n b a s e e n e l v a l o r c a l c u l a d o d e l estadístico X s e p u e d e l l e v a r a c a b o u n a i n f e r e n c i a r e s p e c t o d e l parámetro yt, e s d e c i r , u n a estimación p u n t u a l d e l parámetro m e d i a r e s p e c t o d e l a s c a l i f i c a c i o n e s d e l a m a t e r i a d e cálculo. E n e s t e c a s o l a calificación p r o m e d i o e s 6 . 2 . E n general Definición 1 0 . 1

Dada una población

en donde

9

es un parámetro,

y 0 su

estadística correspondiente, se le llama

e s t i m a d o r p u n t u a l de 9 a cualquier valor 9 de 0 .

D e l a definición d e e s t i m a d o r p u n t u a l n o s e p u e d e e s p e r a r q u e d i c h o v a l o r r e a l i c e u n a estimación c e r t e r a d e l parámetro, d e h e c h o , ésta también d e p e n d e d e l estadístico utilizado. P o rejemplo,

s i l a población e s t u d i a n t i l d e l a m a t e r i a d e cálculo

tiene

calificación p r o m e d i o ¡i • 6 . 5 , y s e c o n s i d e r a u n a m u e s t r a a l a z a r d e t r e s e s t u d i a n t e s c o n c a l i f i c a c i o n e s 3 , 6 y 6 , p a r a r e a l i z a r u n a estimación d e l parámetro, s e t i e n e x = I ( 3 + 6 + 6) = 5

E s d e c i r , e l estadístico m e d i a d i f i e r e d e l parámetro e n 1 . 5 u n i d a d e s , m i e n t r a s q u e e l estadístico m e d i a n a 5 = 6 , d i f i e r e d e l parámetro e n sólo 0 . 5 . Por tanto, c o n la muestra

a n t e r i o r , e l estadístico m e d i a n a

estima

mejor el

parámetro. P e r o , qué pasará s i e n u n a s e g u n d a m u e s t r a a l e a t o r i a d e tamaño t r e s , l a s c a l i f i c a c i o n e s p a r a l a estimación d e l parámetro r e s u l t a n 4 , 4 , y 1 0 , s e t i e n e Y = I ( 4 + 4 + 10) = 6 P o r t a n t o , p a r a e s t a m u e s t r a e l estadístico m e d i a d i f i e r e d e l parámetro e n 0 . 5 u n i d a d e s , m i e n t r a s q u e e l estadístico x = 4 , d i f i e r e d e l parámetro e n 2 . 5 . E s d e c i r , c o n l a m u e s t r a a n t e r i o r e l estadístico m e d i a e s t i m a m e j o r e l parámetro. P o r t a n t o , p u e d e s e r d e interés qué e s t i m a d o r p u n t u a l p a r a u n m i s m o parámetro e s m e j o r elegir. L a r e s p u e s t a se e n c u e n t r a e n las s i g u i e n t e s d e f i n i c i o n e s .

U N I D A D

1 0 • INFERENCIA ESTADÍSTICA

287

Definición 1 0 . 2

Ejemplo 1

Dadas X ^ X

, . . ., X

2

u n a m u e s t r a a l e a t o r i a d e u n a población c u y a distribución e s

?

n o r m a l , c o n m e d i a \x y v a r i a n z a a , c o n s i d e r a n d o l o s estadísticos z

^

x x +-+x

T

'

1

1+

2

x x + x - x +x

5

1 +

10

2

7

2

3

4

,

5

3

3

se c o m p r u e b a cuáles s o n e s t i m a d o r e s i n s e s g a d o s d e 3 0 y n , > 3 0 ) , r e s p e c t i v a m e n t e , d e p o b l a c i o n e s d e las c u a l e s se d e s c o n o c e n

2

cr

2

y o~ » e l i n t e r v a l o d e c o n f i a n z a ( 1 - a ) d e 1 0 0 % p a r a V\ -

1

(*l-*l)-Z J— a

donde z , 2

7

+ — V \ ) a

300

ESTADÍSTICA

Y

PROBABILIDAD

Ejemplo 12

R e t o m a n d o l o s d a t o s d e l e j e m p l o 8 s e h i z o l a suposición d e q u e CT| = CT y s e calculó 2

u n . i n t e r v a l o d e c o n f i a n z a p a r a l a razón d e v a r i a n z a s y s e determinó s i f u e válida l a suposición, c o n 9 0 % d e c o n f i a n z a . Los resultados del conjunto 1 f u e r o n 15.8

12.7 1 3 . 2 1 6 . 9 1 0 . 6 1 8 . 8 11.1 14.3 17.0

12.5

Los resultados del conjunto 2 f u e r o n 24.9

23.6 19.8 22.1 20.4 21.6 21.8

2 2 . 5

A l c a l c u l a r l a s v a r i a n z a s muéstrales, d e l c o n j u n t o 1 s e o b t u v o Sj = 7 . 5 0 , r i j " 1 0 , y del c o n j u n t o d o s s = 2.68, n =8 . 2

7

F a l t a d e t e r m i n a r u s a n d o l a s t a b l a s p o r c e n t u a l e s d e l a distribución F l o s v a l o r e s de f / i ( i ' v

a

Vj = n

v

2 ^ y fa/l( 2> v

- l = 10- 1 = 9 y

1

v

\)

c

o

= n

7

n

9 0 % d e c o n f i a n z a ( a = 0.10 es decir, a / 2- 0 . 0 5 ) y

- 1 = 8 - 1

= 7 grados de libertad. Sebusca e n las tablas

d e l a distribución F y se o b t i e n e falPh

V 2 ) = /o.o (9. 7) = 3 . 6 7 7 / 5

y

a / 2

( v , v )= / 2

1

0 0 5

( 7 , 9) = 3.293

El intervalo de confianza resulta

^ ) - L < 4 < p l 3 . 2.68) 3.677

a ] 12.68

0.76 < ^ V < 9.22 D e l i n t e r v a l o d e c o n f i a n z a p a r a l a razón e n t r e v a r i a n z a s s e d e t e r m i n a q u e e l v a l o r 1 está c o n t e n i d o e n e l i n t e r v a l o . P o r t a n t o , c o n 9 0 % d e c o n f i a n z a s e j u s t i f i c a l a suposición d e q u e a \ = a \ , y a q u e ^H 3 0 ) , e l i n t e r v a l o d e c o n f i a n z a ( 1 - a ) d e 1 0 0 % p a r a e l parámetro b i n o m i a l p está d a d o p o r .

¡pli

fi*f

P-*-aJ—


d o n d e z^-, e s e l v a l o r d e l a distribución n o r m a l estándar, e l c u a l t i e n e u n área d e Ejemplo 13

a/2.

E n u n a muestra aleatoria d ecien posibles clientes, 7 0 prefieren d e t e r m i n a d o p r o d u c t o . S e c o n s i d e r a 9 5 % d e i n t e r v a l o d e c o n f i a n z a p a r a l a proporción d e t o d o s l o s

posibles

clientes que prefieren t a l p r o d u c t o . P a r a e l i n t e r v a l o d e c o n f i a n z a d e l a proporción p r i m e r o s e d e t e r m i n a e l v a l o r d e ésta d e p e r s o n a s q u e p r e f i e r e n e l p r o d u c t o p = — = 0 . 7 0 y q = — = 0.30 100 100 E n este caso se t i e n e 9 5 % d e c o n f i a n z a , p o r t a n t o , 1 - a = 0.95, y u s a n d o las t a b l a s p o r c e n t u a l e s d e l a distribución n o r m a l s e t i e n e z^-,

Jarona

0.70-1.96/ — - J

V

3

< p < 0 . 7 0

0

íoo

=

+

1 . 9 6 . P o r último 1.96'°100

7 0 x a 3 0

0.6102 f0.7898 2.

Intervalo de confianza para p

x

Dadas

p y p t

2

- p

2

de poblaciones e n muestras grandes.

l a s p r o p o r c i o n e s d e éxitos d e l a s m u e s t r a s a l e a t o r i a s d e tamaños

n j y n , ( n 3 0 y n., 3 0 ) , r e s p e c t i v a m e n t e y cj, = l - p

t

y q = 1 — p » e li n t e r v a l od e 2

2

c o n f i a n z a ( 1 - a ) d e 1 0 0 % p a r a l a d i f e r e n c i a e n t r e l o s d o s parámetros b i n o m i a l e s p j - p está d a d o p o r 7

i h - h ) - z J ^ ^ P donde z

a/l

i

- P z ( h - h ) ^ J ^ ^

e s e l v a l o r d e l a distribución n o r m a l estándar, e l c u a l t i e n e u n área d e a / 2 .

302

ESTADÍSTICA Y PROBABILIDAD

E j e m p l o 14

U n a f i r m a m a n u f a c t u r e r a d ecigarros distribuye dos marcas. S ise encuentra que 5 6 d e 2 0 0 f u m a d o r e s p r e f i e r e n l am a r c a A y q u e 2 9 de 150 f u m a d o r e s p r e f i e r e n l am a r c a B , se c o n s i d e r a 9 5 % d e i n t e r v a l o d e c o n f i a n z a p a r a p - p ; s e d e t e r m i n a s i e s válido s u p o n e r A

B

q u e l a población d e f u m a d o r e s p r e t i e r e l a m a r c a B , s o b r e l a m a r c a A . Dada p

la probabilidad de que 5 6 d e 200 fumadores pretieran la marca A , s u

A

estadístico r e s u l t a p

= — = 0.28 200

A A

de t a l f o r m a q u e q = 0 . 7 2 c o n rij = 2 0 0 . A s i m i s m o l a p r o b a b i l i d a d d e q u e 2 9 d e 1 5 0 p r e f i e r a n la m a r c a B resulta 29 p = 0.19 150 d e t a l f o r m a q u e cjg = 0 . 8 1 c o n n , • 1 5 0 . P o r último p a r a e l i n t e r v a l o d e 9 5 % d e A

=

B

c o n f i a n z a , d e l a s t a b l a s p o r c e n t u a l e s p a r a l a distribución n o r m a l r e s u l t a q u e z^-, - 1 . 9 6 , e m p l e a n d o l a fórmula c o r r e s p o n d i e n t e p a r a p . - p

(

0

.28-0.19)-1.96,/^^ V 200

+

i l ^ p 150

A

-

P

A

B

R

( 0 . 2 8 - 0 . 1 9 ) 1 . 9 6 ^ B

+

28x0.72

V

200

0.19x0.81 + 150

0 . 0 0 1 8 í -fB 0 . 1 7 8 2 A

Como p

A

- p 0 entonces p p . g

A

g

P o r t a n t o , n o e s válida l a suposición d e q u e l a población d e f u m a d o r e s p r e f i e r e l a m a r c a B sobre la A c o n 9 5 % de c o n f i a n z a .

Ejercicio 5 1.

Para estimar l a propuesta

d e l o s trabajadores

desempleados

e n Panamá, u n

e c o n o m i s t a t o m a u n a m u e s t r a a l azar d e 4 0 0 personas d e clase o b r e r a , 2 5 r e s u l t a r o n s i n e m p l e o . C a l c u l a l a proporción r e a l d e t r a b a j a d o r e s

donde

desempleados

e n Panamá c o n s i d e r a n d o 9 7 % d e u n i n t e r v a l o d e c o n f i a n z a . 2.

U n r e c t o r registró d e b i d a m e n t e e l p o r c e n t a j e d e c a l i f i c a c i o n e s D y F o t o r g a d a s a los estudiantes

p o r d o s profesores

universitarios d e historia. E l profesor

I

alcanzó 3 2 % c o n t r a 2 1 % d e l p r o f e s o r I I , c o n 2 0 0 y 1 8 0 e s t u d i a n t e s , r e s p e c t i v a m e n t e . C o n s i d e r a 9 0 % de i n t e r v a l o de c o n f i a n z a para la diferencia de p r o p o r c i o n e s . 3.

U n antropólogo está i n t e r e s a d o e n l a proporción d e i n d i v i d u o s q u e p r e s e n t a n b r a q u i c e f a l i a e n d o s t r i b u s indígenas. S u p o n q u e s e t o m a n m u e s t r a s i n d e p e n d i e n t e s d e c a d a u n a d e las t r i b u s y se d e s c u b r e q u e 2 4 d e c a d a 1 0 0 n a t i v o s d e l a t r i b u A y 3 6 d e c a d a 1 2 0 d e l a t r i b u B p o s e e n d i c h a característica. C o n s i d e r a 9 5 % d e i n t e r v a l o d e c o n f i a n z a p a r a l a d i f e r e n c i a p^ - p e n t r e l a s p r o p o r c i o n e s d e e s t a s d o s t r i b u s . ?

1 0 . 2 P r u e b a s d e hipótesis E n l a sección a n t e r i o r s e a n a l i z a r o n l o s i n t e r v a l o s d e c o n f i a n z a p a r a e l cálculo d e e s t i m a c i o n e s s o b r e l o s parámetros y p a r a t o m a r d e c i s i o n e s a l t r a b a j a r c o n l a población d e interés. E n e s t a sección s e estudiará o t r o método estadístico q u e p e r m i t a t o m a r d e c i s i o n e s e n p r o b l e m a s r e l a c i o n a d o s c o n p o b l a c i o n e s q u e r e s u l t a n m u y difíciles o i m p o s i b l e s de analizar en su totalidad. Por ejemplo, para poder concluir c o n cierta veracidad sobre la

UNIDAD

10 • I N F E R E N C I A

ESTADÍSTICA

v i d a p r o m e d i o d e f o c o s d e c i e r t a m a r c a , s e p u e d e f o r m u l a r u n a hipótesis, l a c u a l s e d e b e c o m p r o b a r , e s d e c i r , b u s c a r e v i d e n c i a s q u e a y u d e n a d e c i d i r s i l a hipótesis s e a c e p t a o se rechaza. Definición 1 0 . 5 Se llama

hipótesis estadística a cualquier afirmación o conjetura referente a la población.

L a comprobación d e u n a hipótesis estadística c o n s i s t e e n b u s c a r e v i d e n c i a s p a r a d e c i d i r s o b r e l a aceptación o r e c h a z o d e l a afirmación r e a l i z a d a . E n e l e j e m p l o d e l o s f o c o s s e p u e d e s u p o n e r q u e s u v i d a p r o m e d i o está p o r a r r i b a d e l a s 7 5 0 h d e duración; después d e e l e g i r u n a m u e s t r a d e t a l e s f o c o s , r e s u l t a q u e s u v i d a p r o m e d i o f u e 7 3 0 h , c o n e s t e análisis s u r g e u n c u e s t i o n a m i e n t o . ¿El r e s u l t a d o d e l a m u e s t r a e s evidenciasuficiente para indicar q u e la c o n j e t u r a r e a l i z a d a n o e s c o r r e c t a ?

E n l a comprobación d e hipótesis, l a m a n e r a óptima d e t o m a r l a decisión d e a c e p t a r o r e c h a z a r l a afirmación r e a l i z a d a sólo s e p u e d e c o n o c e r c u a n d o se a n a l i z a t o d a l a población; s i n e m b a r g o , e n l a práctica, u n a afirmación s e a c e p t a c o n b a s e e n u n a m u e s t r a a l e a t o r i a d e l a población q u e sólo i n d i c a q u e c o n l o s r e s u l t a d o s o b t e n i d o s n o e x i s t e e v i d e n c i a p a r a r e c h a z a r l a . A s i m i s m o , c u a n d o s e r e c h a z a u n a afirmación f o r m u l a d a sólo s i g n i f i c a q u e n o exisren evidencias suficientes de la m u e s t r a para aceptarla. P a r a f o r m u l a r u n a afirmación s o b r e u n s u c e s o y r e a l i z a r u n a p r u e b a d e aceptación o r e c h a z o , s u r g e l a s i g u i e n t e terminología: s e l l a m a hipótesis n u l a a l a afirmación q u e s e q u i e r a p r o b a r y s e s i m b o l i z a p o r H . A l a afirmación q u e e s o p u e s t a a l a hipótesis n u l a s e l e l l a m a hipótesis a l t e r n a , y se s i m b o l i z a p o r Hy C a b e a c l a r a r q u e l a hipótesis n u l a s i e m p r e deberá s e r e s t a b l e c i d a d e t a l f o r m a q u e e s p e c i f i q u e u n v a l o r e x a c t o d e l parámetro e n e s t u d i o , m i e n t r a s q u e l a hipótesis a l t e r n a d e b e r e p r e s e n t a r u n v a l o r d i f e r e n t e a l d e l a hipótesis n u l a . P o r e j e m p l o e n e l c a s o d e l a duración p r o m e d i o d e l o s f o c o s l a m u e s t r a tuvo una vida p r o m e d i o d e 730 h , 2 0 menos que laconjetura del fabricante, por tanto, s e f o r m u l a l a hipótesis n u l a c o m o H : \i 7 5 0 , e s d e c i r , l a v i d a p r o m e d i o d e l o s t o c o s e s m e n o r o igual que 750. Q

Q

L a hipótesis a l t e r n a c o r r e s p o n d i e n t e s e b a s a e n l a afirmación d e l f a b r i c a n t e , e l c u a l a s e g u r a q u e l a v i d a p r o m e d i o d e l o s t o c o s está p o r a r r i b a d e l a s 7 5 0 h d e duración, c o n l o q u e s e e s t a b l e c e l a hipótesis a l t e r n a c o m o H j : ¿i 7 5 0 , e s d e c i r , l a v i d a p r o m e d i o d e los focos es m a y o r a 7 5 0 . C o m o s e a p r e c i a , e l v a l o r d e l parámetro e n l a hipótesis a l t e r n a p u e d e e l e g i r s e d e n t r o de u n a i n f i n i d a dde posibilidades ya que n o seestablece u n v a l o r concreto, e n este c a s o sólo d e b e c u m p l i r c o n s e r m a y o r a 7 5 0 .

10.2.1 T i p o s d e e r r o r e s e n u n a p r u e b a d e hipótesis A l a c e p t a r o r e c h a z a r u n a hipótesis n u l a s e p u e d e n c o m e t e r c i e r t o s e r r o r e s , l o s c u a l e s d e b e n s e r mínimos. Definición 1 0 . 6 Se llama e r r o r tipo I cuando se rechaza la hipótesis nula, dado que ésta es cierta. Asimismo, se llama error tipo II cuando no se rechaza la hipótesis nula, dado que es falsa.

D a d a s l a s d e f i n i c i o n e s d e l o s d o s e r r o r e s q u e v a n implícitos a l a c e p t a r o r e c h a z a r u n a hipótesis n u l a , s u r g e d e n u e v o u n c u e s t i o n a m i e n t o .

ESTADÍSTICA Y

PROBABILIDAD

¿Cuál e s l a p r o b a b i l i d a d d e c o m e t e r alguno de los errores?

L a respuesta referente a la probabilidad d ecometer u n error tipo I o tipo I I e s f u n d a m e n t a l e n e l d e s a r r o l l o d e l a p r u e b a d e hipótesis.

D e f i n i c i ó n 10.7 S e llama nivel de significancia a la probabilidad decometer un error tipo I y se simboliza por si sécemete un error tipo II, la probabilidad se simboliza por p

Ejemplo 15

Se r e t o m a el caso d e la v i d a p r o m e d i o de los focos y se c o n s i d e r a n 49 f o c o s d e m u e s t r a y l a s hipótesis H : p 7 5 0 , H j : u 7 5 0 , l a e v i d e n c i a d e l a m u e s t r a e s t a b l e c e 7 6 0 h d e v i d a Q

p r o m e d i o , se calcula el nivel d e significancia. a = probabilidad de cometer u n error tipo I - probabilidad de rechazar H

Q

siendo verdadera

E s decir

a = 0.0026 Región d e r e c h a z o d e H

0

0

2.8

a = P ( X 760), c u a n d o u 7 5 0 P a r a c a l c u l a r l a p r o b a b i l i d a d a n t e r i o r s e u s a e l t e o r e m a c e n t r a l d e l límite

o = P ( X 760) = P

X-n

760-750

P{Z 2.8) = 0 . 0 0 2 6

E n t a l e s c o n d i c i o n e s , l a p r o b a b i l i d a d d e c o m e t e r u n e r r o r t i p o I e s pequeña; e s decir, el nivel d e significancia es 0.26%. Ejemplo 16

S e r e t o m a e l c a s o d e l a v i d a p r o m e d i o d e l o s f o c o s y s e c a l c u l a f3 p a r a n - 7 6 5 . P - probabilidad de cometer u n error tipo I I • probabilidad de aceptar H , siendo falsa 0

E s decir, P = P(X 760 c u a n d o n = 765) s e c a l c u l a l a p r o b a b i l i d a d a n t e r i o r u s a n d o e l t e o r e m a d e l límite c e n t r a l 0 = P(X76O) = P

X-n 1%/n"

^ 760-765 /^/49

= P ( Z - 1 . 4 ) = 0.0808 )

L a p r o b a b i l i d a d d e c o m e t e r u n e r r o r t i p o I I e s pequeña, e s d e c i r , 8 . 0 8 % p a r a e l c a s o e n q u e la v e r d a d e r a v i d a p r o m e d i o d e l o s f o c o s s e a i g u a l a 765 h o r a s .

UNIDAD

10

• INFERENCIA

ESTADÍSTICA

305

Ejercicio 6 1.

S e h a d e s a r r o l l a d o u n a n u e v a preparación p a r a c i e r t o t i p o d e c e m e n t o c o n u n c o e f i c i e n t e d e compresión d e 5 m i l k g p o r e r a " y u n a desviación estándar d e 1 2 0 . P a r a c o m p r o b a r l a hipótesis d e q u e \i = 5 0 0 0 , e n contraposición c o n l a a l t e r n a t i v a de u 5 0 0 0 sev e r i f i c a u n a m u e s t r a a l azar d e 5 0 piezas d e c e m e n t o . S e d e t e r m i n a q u e l a región crítica e s X 4 9 7 0 .

2.

a)

calcula la p r o b a b i l i d a d de c o m e t e r el e r r o r t i p o I c u a n d o H

b)

evalúa /? p a r a l a a l t e r n a t i v a \i = 4 9 6 0

Q

es v e r d a d e r a

S u p o n q u e X es u n a variable aleatoria n o r m a l c o n v a r i a n z a 100. S i se t o m a u n a m u e s t r a a l a z a r d e tamaño 1 6 d e X , c o m p r u e b a l a hipótesis H : \i = 1 0 c o n t r a H j : Q

H 1 0 . S i s e determinó u n a m e d i a m u e s t r a l d e 1 2 . 5 , c a l c u l a l a p r o b a b i l i d a d d e e r r o r de t i p o I I . 3.

U n a lavandería a f i r m a q u e u n n u e v o q u i t a m a n c h a s e s e f e c t i v o e n n o más d e 7 0 % d e l o s c a s o s e n q u e s e u t i l i z a . P a r a c o m p r o b a r e s t a afirmación s e a p l i c a e l p r o d u c t o e n doce m a n c h a s t o m a d a s a l azar. S i m e n o s d e o n c e s o n e l i m i n a d a s se acepta l a hipótesis n u l a d e q u e p " 0 . 7 ; d e o t r a f o r m a s e c o n c l u y e p 0 . 7 . a)

evalúa a , s u p o n i e n d o p = 0 . 7

b)

evalúa /? p a r a l a a l t e r n a t i v a p = 0 . 9

P a r a l a comprobación d e hipótesis s e t i e n e n l o s m i s m o s c a s o s q u e e n l o s i n t e r v a l o s d e c o n f i a n z a . L a formulación d e l a s hipótesis n u l a y a l t e r n a comúnmente c a u s a c i e r t o d e s c o n c i e r t o . P a r a d i f e r e n c i a r a l a hipótesis n u l a d e l a a l t e r n a y s i m p l i f i c a r l o s e j e m p l o s y e j e r c i c i o s , e l análisis d e l i m i t a q u e l a s hipótesis a v e r i f i c a r s i e m p r e estén f o r m u l a d a s c o n , o = . D e t a l f o r m a q u e e n l o s d o s p r i m e r o s c a s o s éstas serán l a s hipótesis a l t e r n a s c o r r e s p o n d i e n t e s , m i e n t r a s q u e e n e l t e r c e r o s e r e f i e r e a l a hipótesis n u l a . P u e s t o q u e e n l a p r u e b a d e hipótesis y l o s i n t e r v a l o s d e c o n f i a n z a s e t i e n e n l o s m i s m o s c a s o s y s u s c o n d i c i o n e s p a r a l a aplicación s o n l a s m i s m a s , s e s i m p l i f i c a e l t r a b a j o , r e s u m i e n d o únicamente l a s fórmulas p a r a l a s hipótesis n u l a s y s u s hipótesis a l t e r n a s r e s p e c t i v a s c o n s u s estadísticos y r e g i o n e s d e r e c h a z o c o r r e s p o n d i e n t e s , p a r a c a d a u n o d e los diferentes t e m a s : m e d i a s (tres casos), diferencia d e m e d i a s (cinco), v a r i a n z a s (dos) y proporciones (dos). P a r a l a p r u e b a d e hipótesis s e r e c o m i e n d a s e g u i r l o s s i g u i e n t e s p a s o s : • e s t a b l e c e r l a hipótesis n u l a • e s t a b l e c e r l a hipótesis a l t e r n a • fijar el nivel de significancia • e l e g i r e l estadístico p a r a l a p r u e b a d e hipótesis • c o n b a s e e n l o a n t e r i o r e n c o n t r a r l a región d e aceptación y r e c h a z o • c a l c u l a r e l v a l o r d e l estadístico c o r r e s p o n d i e n t e y , c o n b a s e e n éste, a c e p t a r o r e c h a z a r l a hipótesis n u l a

ESTADÍSTICA Y

PROBABILIDAD

10.2.2 P r u e b a s d e hipótesis p a r a m e d i a s d e p o b l a c i o n e s a p r o x i m a d a m e n t e n o r m a l e s c o n v a l o r crítico a Hipótesis nula

Caso

V a l o r d e l estadístico de prueba

M

Cuando se conoce o

2

s/yfñ

f f



~

z

a l 2

z

M M

0

M P

0

Distribución t - S t u d e n t c o n v = n - 1 g. 1 . s varianza insesgada



~

z

a l 2

z

a

/

2



a / z

z

a

a

y

t - t

t - t

2

a

Y

¿ z

0

2

a

z - z

0

Distribución Z s varianza insesgada

P=t0

Z Z

f f o

o/yfñ

Mf

Cuando se desconoce a, y m u e s t r a s pequeñas

Z - Z

/*o

Distribución Z Cuando se desconoce o, y muestras grandes

Región c r i t i c a correspondiente

Hipótesis alterna

z



a / 2

Z

a

y t t

a

¡

2

1 . U n a máquina p r o d u c e p i e z a s metálicas d e f o r m a c i l i n d r i c a , s e t o m a u n a m u e s t r a a l a z a r d e p i e z a s c u y o s diámetros s o n 9 . 8 , 9 . 5 , 9 . 8 , 1 1 . 5 , 9 . 0 , 1 0 . 4 , 9 . 8 , 1 0 . 1 y 1 1 . 2 m m . S e s u p o n e q u e l o s diámetros t i e n e n u n a distribución a p r o x i m a d a m e n t e n o r m a l . S i e l f a b r i c a n t e a f i r m a q u e e l diámetro p r o m e d i o e s 1 0 m m , s e d e t e r m i n a r e s p e c t o d e e s t a afirmación c o n 0 . 0 1 d e n i v e l d e s i g n i f i c a n c i a .

Ejemplo 17

S e p i d e u n a p r u e b a d e hipótesis p a r a l a m e d i a , c o m p r o b a n d o q u e ésta e s i g u a l a 1 0 m m , e n t a l c a s o , d e a c u e r d o c o n d a t o s muéstrales, l a hipótesis a l t e r n a será e l o p u e s t o , e s d e c i r , d i f e r e n t e d e d i e z . S e s i g u e n l o s p a s o s p a r a u n a p r u e b a d e hipótesis. a) b) c) d)

H : =10 Q

M

Hj:/iítl0 nivel de significancia a =0 . 0 1 estadístico d e p r u e b a , p r i m e r o s e i d e n t i f i c a a cuál d e l o s t r e s c a s o s a n t e r i o r e s c o r r e s p o n d e , s e i n d i c a q u e n o s e c o n o c e s y q u e l a m u e s t r a e s pequeña; p o r t a n t o , _ * - f t )

f

e)

p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b), s e d e t e r m i n a q u e s e t r a t a d e u n a p r u e b a d e d o s c o l a s , y d e l i n c i s o d), q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución t - S t u d e n t ^ p o r l o q u e l a región d e r e c h a z o está d a d a p o r t-t-ytt„ a/2 ' a/1 C o n b a s e e n e l i n c i s o c), s e t i e n e a = 0 . 0 1 , d o n d e a / 2 • 0 . 0 0 5 . P o r o t r o l a d o , e l tamaño d e l a m u e s t r a e s n = 9 , d o n d e v = 9 - 1 = 8 g r a d o s d e l i b e r t a d . P o r t a n t o , d e l a s t a b l a s p o r c e n t u a l e s d e l a distribución t - S t u d e n t r e s u l t a l a región d e r e c h a z o C

Región d e r e c h a z o , cola izquierda

-Itlííil

-3.355

Región d e r e c h a z o , cola derecha

R e c ion d e a c e atación 0

3.355

<

- 0OO5 t

=

-

3

3

5

5

y

t

> 0.005 t

=

3

-

3 5 5

UNIDAD

/)

10

• INFERENCIA

ESTADÍSTICA

307

p a r a c a l c u l a r e l estadístico t , p r i m e r o s e d e t e r m i n a n l o s d a t o s d e l a m e d i a y l a desviación estándar m u e s t r a l c a l c u l a n d o l o s n u e v e d a t o s , s e t i e n e x = 1 0 . 1 2 2 2 y s - 0.7981, donde 10.1222-10 0.7981/79

: 0.4593

C o m o d i c h o v a l o r se e n c u e n t r a e n l a región d e aceptación, l a hipótesis n u l a se a c e p t a y , p o r t a n t o , s e d e t e r m i n a q u e c o n n i v e l d e s i g n i f i c a n c i a d e a = 0 . 0 1 e s válida l a afirmación d e l f a b r i c a n t e . S e t o m a u n a m u e s t r a a l a z a r d e 3 6 v a s o s s u m i n i s t r a d o s p o r u n a máquina d e r e f r e s c o s q u e s i r v e p o r v a s o u n c o n t e n i d o p r o m e d i o d e 2 1 . 9 d i , c o n desviación estándar d e 1 . 4 2 d i . S e c o m p r u e b a l a hipótesis t i = 2 2 . 2 d i c o n t r a l a hipótesis a l t e r n a u < 2 2 . 2 c o n nivel de significancia 0.05. a)

H -.u=22.2

b)

H,:u732

cj

nivel de significancia a = 0.025

d)

estadístico d e p r u e b a ; p r i m e r o s e i d e n t i f i c a a cuál d e l o s t r e s c a s o s c o r r e s p o n d e ,

0

s i e n d o q u e s e c o n o c e cr; p o r t a n t o , cr/Vñ p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b), s e d e t e r m i n a q u e s e

e)

t r a t a d e u n a p r u e b a d e u n a c o l a , y d e l i n c i s o d), q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución n o r m a l , p o r l o q u e l a región d e r e c h a z o está d a d a p o r ?

a-

>Z

C o n b a s e e n e l i n c i s o c), s e t i e n e q u e a = 0 . 0 2 5 . P o r t a n t o , d e l a s t a b l a s p o r c e n t u a l e s d e l a distribución n o r m a l l a región d e r e c h a z o r e s u l t ? , >r

p p 2 5

=1.96 Región d e r e c h a z o

<

• Región d e aceptación

/)

1.96

s e c a l c u l a e l estadístico z, x = 7 6 . 7 y O" = 8 . 6 , d o n d e z=

76.7-73.2 , •— = 2 . 7 3 8.6/V45

C o m o d i c h o v a l o r s e e n c u e n t r a e n l a región d e r e c h a z o , l a hipótesis n u l a s e rechaza con n i v e l de significancia de

2.5%.

Ejercicio 7 1.

U n f a b r i c a n t e d e máquinas d e r e f r e s c o s a s e g u r a q u e s u s máquinas s u m i n i s t r a n u n p r o m e d i o de 2 5 0 m m p o r vaso, p e r o d e b i d o a a l g u n a s quejas d e los c o n s u m i d o r e s sobre u n a m 4 q u i n a e nparticular decide verificarla, para lo cual t o m a u n a muestra d e 2 0 v a s o s , o b t e n i e n d o 2 4 5 m m d e m e d i a c o n desviación estándar d e 1 1 . C a l c u l a c o n 0 . 1 0 d e n i v e l d e significación, s i e s c i e r t a l a afirmación d e l f a b r i c a n t e .

2.

C o m p r u e b a l a hipótesis d e q u e e l c o n t e n i d o p r o m e d i o d e l o s e n v a s e s d e u n l u b r i c a n t e esde d i e z l i t r o s si los c o n t e n i d o s de u n a m u e s t r a a l e a t o r i a d e diez envases s o n 1 0 . 2 , 9.7, 1 0 . 1 , 1 0 . 3 , 1 0 . 1 , 9 . 8 , 9.9, 10.4, 1 0 . 3 y 9 . 8 1 . U t i l i z a 0 . 0 1 d e n i v e l d e s i g n i f i c a n c i a y s u p o n q u e l a distribución d e l o s c o n t e n i d o s e s n o r m a l .

3.

U n i n v e s t i g a d o r a f i r m a q u e e l p r o m e d i o d e a c c i d e n t e s e n u n a fábrica e s i n f e r i o r a o n c e . A l t o m a r u n a m u e s t r a a l a z a r d e tamaño 3 6 , s e o b t i e n e q u e X = 1 0 y S = 9 . 2

C a l c u l a si se p u e d e a p o y a r a l i n v e s t i g a d o r c o n base e n l o s r e s u l t a d o s d e l a m u e s t r a a nivel de 1 % .

U N I D A D

10

• INFERENCIA

ESTADÍSTICA

309

U n investigador a f i r m a q u e e l p r o m e d i o d e accidentes e n u n a fabrica es i n f e r i o r a

4.

t r e c e . A l t o m a r u n a m u e s t r a a l a z a r d e tamaño 3 6 , s e o b t i e n e u n a m e d i a y u n a v a r i a n z a d e 10 y 9, r e s p e c t i v a m e n t e . C a l c u l a si se p u e d e apoyar a l investigador c o n base e n los resultados d e l a m u e s t r a a n i v e l de 1 % .

10.2.3 P r u e b a s p a r a l a d i f e r e n c i a d e m e d i a s d e p o b l a c i o n e s a p r o x i m a d a m e n t e n o r m a l e s c o n v a l o r crítico a V a l o r d e l estadístico de prueba

Hipótesis nula

Caso

Hipótesis alterna

R e g i ó n crítica z

2

z < - z

Ml~/*2> 0

z > z

d

n

V "1

d

z

/*1 - P 2 < 0 d

2

2

¿

"

w 2 a

a

2

Distribución Z 2 2

H - f t * o d

z

<

- a l 2 z

V

z

>

z

a / 2

varianzas insesgadas ( X, - % ) - £¡

/*1-/*2> 0

t > t

d

= 0

^1

d

j(n,-l) r+(n -l)i 5

V

2

2

2

d

/*1 ->"2 *

0

*< a l 2 Y

>

f

Pl-f*2< 0

* < - * m

/*1 - M > o

'>*+ay»2> Distribución t - S t u d e n t c o n v =» +n — 2 grados de libertad. E n d o n d e

h

Cuando se desconocen a\ y a pero se sabe q u e

P,-P2< 0 d

C

Cuando se desconocen a\ y a j pero s e sabe q u e o,=o¡ para muestras pequeñas.

d

2

d

grado; . d e libertad 2

pequeñas.

i f

n,

n

. t < - t

2

a

l

2

y t > t

a

¡

2

n

( i) ("i"

Cuando se desconocen °\yo\ pero se sabe q u e son observaciones pareadas, para m u e s t r a s pequeñas.

t < - t

_d-d

a

0

f D> 0 l

f*D =

0

d

d

Distribución t - S t u d e n t s con v =» - 1 grados de libertad Í ¿ varianza insesgada de lasobservaciones pareadas

t*D* 0 d

*< a / 2 Y '

> a/2 c

P a r a d e t e r m i n a r e l r e n d i m i e n t o d e c o m b u s t i b l e e n d o s m a r c a s d e automóviles c o n características s i m i l a r e s s e experimentó c o n d o c e automóviles m a r c a V y d i e z m a r c a I e n pruebas de velocidad tija d e 9 0 k m p h . Para los d e la m a r c a V se o b t u v i e r o n 16 k m p l c o n desviación estándar d e 1 . 0 k m p l y p a r a l o s d e l a m a r c a I e l p r o m e d i o t u e 1 1 k m p l , c o n desviación estándar d e 1 . 8 k m p l . S e s u p o n e q u e l a d i s t a n c i a p o r l i t r o p a r a c a d a m o d e l o d e l automóvil s e d i s t r i b u y e a p r o x i m a d a m e n t e e n f o r m a n o r m a l c o n v a r i a n z a s i g u a l e s . S e c o m p r u e b a l a hipótesis r e f e r e n t e a q u e l o s automóviles m a r c a V e n p r o m e d i o e x c e d e n a los d e l a marca 1 p o r 4 k m p l u t i l i z a n d o a ' 0 . 1 0Las varianzas p.oblacionales

son

diferentes. S e p i d e u n a p r u e b a d e hipótesis p a r a l a d i f e r e n c i a d e m e d i a s , d o n d e s e t i e n e q u e c o m p r o b a r q u e e l r e n d i m i e n t o p r o m e d i o p o r l i t r o d e l o s automóviles m a r c a V e x c e d e e l r e n d i m i e n t o d e l o s d e l a m a r c a I e n 4 k m p l . D e t a l f o r m a q u e l a hipótesis a l t e r n a q u e d a d e dos colas. S e representa p o r ix e l p r o m e d i o d e l r e n d i m i e n t o p o r t

l i t r o d e l o s automóviles m a r c a V y p o r

a los d e l a marca I .

a)

H : n

b)

H,:u,

c)

n i v e l d esignificancia a " 0.10

d)

estadístico d e p r u e b a ; p r i m e r o s e i d e n t i f i c a a cuál d e l o s c i n c o c a s o s a n t e r i o r e s

n

^ = 4

c o r r e s p o n d e , d a d o q u e n o se c o n o c e l av a r i a n z a p o b l a c i o n a l y l a s m u e s t r a s s o n pequeñas, c o n v a r i a n z a s p o b l a c i o n a l e s d i f e r e n t e s , s e t i e n e (x,

i)-d

0

•s](s¡/n ) + ( s l / n ) 1

2

p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b), s e d e t e r m i n a q u e s e t r a t a d e u n a p r u e b a d e d o s c o l a s , y d e l i n c i s o d), q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución t - S t u d e n t , p o r l o q u e l a región d e r e c h a z o está d a d a p o r t < - t _ y t > - ta/2 a/2 '

<

C o n b a s e e n e l i n c i s o c), s e t i e n e q u e a = 0 . 1 0 , d o n d e a/2 = 0 . 0 5 . L o s g r a d o s de l i b e r t a d se c a l c u l a n m e d i a n t e '2 n, 2

f n

n

2

"1 12

2

í 2 ~\

"i

v l,

2 "

,"1-1

1 n

2

1

V 10 ; u o - i

12; U 2 - U

- l j

= 13.4946 = 13

W 3 . 2 4

P o r t a n t o , u s a n d o l a s t a b l a s p o r c e n t u a l e s d e l a distribución t - S t u d e n t c o n 1 3 g r a d o s d e l i b e r t a d r e s u l t a l a región d e r e c h a z o C

á ead. 1 - | r

n

'f f /2 >

a

{

v

^

"2)área d e r . f

1 . S e d e t e r m i n a q u e u n a máquina d e r e f r e s c o s está f u e r a d e c o n t r o l s i l a v a r i a n z a d e l o s c o n t e n i d o s e x c e d e 1.15 d i . S e t o m a u n a m u e s t r a a l e a t o r i a d e 2 5 r e f r e s c o s c o n v a r i a n z a de 2 . 0 3 d i . S e calcula c o n 0 . 0 5 d e n i v e l d e significancia

s i l a máquina está f u e r a d e

c o n t r o l y s e s u p o n e q u e l o s c o n t e n i d o s t i e n e n u n a distribución n o r m a l . E n e s t e e j e r c i c i o l a p r u e b a d e hipótesis s e r e f i e r e a u n a v a r i a n z a , s e c o m p r u e b a s i ésta e s m a y o r q u e 1 . 1 5 d i . a)

H : a = 1.15

b)

H , : a > 1.15

c)

nivel d e significancia

0

2

:

a = 0.05

U N I D A D

d)

315

ESTADÍSTICA

estadístico d e p r u e b a ; aquí sólo s e t i e n e u n c a s o p a r a l a v a r i a n z a ; p o r t a n t o 2

(n-l)s

-o e)

1 0 • INFERENCIA

2

2

p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b ) , s e d e t e r m i n a q u e s e t r a t a d e u n a p r u e b a d e u n a c o l a , y d e l i n c i s o d), q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución ji p o r l o q u e l a región d e r e c h a z o está d a d a p o r

x >xl 1

área d e r e c h a . C o n b a s e e n e l i n c i s o c), s e t i e n e a • 0 . 0 5 . P o r t a n t o , d e l a s t a b l a s p o r c e n t u a l e s d e l a distribución j i " c o n v = n - l = 2 5 - l = 2 4 g r a d o s d e l i b e r t a d , r e s u l t a l a región d e r e c h a z o

X >xl=

¿ios

2

= 36.415 Región d e r e c h a z o

Región d e aceptación

36.415

P a r a c a l c u l a r e l estadístico X , s e t i e n e , d e l o s d a t o s d e l e n u n c i a d o , s = 2 . 0 3 2

yn=25. z

*

_(n-l)s

Z

_(25-l)x2.03



=

= 42.365

1-15

C o m o d i c h o v a l o r s e e n c u e n t r a e n l a región d e r e c h a z o , l a hipótesis n u l a se r e c h a z a c o n u n n i v e l d e s i g n i f i c a n c i a d e 0 . 0 5 , p o r t a n t o , l a máquina está f u e r a de c o n t r o l . Se c o m p a r a n d o s t i p o s d e rosca d e t o r n i l l o para d e t e r m i n a r s u resistencia a l a tensión. S e p r u e b a n d o c e p i e z a s d e c a d a t i p o d e c u e r d a b a j o c o n d i c i o n e s s i m i l a r e s , obteniéndose l o s s i g u i e n t e s r e s u l t a d o s ( e n k g ) Tipo d e rosca

1

2

3

4

5

6

7

8

9

10

11

12

1

78

76

80

79

78

80

82

81

79

83

80

82

2

83

80

82

83

81

80

79

80

82

78

79

81

C o n 0 . 1 0 d e n i v e l d e s i g n i f i c a n c i a , s e c o m p r u e b a s i e s j u s t i f i c a b l e l a suposición de que a \ = a \ . C o m o n o s e t i e n e ningún c a s o p a r a d i f e r e n c i a d e v a r i a n z a s s e p u e d e d i v i d i r e n t r e l a v a r i a n z a 2 y o b t e n e r u n a razón e n t r e v a r i a n z a s , d e t a l f o r m a q u e

«0

b)

H

0

: 4

= l

H , : 4 * l °"2

c)

nivel de significancia a - 0.10

316

ESTADÍSTICA Y PROBABILIDAD

estadístico d e p r u e b a ; aquí sólo s e t i e n e u n c a s o p a r a l a razón e n t r e v a r i a n z a s ; p o r tanto

d)

' 4 s

e)

2

p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b), s e d e t e r m i n a q u e s e t r a t a d e u n a p r u e b a d e d o s c o l a s , y d e l i n c i s o d), q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución F p o r l o q u e l a región d e r e c h a z o está d a d a p o r

C o n b a s e e n e l i n c i s o c), s e t i e n e a • 0 . 1 0 , d o n d e a/2 = 0 . 0 5 . P o r t a n t o , d e l a s t a b l a s p o r c e n t u a l e s d e l a distribución F c o n v = v , » 1 1 g r a d o s d e l i b e r t a d , r e s u l t a l a región d e r e c h a z o {

/<

o .

= — — = 0 . 3 5 5 y / > / 0 , ( 1 1 , 11) = 2 . 8 1 8 ( 1 1 , 1 1 ) 2.8 1 8 0

/

0 0 5

J 0 0 5

m

» 0.355

Región d e r e c h a z o

»

Región d e aceptación 2 . 8 1 8

P a r a c a l c u l a r e l estadístico / s e d e t e r m i n a n l a s v a r i a n z a s i n s e s g a d a s d e l o s d a t o s muéstrales sj

2.61

C o m o d i c h o v a l o r s e e n c u e n t r a e n l a región d e aceptación, l a hipótesis n u l a se a c e p t a c o n n i v e l d e s i g n i f i c a n c i a d e 0 . 1 0 y s e j u s t i f i c a l a suposición d e q u e o " = . 1

Ejercicio 9 1.

S e c o n o c e q u e l av a r i a n z a d e los p u n t a j e s d e lectura para los e s t u d i a n t e s d e sexto año d e p r i m a r i a e s 1 . 4 4 . S e t o m a n a l a z a r 2 1 e s t u d i a n t e s d e s e x t o año a l o s q u e s e l e s p r o p o r c i o n a u n c u r s o e s p e c i a l d e l e c t u r a , después d e l c u a l l a v a r i a n z a d e l o s p u n t a j e s d e l e c t u r a e s 1 . 0 5 . C a l c u l a s i ésta e s s u f i c i e n t e c o n n i v e l d e significación d e 0 . 0 5 p a r a d e t e r m i n a r si e l c u r s o e s p e c i a l la r e d u c e .

2.

U n a máquina p r o d u c e p i e z a s metálicas d e f o r m a c i l i n d r i c a . S e t o m a u n a m u e s t r a d e p i e z a s a l a z a r c u y o s diámetros s o n 9 . 8 , 9 . 8 , 9 . 8 , 1 1 . 5 , 9 . 0 , 1 0 . 4 , 1 0 . 0 , 1 0 . 0 , 1 1 . 0 y 1 2 . 0 m m . S u p o n q u e l o s diámetros t i e n e n u n a distribución a p r o x i m a d a m e n t e n o r m a l . S i e l f a b r i c a n t e d e l a s máquinas i n d i c a q u e s u máquina está d e s a j u s t a d a c u a n d o l a v a r i a n z a d e l o s diámetros d e l a s p i e z a s metálicas p r o d u c i d a s e x c e d e 0 . 5 m m , c a l c u l a c o n n i v e l d e s i g n i f i c a n c i a d e 0 . 0 1 s i l a máquina está d e s a j u s t a d a .

3.

S e s a b e q u e e l c o n t e n i d o d e n i c o t i n a d e u n a c i e r t a m a r c a d e c i g a r r i l l o s está n o r m a l m e n t e d i s t r i b u i d a c o n u n a v a r i a n z a d e 1 . 3 m g . C o m p r u e b a l a hipótesis a - - 1.3e ncontra del a alternativa a

1

* 1.3 , s iu n a m u e s t r a aleatoria d e o c h o

c i g a r r i l l o s t i e n e desviación estándar d e 1 . 8 . U t i l i z a 0 . 0 5 d e n i v e l d e s i g n i f i c a n c i a .

U N I D A D

1 0 • INFERENCIA

ESTADÍSTICA

317

10.2.5 P r u e b a s p a r a m u e s t r a s g r a n d e s Hipótesis nula

Caso

V a l o r d e l estadístico de prueba _

P a r a e l parámetro/», muestras grandes

P=Po

Hipótesis alterna

x-np

0

Distribución z, x e s c a n t i d a d d e éxitos e n l a m u e s t r a d e tamaño n

Región crítica correspondiente

PPo

z > z

P*Po

z

<

- al2Y z

-P

z < - z

a

z > z

P,-P2>P0

Distribución z , p = —

a

z

al2

z

al2

a

l

Para;, - p de muestras pequeñas 2

Pl - i 2 = í o )

p = „ 2

P=„1„

y

Pl~P2*Po

z

<

- al2Y z

z

>

c a n t i d a d e s d e éxitos e n l a s m u e s t r a s d e tamaño «1 y » ' respectivamente 2

Ejemplo 20

1 . U n a f i r m a m a n u f a c t u r e r a d e cigarros d i s t r i b u y e d o s marcas. S i se d e t e r m i n a q u e 5 6 de 2 0 0 fumadores prefieren la marca A y que 2 9d e 150 f u m a d o r e s prefieren l a marca B, se c a l c u l a c o n n i v e l d e s i g n i f i c a n c i a d e 0 . 0 6 s i l a m a r c a A a v e n t a j a e n v e n t a s a l a B . E s t o sepuede c o m p r o b a r m e d i a n t e u n a diferencia d e p r o p o r c i o n e s . a) b) c) d)

H

0

: p

A

- f >

B

= 0

H,:p -í> >0 nivel d esignificancia a = 0.06 A

B

estadístico d e p r u e b a ; aquí sólo s e t i e n e u n c a s o p a r a l a d i f e r e n c i a d e p r o p o r c i o n e s ; por tanto z

_

h-Pi-Po ^Wa/n +l/n ) A

e)

B

p a r a l o c a l i z a r l a región d e aceptación y r e c h a z o d e l i n c i s o b ) , s e d e t e r m i n a q u e s e t r a t a d e u n a p r u e b a d e u n a c o l a , y d e l i n c i s o d ) , q u e e l estadístico d e p r u e b a está b a s a d o e n l a distribución Z , p o r l o q u e l a región d e r e c h a z o está d a d a p o r z>z Con

a

base e n e l i n c i s o c), se t i e n e a = 0 . 0 6 . P o r t a n t o , d e l a s t a b l a s

p o r c e n t u a l e s d e l a distribución Z , r e s u l t a l a región d e r e c h a z o z>z

1

>

M

-

1.5548 Región d e r e c h a z o

+

• Región d e aceptación

1.5548



P a r a c a l c u l a r e l estadístico z l a s v a r i a b l e s s o n X y X g , q u e r e p r e s e n t a n a losf u m a d o r e s e n favor d e las marcas A y B, respectivamente, d e t a l m a n e r a q u e l a s p r o p o r c i o n e s c o r r e s p o n d i e n t e s están d a d a s p o r A

n

A

A

200

n

150

B

mientras que

?

. * f i + a n + n A

B

3

J 6 + 2 L . 200 + 150

0 . 2 4 3 y 4 = 1 - ^ = 1 - 0 . 2 4 3 = 01757

Por tanto, 0.28 - 0 . 1 9 3 - 0

h^Pj-_Po__ ^(l/i^+l/n,)

7°-

243

x

0.757(1/200+

= 1.878 1/150)

C o m o d i c h o v a l o r s e e n c u e n t r a e n l a región d e r e c h a z o , l a hipótesis n u l a s e r e c h a z a c o n u n n i v e l d e s i g n i f i c a n c i a d e 0 . 0 6 ; p o r t a n t o , l a suposición d e q u e l a m a r c a A aventaja e n ventas a la m a r c a B se justifica. U n c a n a l t e l e v i s i v o a s e g u r a q u e l a a u d i e n c i a q u e m i r a c i e r t o p r o g r a m a e l sábado p o r l a n o c h e es 4 0 % . S e t o m o a l azar u n a m u e s t r a d e c i e n t e l e v i d e n t e s , a q u i e n e s se entrevistó, d a n d o c o m o r e s u l t a d o q u e 4 5 d e e l l o s veían e l p r o g r a m a . C o n 2 . 5 % d e n i v e l d e s i g n i f i c a n c i a s e c o m p r u e b a s i l a afirmación e s válida. L a prueba se trata de p r o p o r c i o n e s , d o n d e se d e f i n e u n a variable X = " c a n t i d a d d e p e r s o n a s q u e m i r a n d i c h o p r o g r a m a l o s sábados p o r l a n o c h e " .

b)

H : p = 0.40 H,:t>>0.40

c) d)

n i v e l d e significancia a = 0.025 estadístico d e p r u e b a ; aquí sólo s e t i e n e u n c a s o p a r a l a s p r o p o r c i o n e s ; p o r t a n t o ,

a)

0

_

x-npo V ¡>o

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.