Story Transcript
8. INTERVALOS DE CONFIANZA Al estimar el valor de un parámetro de la distribución teórica, no se provee información sobre la incertidumbre en el resultado. Esa incertidumbre es producida por la dispersión de la distribución teórica del estimador. La incertidumbre se expresa cuantitativamente mediante un intervalo que tenga una probabilidad especificada de contener al valor verdadero del parámetro. A ese intervalo se lo denomina intervalo de confianza de la estimación. En general, tendremos:
P( θ l. inf < θ < θ l. sup) = 1 - α ; d o n d e θ l. inf e s e l l í m i t e i n f e r i o r d e l i n t e r v a l o d e c o n f i a n z a , y θ l. sup s u l í m i t e s u p e r i o r . 1 - α es la probabilidad que el intervalo de confianza incluya al valor verdadero del parámetro θ, a esa probabilidad se la denomina n i vel de c o n f i an za A continuación describimos algunos métodos para estimar los intervalos de confianza para varios parámetros.
Para la media (varianza conocida). Sea X una variable aleatoria normal, con media µ desconocida, y desvío σ co nocido. Se obtiene una muestra de tamaño n; la media muestral es X . Sabemos que la variable aleatoria:
Z
=
X − µ
(σ / n )
,
tiene distribución normal (0,1). Esta es una propiedad importante, que permite construir i n t e r va l o s d e c o n f i a n z a p a r a e l p a r á m e t r o d e s c o n o c i d o. Z d e p e n d e d e l p a r á m e t r o d e s c o n o c i d o µ, pero la distribución de Z no depende de él (pues Z ~N (0,1)). A continuac ión, busc amos do s valo res de Z, Z1 - α/ 2 y Zα/ 2 t ales que se cumpla:
P ( Z
1 −α / 2
< Z < Z α /2 ) = 1 − α ;
d o n d e α e s u n va l o r d e p r o b a b i l i d a d . L a p r o b a b i l i d a d 1 –α e s e l n i v e l d e c o n f i a n z a . L o s va l o r e s m á s c o m u n e s q u e s e a s i g n a n a 1 – α s o n 9 5 % , ó 9 9 % , ó 9 9 , 9 % . Ve r e m o s m á s a d e l a n t e e l s i g n i f i c a d o d e l a p r o b a b i l i d a d α. L o s v a l o r e s d e Z 1 - α / 2 y d e Z α / 2 s e o b t i e n e n d e l a s t a b l a s d e l a d i s t r i b u c i ó n n o r m a l ; c a d a u n o d e e s o s va l o r e s d e j a u n a c o l a c o n p r o b a b i l i d a d α/ 2 ( a l a izquierda de Z1 - α/ 2 , y a la derecha de Zα/ 2 ). La cantidad subescrita indica la probabilidad a l a d e r e c h a d e l va l o r d e Z . L a s i g u i e n t e F i g u ra i l u s t ra e l s i g n i f i c a d o d e l o s s í m b o l o s Z α / 2 y Z 1 α/2.
VIII- 1
Function Plot (adstudy.sta 25v*50c) normal(x,0,1) 0.8 0.7
1−α/2 = 0,975
0.6
f(z)
0.5
α/2 = 0,025
0.4 0.3
1,96
-1,96 0.2 0.1 0 -3
-2
-1
0
1
2
3
z
Ejem pl o . S u p o n e m o s q u e q u e r e m o s h a l l a r u n i n t e r va l o d e c o n f i a n z a d e l 9 5 % p a r a l a m e d i a ( c o n o c e m o s e l va l o r d e l a va r i a n z a ) . E l p r i m e r p a s o c o n s i s t e e n c a l c u l a r l o s va l o r e s Z i , y Zs tales que: P ( Z
1 −α / 2
< Z < Z α
/ 2)
=
0, 95 ;
D e l a Ta b l a d e l a d i s t r i b u c i ó n n o r m a l ( 0 , 1 ) o b t e n e m o s : Z0,975 = –1,96; y Z0,025 ≡ Zs = 1,96. Observemos que
Z1-α/2 = – Zα/2
, por la simetría de la distribución normal.
De la relación
P ( Z
1 − α /2
< Z < Zα
/2
) =1 − α ;
ó, equivalentemente,
P
−Z α
/2
<
(
X −µ σ/ n
)
< Za
/2
= 1 − α .
Se obtiene
P ( x − Z α /2
σ n
< µ < x + Z α /2
σ n
) = 1 – α .
El intervalo indicado es el intervalo de confianza con un nivel de confianza del (1– α) por ciento. Es imprescindible indicar el nivel de confianza. Los límites del intervalo de confianza dependen de esa probabilidad, y del valor observado x de la media muestral X , y del σ de la distribución. El ancho del intervalo de confianza es 2
Z
α /2
σ/
n . A mayor nivel de confianza, más
grande el valor de Zα/ 2 ; y por consiguiente más grande el ancho del intervalo de confianza. En o t r a s p a l a b r a s , a m a y o r p r o b a b i l i d a d d e q u e e l i n t e r v a l o d e c o n f i a n z a c o n t e n g a a µ, m a y o r l a i n c e r t i d u m b r e s o b r e e l v a l o r q u e t i e n e µ.
VIII- 2
Ejem pl o . S u p o n g a m o s q u e X = 1 5 , 4 ; σ = 2 , 3 ; y e l t a m a ñ o d e l a m u e s t ra e s n = 9 . E l i n t e r va l o d e c o n f i a n z a d e l 9 5 % p a r a l a m e d i a µ d e l a d i s t r i b u c i ó n d e X , e s : Lim. inferior = 13,9 Lim. superior = 16,9 Po r c o n s i g u i e n t e , h a y u n 9 5 % d e p r o b a b i l i d a d d e q u e e s e i n t e r va l o d e c o n f i a n z a c o n t e n g a a la media µ. E n l a p r á c t i c a , e s p r o b a b l e q u e s i n o s e c o n o c e e l v a l o r d e µ, t a m p o c o s e c o n o z c a e l v a l o r de σ.
Para la media (varianza de sconocida) S e a X e s u n a v a r i a b l e a l e a t o r i a n o r m a l ; t a n t o e l v a l o r d e l a m e d i a µ, c o m o e l v a l o r d e σ s o n desconocidos. Se obtiene una muestra de tamaño n; la media muestral es X . La variable aleatoria:
T =
x − µ s/ n
,
t i e n e u n a d i s t r i b u c i ó n t d e S t u d e n t , c o n n – 1 g ra d o s d e l i b e r t a d . P r o c e d i e n d o c o m o e n e l c a s o a n t e r i o r, s e o b t i e n e q u e e l i n t e r v a l o d e confianza del (1-α) × 100 por ciento, es [ X – tα/2, n-1 s /
Ejem pl o . S e a x
n < µ < X + tα/ 2, n-1 s /
n ].
= 1 5 , 4 ; y s = 2 , 1 ; l a m u e s t ra t i e n e 9 e l e m e n t o s .
El valor de t0 , 0 2 5 , 8 g dl es 2,30. E l i n t e r va l o d e c o n f i a n z a d e l 9 5 % p a ra µ, t i e n e l o s l í m i t e s : Lim. inferior =15,4 – (2,306 × 2,1 / 3) = 13.8 L i m . s u p e r i o r = 1 5 . 4 + ( 2 , 3 0 6 × 2 , 1 / 3 ) = 1 7. 0
Para la vari anza Sea
X
u n a v a r i a b l e a l e a t o r i a n o r m a l ( µ, σ) . S e q u i e r e c o n s t r u i r u n i n t e r v a l o d e c o n f i a n z a
par a l a var ian za de l a dist ri buc ión, σ2 . Par a el lo se ut il i za la pro pi edad de qu e la vari abl e χ2 =
(n − 1 ) s 2
σ2
t i e n e u n a d i s t r i b u c i ó n j i - c u a d r a d o c o n n – 1 g ra d o s d e l i b e r t a d . Se tiene:
P χ12 − n −1
α / 2,
<
( n −1 ) s 2
σ2
< χα2 / 2, = 1 − α n −1
.
Despejando σ2 , se obtiene:
( n −1 ) s 2 ( n −1 ) s 2 P < σ2 < χ2 χ12− α / 2, α / 2, n −1 n −1
=
1 − α .
VIII- 3
Ejem pl o. E l d e s v í o d e u n a m u e s t ra a l e a t o r i a d e 1 0 e l e m e n t o s , d e l o s va l o r e s d e u n a va r i a b l e a l e a t o r i a
X
n o r m a l , e s s = 4, 5 .
H a l l a r u n i n t e r va l o d e c o n f i a n z a d e l 9 5 % p a r a l a v a r i a n z a d e l a d i s t r i b u c i ó n d e l a va r i a b l e aleatoria X. E l i n t e r va l o d e c o n f i a n z a e s : Lim. inferior =
Lim. superior =
9 × 20,25 19,023
= 9,58
9 × 20,25 2,7
= 67,5
.
.
U n a c a r a c t e r í s t i c a d e l o s i n t e r va l o s d e c o n f i a n z a p a ra l a v a r i a n z a , e s u n a n c h o g ra n d e .
Para un parámetro, muestra grande Si la muestra es grande, y proviene de una variable aleatoria que no es normal, el teorema límite central facilita la construcción de intervalos de confianza aproximados. S e a θ u n e s t i m a d o r d e l p a r á m e t r o d e s c o n o c i d o θ . θ c u m p l e l a s s i g u i e n t e s c o n d i c i o n e s : 1) Tiene una distribución al menos aproximadamente simétrica. 2) Es aproximadamente insesgado. 3 ) S e d i s p o n e d e u n a e x p r e s i ó n a p r o x i m a d a σ ( θ ) d e l d e s v í o d e l e s t i m a d o r θ . E n t o n c e s l o s l í m i t e s d e c o n f i a n z a d e l ( 1 - α ) × 1 0 0 p o r c i e n t o , s o n a p r o x i m a d a m e n t e : θ – Z 1
- α/ 2 σ( θ ) < θ < θ + Z α/ 2 σ( θ ) .
Ejem pl o. S e a X u n a va r i a b l e a l e a t o r i a c o n u n a d i s t r i b u c i ó n q u e n o e s n o r m a l . Pa r a e j e m p l i f i c a r s u p o n e m o s q u e X ~ E x p o n e n c i a l ( x , λ ) . S e t i e n e u n a m u e s t ra d e n = 4 0 va l o r e s d e X . Q u e r e m o s c a l c u l a r u n i n t e r va l o d e c o n f i a n z a d e l 9 5 % p a ra λ . Po r e l t e o r e m a l í m i t e c e n t ra l s e c u m p l e a p r ox i m a d a m e n t e , p a ra n g ra n d e :
Z =
X −µ ; σˆ / n
El estimador de λ es 1/ x .El estimador de σ s u c e s i va m e n t e l o s va l o r e s Z 1 - α / 2 , y Z α / 2 , s e o b t i e n e :
P ( Z 1 − α /2 <
también
es
1/ x .
Asignando
a
Z
x −µ < Z α /2 ) σˆ / n
Al remplazar µ y σ, se obtiene:
1 x− λ P − Zα / 2 < < Zα / 2 n )) (1 / ( λ
= 1 −α .
las desigualdades se cambian mediante:
VIII- 4
x −
(
1 λ
1 / λ
n
)
> − Z α /2 ;
ó
λ>
− Z α /2 +
x
n
n
;
y
1 Z α /2 + n λ