Story Transcript
Cap´ıtulo 5 Intervalos de confianza Como su nombre indica, el objetivo de un estad´ıstico puntual para un par´ametro desconocido de una poblaci´on, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Dif´ıcilmente esta estimaci´on acertar´a con el valor exacto del par´ametro. No obstante, la pretensi´on de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximaci´on razonable” del mismo. En esta l´ınea surgen los intervalos de confianza, para un nivel de confianza dado.
1.
Definiciones
Definici´ on 1.1. Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con funci´on de masa Pθ (o funci´on de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Un estimador por intervalos de confianza de θi (al nivel de confianza 1 − α), es una funci´on que a cada posible muestra x1 � . . . � xN le hace corresponder un intervalo (T1 � T2 ) = (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )), tal que, para todo θ ∈ Θ: � � � � Pθ θi ∈ (T1 � T2 ) = Pθ (x1 � . . . � xN ) : θi ∈ (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )) = 1 − α . Para la construcci´on de intervalos de confianza, usaremos cantidades pivotales.
Definici´ on 1.2. Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con funci´on de masa Pθ (o funci´on de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Una cantidad pivotal para θi es una funci´on C(X1 � . . . � XN ; θi ) tal que su distribuci´on no depende de θ. Una vez obtenida una cantidad pivotal C(X1 � . . . � XN ; θi ), la construcci´on de un intervalo para estimar es el siguiente: - se eligen dos valores� c1 y c2 tales que: � � Pθ (x1 � . . . � xN ) : c1 < C(X1 � . . . � XN ; θi ) < c2 = 1 − α .
Obs´ervese que c1 y c2 no dependen de θ, al ser C(X1 � . . . � XN ; θi ) una cantidad pivotal.
- Despejamos θi de las desigualdades c1 < C(X1 � . . . � XN ; θi ) < c2 . Obtenemos as´ı un estimador por intervalos de confianza para θi . Obs´ervese que la cantidad pivotal debe ser continua y mon´otona en θi . Necesitaremos, pues, obtener cantidades pivotales, y en este cap´ıtulo describiremos la construcci´on para los modelos m´as importantes. 83
CAP´ITULO 5. INTERVALOS DE CONFIANZA
84
2.
Poblaciones normales
Sea X ∼ N (µ ; σ), y (X1 � . . . � XN ) una muestra aleatoria de dicha poblaci´on. El estimador media ¯ tiene las siguientes propiedades: muestral, X, ¯ = V [X] = σ . V [X] N N
¯ = E[X] = µ � E[X]
Por otra parte, X1 � . . . � XN son variables aleatorias independientes, todas con la misma distribuci´on, N (µ ; σ), y as´ı √ ¯ ∼ N (µ ; σ/ N ) . X Por otra parte, el estimador cuasi–varianza muestral N
S2 =
1 � ¯ 2 (Xi − E[X]) N − 1 i=1
tiene esperanza E[S 2 ] = σ 2 . Necesitaremos conocer la distribuci´on seguida por este estad´ıstico. Se tiene la siguiente definici´on: Definici´ on 2.1. �Distribuci´ on χ2 ) Sean Z1 � . . . � ZN variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on χ2 de Pearson con N grados de libertad (abreviadamente χ2N ) es la distribuci´on de la variable aleatoria N �
Zi2 .
i=1
Esta distribuci´on est´a asociada a la distribuci´on normal, y sus valores vienen dados por una tabla. Es claro que si (X1 � . . . � XN ) es una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), entonces:
N −1 2 S = σ2 =
N � (Xi − µ)2 i=1 N � i=1
σ2
de manera que:
N
¯ 2 � (Xi − µ + µ − X) ¯ 2 (Xi − X) = σ2 σ2 i=1
N � (Xi − µ)2 i=1 N �
∼ χ2N
σ2
N ¯ − µ)2 ¯ − µ �� � � (X X −2 − µ) + (X i σ2 σ2 i=1
¯ − µ)2 ¯ − µ)2 (X (X (Xi − µ)2 − 2N + N σ2 σ2 σ2 i=1 � ¯ �2 N � ¯ − µ)2 (X (Xi − µ)2 X −µ 2 √ = −N = χN − ∼ χ2N −1 . 2 2 σ σ σ/ N i=1 =
Para evitar confusiones, denotaremos por S 2 a la variable aleatoria cuasi–varianza muestral, y por VX la varianza muestral. Se tiene la siguiente propiedad:
2. POBLACIONES NORMALES
85
Propiedad: [Lema de Fisher] Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con distribuci´on N (µ ; σ). Entonces: √ ¯ ∼ N (µ ; σ/ N ) ; X
N −1 2 S ∼ χ2N −1 ; 2 σ
¯ y S 2 son independientes. y, adem´as, X Igual que para la distribuci´on de la cuasi–varianza de N variables aleatorias independientes con igual distribuci´on N (µ � σ), hemos introducido una nueva distribuci´on, necesitaremos las siguientes nuevas definiciones. Definici´ on 2.2. �Distribuci´ on t de Student) Sean Y , X1 � . . . � XN variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on t de Student con N grados de libertad (abreviadamente tN ) es la distribuci´on de la variable aleatoria �
1 N
Y �N
2 i=1 Xi
=�
Y 1 N
. χ2N
Definici´ on 2.3. �Distribuci´ on F de Fisher–Snedecor) Sean X1 � . . . � Xm , Y1 � . . . � Yn variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on F de Fisher–Snedecor con m y n grados de libertad (abreviadamente Fm;n ) es la distribuci´on de la variable aleatoria 1 m 1 n
2.1.
�m X2 �ni=1 2i = i=1 Yi
1 m 1 n
χ2m . χ2n
Cantidades pivotales en poblaciones normales
Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la construcci´on de estimadores por intervalos de confianza, para el caso de una poblaci´on X ∼ N (µ ; σ). Distinguiremos el caso de un muestra y el de dos muestras. Cantidades pivotales para el caso de una muestra a) Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), con σ conocido. Entonces: ¯ −µ X √ ∼ N (0 ; 1) y es una cantidad pivotal para µ. σ/ N b) Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ). Entonces: ¯ −µ X √ ∼ tN −1 es una cantidad pivotal para µ S/ N N −1 2 S ∼ χ2N −1 es una cantidad pivotal para σ 2 . σ2
CAP´ITULO 5. INTERVALOS DE CONFIANZA
86
Obs´ervese que si (X1 � . . . � XN ) es una muestra aleatoria de una poblaci´on N (µ ; σ), entonces: ¯ −µ X √ ¯ −µ X σ/ N � = √ ∼ tN −1 1 N −1 2 S/ N S 2 N −1 σ por definici´on de la distribuci´on t de Student con N − 1 grados de libertad. Cantidades pivotales para el caso de dos muestras a) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ), respectivamente. Entonces: ¯ − Y¯ − (µ1 − µ2 ) X � ∼ tm+n−2 y es una cantidad pivotal para µ1 − µ2 Sp m1 + n1 donde
2 (m − 1)SX + (n − 1)SY2 m+n−2 2 y SY2 , puede interpretarse como una ponderaci´on de las cuasi–varianzas muestrales SX correspondientes a cada una de las muestras.
Sp2 =
b) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ), respectivamente. Entonces: 2 SX /σ12 ∼ Fm−1;n−1 y es una cantidad pivotal para σ12 /σ22 . SY2 /σ22
Obs´ervese que, en la situaci´on descrita para dos muestras: 1 m−1 2 SX S 2 /σ 2 m − 1 σ12 = X2 12 ∼ Fm−1;n−1 1 n−1 2 SY /σ2 SY n − 1 σ22
de ah´ı la afirmaci´on del apartado b). La comprobaci´on del primer apartado excede el nivel de este curso, y no se abordar´a.
2.2.
Intervalos de confianza en poblaciones normales
Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de confianza para los par´ametros de una poblaci´on normal. Distinguiremos diferentes casos: Primer caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), con σ conocido. Entonces: � � ¯ + zα/2 √σ ¯ − zα/2 √σ � X X N N es un intervalo de confianza para µ �al nivel 1−α), siendo zα el valor que verifica P (Z > zα ) = α, para Z ∼ N (0 ; 1).
2. POBLACIONES NORMALES
87
Segundo caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ). Entonces:
� ¯ +tN −1 ; α/2 √S ¯ −tN −1 ; α/2 √S � X es un intervalo de confianza para µ �al nivel 1−α), X N N siendo tN ; α el valor que verifica que P (tN > tN ; α ) = α. � (N − 1)S 2 (N − 1)S 2 � es un intervalo de confianza para σ 2 �al nivel 1 − α), siendo b) � χ2N −1 ; α/2 χ2N −1 ; 1−α/2 χ2N ; α el valor que verifica: P (χ2N > χ2N ; α ) = α. a)
�
Tercer caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales con igual desviaci´on t´ıpica: X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ) , respectivamente. Entonces: � � � � 1 1 1 1 ¯ − Y¯ + tm+n−2 ; α/2 Sp ¯ − Y¯ − tm+n−2 ; α/2 Sp + �X + X m n m n es un intervalo de confianza para la diferencia de medias, µ1 − µ2 �al nivel 1 − α). Cuarto caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales: X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ) , respectivamente. Entonces: � � 2 2 SX /SY2 /SY2 SX � Fm−1 ; n−1 ; α/2 Fm−1 ; n−1 ; 1−α/2 es un intervalo de confianza para la raz´on de varianzas, σ12 /σ22 �al nivel 1 − α), siendo Fm ; n ; α el valor que verifica: P (Fm ; n > Fm ; n ; α ) = α. Observaci´ on: En el manejo de las tablas correspondientes a la distribuci´on Fm ; n , conviene tener en cuenta la siguiente relaci´on (obs´ervese el cambio de orden en los grados de libertad): Fm ; n ; 1−α = Fn ;1m ; α .
2.3.
Ejemplos
Ejemplo 36 Una empresa fabrica bombillas cuya duraci´on en horas sigue una distribuci´on N (µ ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constr´ uyase un intervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa f´abrica. ´ n: Tenemos una muestra de tama˜ Solucio no N = 36 de una poblaci´on, X ∼ N (µ ; 200), de varianza conocida. Usaremos la cantidad pivotal: ¯ −µ X ∼ N (0 ; 1) ; 200/6 y, para α = 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral x¯ = 7000. En otras palabras, consideramos la igualdad: � � 7000 − µ P −c< < c = 1 − α = 0.99 . 200/6
CAP´ITULO 5. INTERVALOS DE CONFIANZA
88
De la tabla para una N (0 ; 1) se tiene c = zα/2 ≈ 2.58 (pues α/2 = 0.005). Construimos el intervalo de confianza para µ, al nivel del 99 %, despejando µ en las desigualdades: −2.58 <
7000 − µ < 2.58 200/6
de manera que: 21000 + 258 21258 200 2.58 = = = 7086 6 3 3 21000 − 258 20742 200 2.58 = = = 6914 µ > 7000 − 6 3 3
µ < 7000 +
(de la desigualdad izquierda) (de la desigualdad derecha)
Resumiendo, el intervalo de confianza para µ al nivel del 99 % para la muestra dada es: � � 200 200 2.58� 7000 + 2.58 = (6914 � 7086) . I = 7000 − 6 6 Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviaci´on t´ıpica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribuci´on N (µ ; σ), obt´engase un intervalo de confianza al 99 � del contenido medio de nicotina por cigarrillo en esa marca. ´ n: En este caso se quiere estimar µ en una poblaci´on N (µ ; σ), con ambos par´ametros Solucio desconocidos. Partimos de una muestra de tama˜ no N = 16, con x¯ = 1.6 y cuasi–desviaci´on t´ıpica muestral � 16 s = 0.72 ≈ 0.723 . 15 Sabemos que en este caso hemos de usar la cantidad pivotal: 1.6 − µ x¯ − µ √ = 0.723/4 s/ N que sigue una distribuci´on t de Student con N − 1 = 15 grados de libertad. Para la muestra dada, el intervalo de confianza para µ al nivel de confianza 1 − α queda � s s � � 0.723 0.723 � = 1.6 − t15 ; α/2 � x¯ − tN −1 ; α/2 √ � x¯ + tN −1 ; α/2 √ � 1.6 + t15 ; α/2 4 4 N N siendo t15 ; α/2 el valor tal que P (t15 > t15 ; α/2 ) = α/2. Como en nuestro caso 1 − α = 0.99 entonces α = 0.01 y as´ı, de la correspondiente tabla para la distribuci´on t de Student, obtenemos: t15 ; α/2 = t15 ; 0.005 = 2.947 . El intervalo que nos piden es pues: � � 0.723 0.723 0.723 � 0.723 � = 1.6 − 2.947 1.6 − t15 ; α/2 � 1.6 + t15 ; α/2 � 1.6 + 2.947 4 4 4 4 ≈ (1.6 − 0.5327� 1.6 + 0.5327) = (1.0673� 2.1327) .
2. POBLACIONES NORMALES
89
Observaci´ on: En este ejemplo hemos tenido que calcular la cuasi–desviaci´on t´ ıpica muestral a √ partir de la desviaci´on t´ıpica muestral. Si seguimos el uso dado, denotando por v la desviaci´on � t´ıpica muestral, vemos que: √ √ √ v NN−1 s v N v √ = √ =√ √ =√ N −1 N N N N −1 Podr´ıamos haber expresado el intervalo de confianza utilizando la desviaci´on t´ıpica muestral: √ √ � � v v x¯ − tN −1 ; α/2 √ � x¯ + tN −1 ; α/2 √ � N −1 N −1 pero no usaremos esta expresi´on, para no liar la notaci´on. Tan s´olo hemos de tener cuidado al tomar los datos del problema. Ejemplo 38 Una muestra aleatoria de una poblaci´on N (µ ; σ) ha dado los diez valores siguientes 6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6 . Constr´ uyase un intervalo de confianza de σ 2 al 95 � . ´ n: Estamos ante una poblaci´on N (µ ; σ) de la que desconocemos ambos par´ametros. Para Solucio estimar por intervalos de confianza σ 2 usaremos la cantidad pivotal N −1 2 S σ2 que sabemos sigue una distribuci´on χ2 con N − 1 grados de libertad. As´ı, de la muestra dada, tan s´olo usaremos la cuasi–varianza muestral: N 1 � ¯ 2. S2 = (Xi − X) N − 1 i=1
Los siguientes c´alculos dan con ella: 76.6 x¯ = = 7.66 10 1 (6.92 +5.72 +8.42 +9.32 +7.22 +8.52 +7.42 +9.12 +6.52 +7.62 ) − 7.662 varianza muestral: v = 10 598.82 = − 58.6756 = 59.882 − 58.6756 = 1.2064 10 10 12.064 ≈ 1.34 . s2 = v = 9 9 Para construir el intervalo pedido � (N − 1)s2 (N − 1)s2 � � χ2N −1 ; α/2 χ2N −1 ; 1−α/2
hemos de calcular χ2N −1 ; α/2 y χ2N −1 ; 1−α/2 , con N − 1 = 9, α/2 = (1 − 0.95)/2 = 0.025. Estos valores son, respectivamente: χ29 ; 0.025 = 19.023 ; χ29 ; 1−0.025 = χ29 ; 0.975 = 2.7 . Sustituyendo en la expresi´on del intervalo de confianza para estimar σ 2 al nivel pedido, se obtiene: � � 9 · 1.34 9 · 1.34 � ≈ (0.634� 4.467) � 19.023 2.7 como intervalo de confianza para estimar σ 2 al nivel del 95 %.
CAP´ITULO 5. INTERVALOS DE CONFIANZA
90
Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuaci´on media de 76 con desviaci´on t´ıpica 6, y 28 del curso con hora complementaria una puntuaci´on media de 84 con desviaci´on t´ıpica 5. Obt´engase un intervalo de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales. ´ n: En las condiciones dadas es aplicable el intervalo Solucio � � � � 1 1 1 1 ¯ ¯ ¯ ¯ X − Y − tm+n−2 ; α/2 Sp + � X − Y + tm+n−2 ; α/2 Sp + m n m n con 15 540 = 14 14 700 2 2 28 n = 28 ; y¯ = 84 ; sY = 5 = 27 27
m = 15 ; x¯ = 76 ; s2X = 62
y (m − 1)s2X + (n − 1)s2Y m+n−2 540 14 14 + 27 700 1240 27 = = 15 + 28 − 2 41
s2p =
Sustituyendo α = 1 − 0.9 = 0.1, obtenemos, de la tabla para una distribuci´on t de Student con 15 + 28 − 2 = 41 grados de libertad1 : t41 ; α/2 = t41 ; 0.05 ≈ 1.684 En definitiva, el intervalo de confianza para σ 2 al 90 %, dadas las dos muestras, es: � � � � � � 1240 28 + 15 1240 28 + 15 � 76 − 84 + 1.684 76 − 84−1.684 41 28 · 15 41 28 · 15 � � � � 1240 · 43 1240 · 43 � −6 + 1.684 = − 6 − 1.684 41 · 28 · 15 41 · 28 · 15 � � � � 62 · 43 62 · 43 � −6 + 1.684 ≈ (−8.9633� −3.0367) . = − 6 − 1.684 41 · 21 41 · 21
Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 N2 = 11
x¯1 = 4 x¯2 = 5
s1 = 3 s2 = 2.2 .
Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N (µi ; σi ), para i = 1� 2, obtener un intervalo de confianza para el cociente de varianzas al nivel 0.80 . 1
En la tabla entregada en clase este dato est´a mal escrito: deber´ıa poner 1.684 en lugar de 1.648.
3. OTRAS POBLACIONES
91
´ n: Un intervalo de confianza para el cociente σ12 /σ22 , al nivel 0.80 = 1 − α con α = 0.2, ser´a: Solucio � � S12 /S22 S12 /S22 � FN1 −1 ; N2 −1 ; 0.1 FN1 −1 ; N2 −1 ; 0.9 De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1): F12 ; 10 ; 0.1 = 2.2841 ; El intervalo queda:
3.
�
y:
F12 ; 10 ; 0.9 =
32 /2.22 32 /2.22 � 2.2841 1/2.1878
�
1 1 = ≈ 0.4571 . F10 ; 12 ; 0.1 2.1878
≈ (0.8141� 4.0682) .
Otras poblaciones
Cuando la muestra se obtiene de poblaciones con distribuci´on Bernoulli, o de Poisson, usaremos intervalos de confianza asint´oticos, para ponernos en la situaci´on anterior. Para ello las cantidades pivotales utilizadas tendr´an una distribuci´on l´ımite (cuando N → ∞) independiente de par´ametros desconocidos. ´ n de Bernoulli Intervalos de confianza para una distribucio Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ B(1 ; p). Entonces: � � � � p � (1 − p � ) p� (1 − p�) ¯ ¯ X − zα/2 � X + zα/2 N N
¯ =“frecuencia relativa de es un intervalo de confianza para p �al nivel 1 − α), siendo p� = X ´exitos”. Estamos utilizando la siguiente cantidad pivotal asint´otica: �
¯ −p X
p�(q − p�)/N
∼ N (0 ; 1) (aproximadamente, para N grande) .
´ n de Poisson Intervalos de confianza para una distribucio Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ Poisson (λ). Entonces: � � � � � � ¯ ¯ X − zα/2 λ/N � X + zα/2 λ/N � = X. ¯ es un intervalo de confianza para λ �al nivel 1 − α), siendo λ
En este caso, la cantidad pivotal asint´otica es:
¯ −λ X � ∼ N (0 ; 1) (aproximadamente, para N grande) . � λ/N
CAP´ITULO 5. INTERVALOS DE CONFIANZA
92
4.
M´ınimo tama˜ no muestral
Un problema muy relacionado con la construcci´on de intervalos de confianza es el de determinar el m´ınimo tama˜ no muestral necesario para obtener una determinada precisi´on en nuestra estimaci´on. Es decir, cu´antos elementos tenemos que observar, al menos, para que el error cometido con la estimaci´on no supere cierta cantidad. Definici´ on 4.1. El error de una estimaci´on por intervalos de confianza (al nivel 1 − α) es la semi– amplitud del intervalo obtenido. Ejemplo 41 Determinar el m´ınimo tama˜ no muestral de una poblaci´on N (µ ; σ = 5), para que el error de la estimaci´on por intervalos de confianza para µ al 95 �, no sea superior a 0.5. ´ n: Estimaremos µ mediante un intervalo de confianza de la forma: Solucio � � σ σ ¯ − zα/2 √ � X ¯ + zα/2 √ X N N con lo cual el error cometido ser´a
σ Error = zα/2 √ . N
Siendo α = 1 − 0.95 = 0.05, α/2 = 0.025y σ = 5, se quiere obtener el m´ınimo valor de N para que: 5 5 z0.025 √ = 1.96 √ ≤ 0.5 N N
de donde:
N≥
� 5 · 1.96 �2 0.5
= 19.62 = 384.16 .
Es decir, necesitaremos observar 385 elementos para conseguir la precisi´on deseada (error ≤ 0.5) para esa estimaci´on. Para otros intervalos, un c´alculo similar nos llevar´ıa a determinar, en cada caso, el m´ınimo tama˜ no muestral. T´engase en cuenta que este m´ınimo tama˜ no muestral ha de tomarse como un valor orientativo. As´ı, si obtenemos, para determinada precisi´on, un m´ınimo tama˜ no muestral de 196, entenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el m´ınimo tama˜ no muestral depende de la muestra concreta obtenida.
5.
Intervalos de confianza m´ as frecuentes
Recogemos por u ´ltimo, los intervalos de confianza antes obtenidos, y alg´ un otro, en una lista esquem´atica. Se utiliza la siguiente notaci´on (X1 � . . . � Xn ) muestra aleatoria (m.a.) de X. n
1� x¯ = xi � n i=1
n
1 � s = (xi − x¯)2 � n − 1 i=1 2
I = (a ± �) = (a − �� a + �)
´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS
93
1. X ∼ N (µ� σ)
� � σ √ I = x ¯ ± z α/2 n Intervalo de confianza 1 − α para µ: � � s I = x¯ ± tn−1;α/2 √ n �
Intervalo de confianza 1 − α para σ 2 : I = 2. X ∼ B(1� p) (muestras grandes). Intervalo de confianza 1 − α para p: I = 3. X ∼ P (λ) (muestras grandes). Intervalo de confianza 1 − α para λ: I =
�
σ desconocida
(n − 1)s2 (n − 1)s2 � χ2n−1;α/2 χ2n−1;1−α/2
x¯ ± zα/2
�
σ conocida
�
x¯(1 − x¯) n
�
�
� � x¯ x¯ ± zα/2 n
4. Dos poblaciones Normales independientes X ∼ N (µ1 � σ1 ), Y ∼ N (µ2 � σ2 ) independientes
(X1 � . . . � Xn1 ) m.a. de X; se calcula x¯ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula y¯ y s22 . s2p =
(n1 − 1) s21 + (n2 − 1) s22 n1 + n2 − 2
Intervalo de confianza 1 − α para µ1 − µ2 : � � 2 2 σ1 σ2 I = x¯ − y¯ ± zα/2 + n 1 n2 I=
�
x¯ − y¯ ± tn1 +n2 −2;α/2 sp
�
I = x¯ − y¯ ± tf ;α/2
�
�
1 1 + n1 n2
s2 s21 + 2 n1 n2
donde f = entero m´as pr´oximo a
Intervalo de confianza 1 − α para
σ1 , σ2 conocidas
�
σ1 � σ2 desconocidas, σ1 = σ2
σ1 � σ2 desconocidas, σ1 �= σ2
(s21 /n1 + s22 /n2 )2 �s21 /n1 )2 n1 +1
σ12 /σ22 :
+
�s22 /n2 )2 n2 +1
I=
�
−2 s21 /s22
Fn1 −1;n2 −1;α/2
�
(s21 /s22 ) Fn2 −1;n1 −1;α/2
�
CAP´ITULO 5. INTERVALOS DE CONFIANZA
94
5. Comparaci´on de proporciones (muestras grandes e independientes) X ∼ B(1� p1 ), Y ∼ B(1� p2 ), independientes.
(X1 � . . . � Xn1 ) m.a. de X; se calcula x¯ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula y¯ y s22 .
�
Intervalo de confianza 1 − α para p1 − p2 : I = x¯ − y¯ ± zα/2
�
x¯ (1 − x¯) y¯ (1 − y¯) + n1 n2
6. Datos emparejados (X� Y ) ∼ Normal bivariante (µ1 � µ2 � σ1 � σ2 � ρ).
(X1 � Y1 )� . . . � (Xn � Yn ) m.a. de (X� Y ).� � � D = X − Y ∼ N µ = µ1 − µ2 � σ = σ12 + σ22 − 2 ρ σ1 σ2 (D1 � . . . � Dn ) m.a. de D, donde Di = Xi − Yi . Intervalos de confianza 1 − α para µ ´o σ: aplicar Apartado 1 a la variable aleatoria D
´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS
95
Problemas 1. En una poblaci´on se desea conocer la probabilidad de que un individuo sea al´ergico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 al´ergicos. Hallar el intervalo de confianza al 95 % para la probabilidad pedida. ¿Cu´antos individuos se deber´ıan observar para que, con el mismo nivel de confianza, el error m´aximo en la estimaci´on de la proporci´on de al´ergicos sea del 0.01? 2. Se supone que el n´ umero de erratas por p´agina en un libro sigue una distribuci´on de Poisson. Elegidas al azar 95 p´aginas, se obtuvieron los siguientes resultados: N´ umero de erratas N´ umero de p´aginas
0 40
1 30
2 15
3 7
4 2
5 1
Hallar el intervalo de confianza al 90 % para el n´ umero medio de erratas por p´agina en todo el libro. 3. Se mide el tiempo de duraci´on (en segundos) de un proceso qu´ımico realizado 20 veces en condiciones similares, obteni´endose los siguientes resultados: 28 � 25 � 32 � 25 � 28 � 26 � 31 � 29 � 26 � 26 � 23 � 18 � 20 � 16 � 24 � 17 � 22 � 23 � 25 � 21 .
4.
5.
6.
7.
8.
Suponiendo que la duraci´on sigue una distribuci´on Normal, hallar los intervalos de confianza al 90 % para ambos par´ametros. La vida activa (en d´ıas) de cierto f´armaco sigue una distribuci´on N (1200 ; 40). Se desea enviar un lote de este f´armaco de manera que la vida media del lote no sea inferior a 1180 d´ıas, con probabilidad 0.95. Hallar el tama˜ no del lote. Una noticia en el peri´odico dice que, de 1000 personas encuestadas sobre una cuesti´on, 556 se muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la poblaci´on se muestra a favor, con un margen de error de ±3 %. ¿Cu´al es el nivel de confianza de esta afirmaci´on? Se quiere estudiar la proporci´on p de declaraciones de la renta con alg´ un defecto. En una muestra preliminar peque˜ na (muestra piloto) de tama˜ no 50 se han observado 22 declaraciones defectuosas. ¿Cu´al es el tama˜ no muestral necesario para estimar p cometiendo un error m´aximo de 0.01 con una probabilidad 0.99? En una gran zona ganadera se desea estimar la proporci´on de ovejas que sufren cierta enfermedad degenerativa. Calcular el tama˜ no muestral necesario para estimar esta proporci´on con un error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una peque˜ na muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 x¯1 = 4 s1 = 3 N2 = 11 x¯2 = 5 s2 = 2.2 . Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N (µi ; σi ), para i = 1� 2, se pide: a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80 . b) Obtener un intervalo de confianza para µ1 − µ2 , con nivel de confianza 0.95 . c) ¿Cu´antos individuos habr´ıa que observar para estimar µ1 con un error m´aximo de ±0.2 y un nivel de confianza de 0.95?
96
CAP´ITULO 5. INTERVALOS DE CONFIANZA
9. Para construir un intervalo de confianza de la media poblacional de una N (µ ; σ) con σ conocida, se ha utilizado una muestra de tama˜ no n y se ha obtenido el intervalo del 95 %. ¿C´omo ha de ser modificado el tama˜ no de la muestra para obtener el mismo intervalo con una confianza del 99 %? 10. Una f´abrica elabora dos art´ıculos A y B, cuya demanda aleatoria sigue una distribuci´on normal de medias µA y µB desconocidas, y desviaciones t´ıpicas σA = 100 y σB = 50. Observados 100 puntos de venta, la demanda media de dichos art´ıculos ha resultado de 200 y 150 unidades, respectivamente. Constr´ uyase un intervalo de confianza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se comprob´o que 280 se hab´ıan suscrito a cierto canal de televisi´on. Obt´engase un intervalo de confianza del 95 % de la proporci´on real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una m´aquina produce engranajes cuyo di´ametro, debido a imperfecciones inherentes al funcionamiento de la m´aquina, es una variable aleatoria con distribuci´on N (µ ; σ = 0.03), de forma que µ puede ser fijada a voluntad mediante un reglaje de la m´aquina. Para que un engranaje sea utilizable, su di´ametro debe estar comprendido entre 15.50 y 15.60 mm. Calc´ ulese: a) el valor de µ que hace m´axima la proporci´on de engranajes utilizables y dicha proporci´on m´axima. b) el tama˜ no n de la muestra de engranajes necesario para poder construir, a partir de la media muestral x¯, un intervalo de confianza de µ al 95 % de amplitud menor que 0.02 mm. 13. De una poblaci´on normal de media µ desconocida se selecciona una muestra de tama˜ no n = 10, resultando: 40, 45, 39, 46, 58, 52, 50, 45, 57, 49 . Constr´ uyase un intervalo de confianza al 95 % para el par´ametro µ, suponiendo que: a) la varianza poblacional es σ 2 = 49; b) la varianza poblacional es desconocida. 14. Sabiendo que X sigue una distribuci´on N (µ ; σ = 4), calc´ ulese el tama˜ no muestral m´ınimo para que, con una confianza del 99 %, el intervalo (¯ x − 1.5� x¯ + 1.5) contenga al par´ametro µ. 15. El di´ametro (en cent´ımetros) de diez piezas met´alicas de forma esf´erica, seleccionadas al azar de la producci´on de una m´aquina, result´o 2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 . a) Suponiendo que el di´ametro sigue una distribuci´on normal, constr´ uyase un intervalo de confianza al 95 % del di´ametro medio de las piezas producidas por esta m´aquina. b) ¿Cu´al deber´a ser el tama˜ no muestral m´ınimo si, a este nivel de confianza, se pretende dar un intervalo de estimaci´on cuya amplitud no supere los 0.02 cm? 16. Con objeto de decidir si un nuevo proceso de fabricaci´on da mejores resultados que el antiguo, en cuanto a la proporci´on de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente. a) Obt´engase un intervalo de confianza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos. b) ¿Se puede afirmar que el n´ umero de elementos defectuosos es significativamente menor en el nuevo proceso?
´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS
97
nos de funciona17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros a˜ miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza de nivel 0.95 para la probabilidad pedida. ¿Cu´antas piezas se deber´ıan observar para que, con el mismo nivel de confianza, el margen de error en la estimaci´on de la proporci´on de fallos sea de ±0.01? 18. En una poblaci´on, la altura de los individuos varones sigue una distribuci´on N (µ; σ = 7.5). Halla el tama˜ no de la muestra para estimar µ con un margen de error inferior a ±2 cm. para un nivel de confianza 0.90. 19. En una explotaci´on minera, las rocas excavadas se someten a un an´alisis qu´ımico para determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribuci´on normal de media µ y varianza σ 2 . Despu´es de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con una cuasidesviaci´on t´ıpica de 3.164. La explotaci´on comercial de este mineral es econ´omicamente rentable si el contenido medio en la mina es superior al 8 %. a) Construye un intervalo de confianza de nivel 95 % para el contenido porcentual medio de cadmio en la mina. b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a trav´es de la varianza σ, que debe ser menor al 3 %. Construye un intervalo de confianza de nivel 95 % para σ 2 . 20. Como parte de un estudio para la reducci´on de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. Sea X el n´ umero de kil´ometros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el n´ umero de kil´ometros recorridos con un litro de gasolina con el aditivo. Se observan los kil´ometros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son: 4 � i=1
xi = 25.4
4 � i=1
yi = 31.2
4 � i=1
x2i
= 173.53
4 �
yi2 = 261.22
i=1
a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las hip´otesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias. b) A la vista del intervalo obtenido en a), ¿hay alguna indicaci´on de que el aditivo tiene alg´ un efecto en el n´ umero de kil´ometros recorridos por litro de gasolina? 21. Se admite que el n´ umero de microorganismos en una muestra de 1 mm c´ ubico de agua de un r´ıo sigue una distribuci´on de Poisson de par´ametro λ. En 40 muestras se han detectado, en total, 833 microorganismos. Calcula un estimador puntual y un intervalo de confianza al 90 % para λ.