Intervalos de confianza

Cap´ıtulo 5 Intervalos de conﬁanza Como su nombre indica, el objetivo de un estad´ıstico puntual para un par´ametro desconocido de una poblaci´on, es

Author: Luis Miguel Rodríguez Gallego

4 downloads 239 Views 177KB Size

Report

DOWNLOAD PDF

Recommend Stories

INTERVALOS DE CONFIANZA

8. INTERVALOS DE CONFIANZA

8. INTERVALOS DE CONFIANZA Al estimar el valor de un parámetro de la distribución teórica, no se provee información sobre la incertidumbre en el resul

Muestreo e Intervalos de Confianza

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Estimación por intervalos de confianza. I.E.S. A Xunqueira I pag. 1 ESTIMACIÓN POR INTERVALOS DE CONFIANZA Conceptos En este tema vamos a estudiar

Tema 11: Intervalos de confianza

Intervalos de Confianza para dos muestras

Intervalos de confianza para la media

LECTURA 04: INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL. INTERVALOS DE CONFIANZA ENTRE DOS MEDIAS POBLACIONALES

Intervalos de confianza basado en bootstrap

Juan Carlos Colonia INTERVALOS DE CONFIANZA

Story Transcript

Cap´ıtulo 5 Intervalos de conﬁanza Como su nombre indica, el objetivo de un estad´ıstico puntual para un par´ametro desconocido de una poblaci´on, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Dif´ıcilmente esta estimaci´on acertar´a con el valor exacto del par´ametro. No obstante, la pretensi´on de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximaci´on razonable” del mismo. En esta l´ınea surgen los intervalos de conﬁanza, para un nivel de conﬁanza dado.

1.

Deﬁniciones

Deﬁnici´ on 1.1. Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con funci´on de masa Pθ (o funci´on de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Un estimador por intervalos de conﬁanza de θi (al nivel de conﬁanza 1 − α), es una funci´on que a cada posible muestra x1 � . . . � xN le hace corresponder un intervalo (T1 � T2 ) = (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )), tal que, para todo θ ∈ Θ: � � � � Pθ θi ∈ (T1 � T2 ) = Pθ (x1 � . . . � xN ) : θi ∈ (T1 (x1 � . . . � xN ) � T2 (x1 � . . . � xN )) = 1 − α . Para la construcci´on de intervalos de conﬁanza, usaremos cantidades pivotales.

Deﬁnici´ on 1.2. Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con funci´on de masa Pθ (o funci´on de densidad fθ ), donde θ = (θ1 � . . . � θk ) ∈ Θ. Una cantidad pivotal para θi es una funci´on C(X1 � . . . � XN ; θi ) tal que su distribuci´on no depende de θ. Una vez obtenida una cantidad pivotal C(X1 � . . . � XN ; θi ), la construcci´on de un intervalo para estimar es el siguiente: - se eligen dos valores� c1 y c2 tales que: � � Pθ (x1 � . . . � xN ) : c1 < C(X1 � . . . � XN ; θi ) < c2 = 1 − α .

Obs´ervese que c1 y c2 no dependen de θ, al ser C(X1 � . . . � XN ; θi ) una cantidad pivotal.

- Despejamos θi de las desigualdades c1 < C(X1 � . . . � XN ; θi ) < c2 . Obtenemos as´ı un estimador por intervalos de conﬁanza para θi . Obs´ervese que la cantidad pivotal debe ser continua y mon´otona en θi . Necesitaremos, pues, obtener cantidades pivotales, y en este cap´ıtulo describiremos la construcci´on para los modelos m´as importantes. 83

CAP´ITULO 5. INTERVALOS DE CONFIANZA

84

2.

Poblaciones normales

Sea X ∼ N (µ ; σ), y (X1 � . . . � XN ) una muestra aleatoria de dicha poblaci´on. El estimador media ¯ tiene las siguientes propiedades: muestral, X, ¯ = V [X] = σ . V [X] N N

¯ = E[X] = µ � E[X]

Por otra parte, X1 � . . . � XN son variables aleatorias independientes, todas con la misma distribuci´on, N (µ ; σ), y as´ı √ ¯ ∼ N (µ ; σ/ N ) . X Por otra parte, el estimador cuasi–varianza muestral N

S2 =

1 � ¯ 2 (Xi − E[X]) N − 1 i=1

tiene esperanza E[S 2 ] = σ 2 . Necesitaremos conocer la distribuci´on seguida por este estad´ıstico. Se tiene la siguiente deﬁnici´on: Deﬁnici´ on 2.1. �Distribuci´ on χ2 ) Sean Z1 � . . . � ZN variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on χ2 de Pearson con N grados de libertad (abreviadamente χ2N ) es la distribuci´on de la variable aleatoria N �

Zi2 .

i=1

Esta distribuci´on est´a asociada a la distribuci´on normal, y sus valores vienen dados por una tabla. Es claro que si (X1 � . . . � XN ) es una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), entonces:

N −1 2 S = σ2 =

N � (Xi − µ)2 i=1 N � i=1

σ2

de manera que:

N

¯ 2 � (Xi − µ + µ − X) ¯ 2 (Xi − X) = σ2 σ2 i=1

N � (Xi − µ)2 i=1 N �

∼ χ2N

σ2

N ¯ − µ)2 ¯ − µ �� (X X −2 − µ) + (X i σ2 σ2 i=1

¯ − µ)2 ¯ − µ)2 (X (X (Xi − µ)2 − 2N + N σ2 σ2 σ2 i=1 � ¯ �2 N � ¯ − µ)2 (X (Xi − µ)2 X −µ 2 √ = −N = χN − ∼ χ2N −1 . 2 2 σ σ σ/ N i=1 =

Para evitar confusiones, denotaremos por S 2 a la variable aleatoria cuasi–varianza muestral, y por VX la varianza muestral. Se tiene la siguiente propiedad:

2. POBLACIONES NORMALES

85

Propiedad: [Lema de Fisher] Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X con distribuci´on N (µ ; σ). Entonces: √ ¯ ∼ N (µ ; σ/ N ) ; X

N −1 2 S ∼ χ2N −1 ; 2 σ

¯ y S 2 son independientes. y, adem´as, X Igual que para la distribuci´on de la cuasi–varianza de N variables aleatorias independientes con igual distribuci´on N (µ � σ), hemos introducido una nueva distribuci´on, necesitaremos las siguientes nuevas deﬁniciones. Deﬁnici´ on 2.2. �Distribuci´ on t de Student) Sean Y , X1 � . . . � XN variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on t de Student con N grados de libertad (abreviadamente tN ) es la distribuci´on de la variable aleatoria �

1 N

Y �N

2 i=1 Xi

=�

Y 1 N

. χ2N

Deﬁnici´ on 2.3. �Distribuci´ on F de Fisher–Snedecor) Sean X1 � . . . � Xm , Y1 � . . . � Yn variables aleatorias independientes, todas con distribuci´on N (0 ; 1). La distribuci´on F de Fisher–Snedecor con m y n grados de libertad (abreviadamente Fm;n ) es la distribuci´on de la variable aleatoria 1 m 1 n

2.1.

�m X2 �ni=1 2i = i=1 Yi

1 m 1 n

χ2m . χ2n

Cantidades pivotales en poblaciones normales

Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la construcci´on de estimadores por intervalos de conﬁanza, para el caso de una poblaci´on X ∼ N (µ ; σ). Distinguiremos el caso de un muestra y el de dos muestras. Cantidades pivotales para el caso de una muestra a) Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), con σ conocido. Entonces: ¯ −µ X √ ∼ N (0 ; 1) y es una cantidad pivotal para µ. σ/ N b) Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ). Entonces: ¯ −µ X √ ∼ tN −1 es una cantidad pivotal para µ S/ N N −1 2 S ∼ χ2N −1 es una cantidad pivotal para σ 2 . σ2

CAP´ITULO 5. INTERVALOS DE CONFIANZA

86

Obs´ervese que si (X1 � . . . � XN ) es una muestra aleatoria de una poblaci´on N (µ ; σ), entonces: ¯ −µ X √ ¯ −µ X σ/ N � = √ ∼ tN −1 1 N −1 2 S/ N S 2 N −1 σ por deﬁnici´on de la distribuci´on t de Student con N − 1 grados de libertad. Cantidades pivotales para el caso de dos muestras a) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ), respectivamente. Entonces: ¯ − Y¯ − (µ1 − µ2 ) X � ∼ tm+n−2 y es una cantidad pivotal para µ1 − µ2 Sp m1 + n1 donde

2 (m − 1)SX + (n − 1)SY2 m+n−2 2 y SY2 , puede interpretarse como una ponderaci´on de las cuasi–varianzas muestrales SX correspondientes a cada una de las muestras.

Sp2 =

b) Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de las poblaciones X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ), respectivamente. Entonces: 2 SX /σ12 ∼ Fm−1;n−1 y es una cantidad pivotal para σ12 /σ22 . SY2 /σ22

Obs´ervese que, en la situaci´on descrita para dos muestras: 1 m−1 2 SX S 2 /σ 2 m − 1 σ12 = X2 12 ∼ Fm−1;n−1 1 n−1 2 SY /σ2 SY n − 1 σ22

de ah´ı la aﬁrmaci´on del apartado b). La comprobaci´on del primer apartado excede el nivel de este curso, y no se abordar´a.

2.2.

Intervalos de conﬁanza en poblaciones normales

Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de conﬁanza para los par´ametros de una poblaci´on normal. Distinguiremos diferentes casos: Primer caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ), con σ conocido. Entonces: � � ¯ + zα/2 √σ ¯ − zα/2 √σ � X X N N es un intervalo de conﬁanza para µ �al nivel 1−α), siendo zα el valor que veriﬁca P (Z > zα ) = α, para Z ∼ N (0 ; 1).

2. POBLACIONES NORMALES

87

Segundo caso: Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ N (µ ; σ). Entonces:

� ¯ +tN −1 ; α/2 √S ¯ −tN −1 ; α/2 √S � X es un intervalo de conﬁanza para µ �al nivel 1−α), X N N siendo tN ; α el valor que veriﬁca que P (tN > tN ; α ) = α. � (N − 1)S 2 (N − 1)S 2 � es un intervalo de conﬁanza para σ 2 �al nivel 1 − α), siendo b) � χ2N −1 ; α/2 χ2N −1 ; 1−α/2 χ2N ; α el valor que veriﬁca: P (χ2N > χ2N ; α ) = α. a)

�

Tercer caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales con igual desviaci´on t´ıpica: X ∼ N (µ1 ; σ) e Y ∼ N (µ2 ; σ) , respectivamente. Entonces: � � � � 1 1 1 1 ¯ − Y¯ + tm+n−2 ; α/2 Sp ¯ − Y¯ − tm+n−2 ; α/2 Sp + �X + X m n m n es un intervalo de conﬁanza para la diferencia de medias, µ1 − µ2 �al nivel 1 − α). Cuarto caso: Sean (X1 � . . . � Xm ) e (Y1 � . . . � Yn ) muestras aleatorias independientes de dos poblaciones normales: X ∼ N (µ1 ; σ1 ) e Y ∼ N (µ2 ; σ2 ) , respectivamente. Entonces: � � 2 2 SX /SY2 /SY2 SX � Fm−1 ; n−1 ; α/2 Fm−1 ; n−1 ; 1−α/2 es un intervalo de conﬁanza para la raz´on de varianzas, σ12 /σ22 �al nivel 1 − α), siendo Fm ; n ; α el valor que veriﬁca: P (Fm ; n > Fm ; n ; α ) = α. Observaci´ on: En el manejo de las tablas correspondientes a la distribuci´on Fm ; n , conviene tener en cuenta la siguiente relaci´on (obs´ervese el cambio de orden en los grados de libertad): Fm ; n ; 1−α = Fn ;1m ; α .

2.3.

Ejemplos

Ejemplo 36 Una empresa fabrica bombillas cuya duraci´on en horas sigue una distribuci´on N (µ ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constr´ uyase un intervalo de conﬁanza al nivel del 99 � para la vida media de las bombillas fabricadas por esa f´abrica. ´ n: Tenemos una muestra de tama˜ Solucio no N = 36 de una poblaci´on, X ∼ N (µ ; 200), de varianza conocida. Usaremos la cantidad pivotal: ¯ −µ X ∼ N (0 ; 1) ; 200/6 y, para α = 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral x¯ = 7000. En otras palabras, consideramos la igualdad: � � 7000 − µ P −c< < c = 1 − α = 0.99 . 200/6

CAP´ITULO 5. INTERVALOS DE CONFIANZA

88

De la tabla para una N (0 ; 1) se tiene c = zα/2 ≈ 2.58 (pues α/2 = 0.005). Construimos el intervalo de conﬁanza para µ, al nivel del 99 %, despejando µ en las desigualdades: −2.58 <

7000 − µ < 2.58 200/6

de manera que: 21000 + 258 21258 200 2.58 = = = 7086 6 3 3 21000 − 258 20742 200 2.58 = = = 6914 µ > 7000 − 6 3 3

µ < 7000 +

(de la desigualdad izquierda) (de la desigualdad derecha)

Resumiendo, el intervalo de conﬁanza para µ al nivel del 99 % para la muestra dada es: � � 200 200 2.58� 7000 + 2.58 = (6914 � 7086) . I = 7000 − 6 6 Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviaci´on t´ıpica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribuci´on N (µ ; σ), obt´engase un intervalo de conﬁanza al 99 � del contenido medio de nicotina por cigarrillo en esa marca. ´ n: En este caso se quiere estimar µ en una poblaci´on N (µ ; σ), con ambos par´ametros Solucio desconocidos. Partimos de una muestra de tama˜ no N = 16, con x¯ = 1.6 y cuasi–desviaci´on t´ıpica muestral � 16 s = 0.72 ≈ 0.723 . 15 Sabemos que en este caso hemos de usar la cantidad pivotal: 1.6 − µ x¯ − µ √ = 0.723/4 s/ N que sigue una distribuci´on t de Student con N − 1 = 15 grados de libertad. Para la muestra dada, el intervalo de conﬁanza para µ al nivel de conﬁanza 1 − α queda � s s � � 0.723 0.723 � = 1.6 − t15 ; α/2 � x¯ − tN −1 ; α/2 √ � x¯ + tN −1 ; α/2 √ � 1.6 + t15 ; α/2 4 4 N N siendo t15 ; α/2 el valor tal que P (t15 > t15 ; α/2 ) = α/2. Como en nuestro caso 1 − α = 0.99 entonces α = 0.01 y as´ı, de la correspondiente tabla para la distribuci´on t de Student, obtenemos: t15 ; α/2 = t15 ; 0.005 = 2.947 . El intervalo que nos piden es pues: � � 0.723 0.723 0.723 � 0.723 � = 1.6 − 2.947 1.6 − t15 ; α/2 � 1.6 + t15 ; α/2 � 1.6 + 2.947 4 4 4 4 ≈ (1.6 − 0.5327� 1.6 + 0.5327) = (1.0673� 2.1327) .

2. POBLACIONES NORMALES

89

Observaci´ on: En este ejemplo hemos tenido que calcular la cuasi–desviaci´on t´ ıpica muestral a √ partir de la desviaci´on t´ıpica muestral. Si seguimos el uso dado, denotando por v la desviaci´on � t´ıpica muestral, vemos que: √ √ √ v NN−1 s v N v √ = √ =√ √ =√ N −1 N N N N −1 Podr´ıamos haber expresado el intervalo de conﬁanza utilizando la desviaci´on t´ıpica muestral: √ √ � � v v x¯ − tN −1 ; α/2 √ � x¯ + tN −1 ; α/2 √ � N −1 N −1 pero no usaremos esta expresi´on, para no liar la notaci´on. Tan s´olo hemos de tener cuidado al tomar los datos del problema. Ejemplo 38 Una muestra aleatoria de una poblaci´on N (µ ; σ) ha dado los diez valores siguientes 6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6 . Constr´ uyase un intervalo de conﬁanza de σ 2 al 95 � . ´ n: Estamos ante una poblaci´on N (µ ; σ) de la que desconocemos ambos par´ametros. Para Solucio estimar por intervalos de conﬁanza σ 2 usaremos la cantidad pivotal N −1 2 S σ2 que sabemos sigue una distribuci´on χ2 con N − 1 grados de libertad. As´ı, de la muestra dada, tan s´olo usaremos la cuasi–varianza muestral: N 1 � ¯ 2. S2 = (Xi − X) N − 1 i=1

Los siguientes c´alculos dan con ella: 76.6 x¯ = = 7.66 10 1 (6.92 +5.72 +8.42 +9.32 +7.22 +8.52 +7.42 +9.12 +6.52 +7.62 ) − 7.662 varianza muestral: v = 10 598.82 = − 58.6756 = 59.882 − 58.6756 = 1.2064 10 10 12.064 ≈ 1.34 . s2 = v = 9 9 Para construir el intervalo pedido � (N − 1)s2 (N − 1)s2 � � χ2N −1 ; α/2 χ2N −1 ; 1−α/2

hemos de calcular χ2N −1 ; α/2 y χ2N −1 ; 1−α/2 , con N − 1 = 9, α/2 = (1 − 0.95)/2 = 0.025. Estos valores son, respectivamente: χ29 ; 0.025 = 19.023 ; χ29 ; 1−0.025 = χ29 ; 0.975 = 2.7 . Sustituyendo en la expresi´on del intervalo de conﬁanza para estimar σ 2 al nivel pedido, se obtiene: � � 9 · 1.34 9 · 1.34 � ≈ (0.634� 4.467) � 19.023 2.7 como intervalo de conﬁanza para estimar σ 2 al nivel del 95 %.

CAP´ITULO 5. INTERVALOS DE CONFIANZA

90

Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen ﬁnal fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuaci´on media de 76 con desviaci´on t´ıpica 6, y 28 del curso con hora complementaria una puntuaci´on media de 84 con desviaci´on t´ıpica 5. Obt´engase un intervalo de conﬁanza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales. ´ n: En las condiciones dadas es aplicable el intervalo Solucio � � � � 1 1 1 1 ¯ ¯ ¯ ¯ X − Y − tm+n−2 ; α/2 Sp + � X − Y + tm+n−2 ; α/2 Sp + m n m n con 15 540 = 14 14 700 2 2 28 n = 28 ; y¯ = 84 ; sY = 5 = 27 27

m = 15 ; x¯ = 76 ; s2X = 62

y (m − 1)s2X + (n − 1)s2Y m+n−2 540 14 14 + 27 700 1240 27 = = 15 + 28 − 2 41

s2p =

Sustituyendo α = 1 − 0.9 = 0.1, obtenemos, de la tabla para una distribuci´on t de Student con 15 + 28 − 2 = 41 grados de libertad1 : t41 ; α/2 = t41 ; 0.05 ≈ 1.684 En deﬁnitiva, el intervalo de conﬁanza para σ 2 al 90 %, dadas las dos muestras, es: � � � � � � 1240 28 + 15 1240 28 + 15 � 76 − 84 + 1.684 76 − 84−1.684 41 28 · 15 41 28 · 15 � � � � 1240 · 43 1240 · 43 � −6 + 1.684 = − 6 − 1.684 41 · 28 · 15 41 · 28 · 15 � � � � 62 · 43 62 · 43 � −6 + 1.684 ≈ (−8.9633� −3.0367) . = − 6 − 1.684 41 · 21 41 · 21

Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 N2 = 11

x¯1 = 4 x¯2 = 5

s1 = 3 s2 = 2.2 .

Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N (µi ; σi ), para i = 1� 2, obtener un intervalo de conﬁanza para el cociente de varianzas al nivel 0.80 . 1

En la tabla entregada en clase este dato est´a mal escrito: deber´ıa poner 1.684 en lugar de 1.648.

3. OTRAS POBLACIONES

91

´ n: Un intervalo de conﬁanza para el cociente σ12 /σ22 , al nivel 0.80 = 1 − α con α = 0.2, ser´a: Solucio � � S12 /S22 S12 /S22 � FN1 −1 ; N2 −1 ; 0.1 FN1 −1 ; N2 −1 ; 0.9 De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1): F12 ; 10 ; 0.1 = 2.2841 ; El intervalo queda:

3.

�

y:

F12 ; 10 ; 0.9 =

32 /2.22 32 /2.22 � 2.2841 1/2.1878

�

1 1 = ≈ 0.4571 . F10 ; 12 ; 0.1 2.1878

≈ (0.8141� 4.0682) .

Otras poblaciones

Cuando la muestra se obtiene de poblaciones con distribuci´on Bernoulli, o de Poisson, usaremos intervalos de conﬁanza asint´oticos, para ponernos en la situaci´on anterior. Para ello las cantidades pivotales utilizadas tendr´an una distribuci´on l´ımite (cuando N → ∞) independiente de par´ametros desconocidos. ´ n de Bernoulli Intervalos de confianza para una distribucio Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ B(1 ; p). Entonces: � � � � p � (1 − p � ) p� (1 − p�) ¯ ¯ X − zα/2 � X + zα/2 N N

¯ =“frecuencia relativa de es un intervalo de conﬁanza para p �al nivel 1 − α), siendo p� = X ´exitos”. Estamos utilizando la siguiente cantidad pivotal asint´otica: �

¯ −p X

p�(q − p�)/N

∼ N (0 ; 1) (aproximadamente, para N grande) .

´ n de Poisson Intervalos de confianza para una distribucio Sea (X1 � . . . � XN ) una muestra aleatoria de una poblaci´on X ∼ Poisson (λ). Entonces: � � � � � � ¯ ¯ X − zα/2 λ/N � X + zα/2 λ/N � = X. ¯ es un intervalo de conﬁanza para λ �al nivel 1 − α), siendo λ

En este caso, la cantidad pivotal asint´otica es:

¯ −λ X � ∼ N (0 ; 1) (aproximadamente, para N grande) . � λ/N

CAP´ITULO 5. INTERVALOS DE CONFIANZA

92

4.

M´ınimo tama˜ no muestral

Un problema muy relacionado con la construcci´on de intervalos de conﬁanza es el de determinar el m´ınimo tama˜ no muestral necesario para obtener una determinada precisi´on en nuestra estimaci´on. Es decir, cu´antos elementos tenemos que observar, al menos, para que el error cometido con la estimaci´on no supere cierta cantidad. Deﬁnici´ on 4.1. El error de una estimaci´on por intervalos de conﬁanza (al nivel 1 − α) es la semi– amplitud del intervalo obtenido. Ejemplo 41 Determinar el m´ınimo tama˜ no muestral de una poblaci´on N (µ ; σ = 5), para que el error de la estimaci´on por intervalos de conﬁanza para µ al 95 �, no sea superior a 0.5. ´ n: Estimaremos µ mediante un intervalo de conﬁanza de la forma: Solucio � � σ σ ¯ − zα/2 √ � X ¯ + zα/2 √ X N N con lo cual el error cometido ser´a

σ Error = zα/2 √ . N

Siendo α = 1 − 0.95 = 0.05, α/2 = 0.025y σ = 5, se quiere obtener el m´ınimo valor de N para que: 5 5 z0.025 √ = 1.96 √ ≤ 0.5 N N

de donde:

N≥

� 5 · 1.96 �2 0.5

= 19.62 = 384.16 .

Es decir, necesitaremos observar 385 elementos para conseguir la precisi´on deseada (error ≤ 0.5) para esa estimaci´on. Para otros intervalos, un c´alculo similar nos llevar´ıa a determinar, en cada caso, el m´ınimo tama˜ no muestral. T´engase en cuenta que este m´ınimo tama˜ no muestral ha de tomarse como un valor orientativo. As´ı, si obtenemos, para determinada precisi´on, un m´ınimo tama˜ no muestral de 196, entenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el m´ınimo tama˜ no muestral depende de la muestra concreta obtenida.

5.

Intervalos de conﬁanza m´ as frecuentes

Recogemos por u ´ltimo, los intervalos de conﬁanza antes obtenidos, y alg´ un otro, en una lista esquem´atica. Se utiliza la siguiente notaci´on (X1 � . . . � Xn ) muestra aleatoria (m.a.) de X. n

1� x¯ = xi � n i=1

n

1 � s = (xi − x¯)2 � n − 1 i=1 2

I = (a ± �) = (a − �� a + �)

´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS

93

1. X ∼ N (µ� σ)

 � � σ   √ I = x ¯ ± z  α/2  n Intervalo de conﬁanza 1 − α para µ: � �  s    I = x¯ ± tn−1;α/2 √ n �

Intervalo de conﬁanza 1 − α para σ 2 : I = 2. X ∼ B(1� p) (muestras grandes). Intervalo de conﬁanza 1 − α para p: I = 3. X ∼ P (λ) (muestras grandes). Intervalo de conﬁanza 1 − α para λ: I =

�

σ desconocida

(n − 1)s2 (n − 1)s2 � χ2n−1;α/2 χ2n−1;1−α/2

x¯ ± zα/2

�

σ conocida

�

x¯(1 − x¯) n

�

�

� � x¯ x¯ ± zα/2 n

4. Dos poblaciones Normales independientes X ∼ N (µ1 � σ1 ), Y ∼ N (µ2 � σ2 ) independientes

(X1 � . . . � Xn1 ) m.a. de X; se calcula x¯ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula y¯ y s22 . s2p =

(n1 − 1) s21 + (n2 − 1) s22 n1 + n2 − 2

Intervalo de conﬁanza 1 − α para µ1 − µ2 : �  � 2 2 σ1 σ2  I = x¯ − y¯ ± zα/2 + n 1 n2 I=

�

x¯ − y¯ ± tn1 +n2 −2;α/2 sp

�

I = x¯ − y¯ ± tf ;α/2

�

�

1 1 + n1 n2 

s2 s21 + 2 n1 n2

donde f = entero m´as pr´oximo a

Intervalo de conﬁanza 1 − α para

σ1 , σ2 conocidas

�

σ1 � σ2 desconocidas, σ1 = σ2

σ1 � σ2 desconocidas, σ1 �= σ2

(s21 /n1 + s22 /n2 )2 �s21 /n1 )2 n1 +1

σ12 /σ22 :

+

�s22 /n2 )2 n2 +1

I=

�

−2 s21 /s22

Fn1 −1;n2 −1;α/2

�

(s21 /s22 ) Fn2 −1;n1 −1;α/2

�

CAP´ITULO 5. INTERVALOS DE CONFIANZA

94

5. Comparaci´on de proporciones (muestras grandes e independientes) X ∼ B(1� p1 ), Y ∼ B(1� p2 ), independientes.

(X1 � . . . � Xn1 ) m.a. de X; se calcula x¯ y s21 . (Y1 � . . . � Yn2 ) m.a. de Y ; se calcula y¯ y s22 .

�

Intervalo de conﬁanza 1 − α para p1 − p2 : I = x¯ − y¯ ± zα/2

�

 x¯ (1 − x¯) y¯ (1 − y¯)  + n1 n2

6. Datos emparejados (X� Y ) ∼ Normal bivariante (µ1 � µ2 � σ1 � σ2 � ρ).

(X1 � Y1 )� . . . � (Xn � Yn ) m.a. de (X� Y ).� � � D = X − Y ∼ N µ = µ1 − µ2 � σ = σ12 + σ22 − 2 ρ σ1 σ2 (D1 � . . . � Dn ) m.a. de D, donde Di = Xi − Yi . Intervalos de conﬁanza 1 − α para µ ´o σ: aplicar Apartado 1 a la variable aleatoria D

´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS

95

Problemas 1. En una poblaci´on se desea conocer la probabilidad de que un individuo sea al´ergico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 al´ergicos. Hallar el intervalo de conﬁanza al 95 % para la probabilidad pedida. ¿Cu´antos individuos se deber´ıan observar para que, con el mismo nivel de conﬁanza, el error m´aximo en la estimaci´on de la proporci´on de al´ergicos sea del 0.01? 2. Se supone que el n´ umero de erratas por p´agina en un libro sigue una distribuci´on de Poisson. Elegidas al azar 95 p´aginas, se obtuvieron los siguientes resultados: N´ umero de erratas N´ umero de p´aginas

0 40

1 30

2 15

3 7

4 2

5 1

Hallar el intervalo de conﬁanza al 90 % para el n´ umero medio de erratas por p´agina en todo el libro. 3. Se mide el tiempo de duraci´on (en segundos) de un proceso qu´ımico realizado 20 veces en condiciones similares, obteni´endose los siguientes resultados: 28 � 25 � 32 � 25 � 28 � 26 � 31 � 29 � 26 � 26 � 23 � 18 � 20 � 16 � 24 � 17 � 22 � 23 � 25 � 21 .

4.

5.

6.

7.

8.

Suponiendo que la duraci´on sigue una distribuci´on Normal, hallar los intervalos de conﬁanza al 90 % para ambos par´ametros. La vida activa (en d´ıas) de cierto f´armaco sigue una distribuci´on N (1200 ; 40). Se desea enviar un lote de este f´armaco de manera que la vida media del lote no sea inferior a 1180 d´ıas, con probabilidad 0.95. Hallar el tama˜ no del lote. Una noticia en el peri´odico dice que, de 1000 personas encuestadas sobre una cuesti´on, 556 se muestran a favor y 444 en contra, y concluye aﬁrmando que el 55.6 % de la poblaci´on se muestra a favor, con un margen de error de ±3 %. ¿Cu´al es el nivel de conﬁanza de esta aﬁrmaci´on? Se quiere estudiar la proporci´on p de declaraciones de la renta con alg´ un defecto. En una muestra preliminar peque˜ na (muestra piloto) de tama˜ no 50 se han observado 22 declaraciones defectuosas. ¿Cu´al es el tama˜ no muestral necesario para estimar p cometiendo un error m´aximo de 0.01 con una probabilidad 0.99? En una gran zona ganadera se desea estimar la proporci´on de ovejas que sufren cierta enfermedad degenerativa. Calcular el tama˜ no muestral necesario para estimar esta proporci´on con un error menor que 0.03 a un nivel de conﬁanza del 0.95, sabiendo que, en una peque˜ na muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos: N1 = 13 x¯1 = 4 s1 = 3 N2 = 11 x¯2 = 5 s2 = 2.2 . Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N (µi ; σi ), para i = 1� 2, se pide: a) Hallar un intervalo de conﬁanza para el cociente de varianzas al nivel 0.80 . b) Obtener un intervalo de conﬁanza para µ1 − µ2 , con nivel de conﬁanza 0.95 . c) ¿Cu´antos individuos habr´ıa que observar para estimar µ1 con un error m´aximo de ±0.2 y un nivel de conﬁanza de 0.95?

96

CAP´ITULO 5. INTERVALOS DE CONFIANZA

9. Para construir un intervalo de conﬁanza de la media poblacional de una N (µ ; σ) con σ conocida, se ha utilizado una muestra de tama˜ no n y se ha obtenido el intervalo del 95 %. ¿C´omo ha de ser modiﬁcado el tama˜ no de la muestra para obtener el mismo intervalo con una conﬁanza del 99 %? 10. Una f´abrica elabora dos art´ıculos A y B, cuya demanda aleatoria sigue una distribuci´on normal de medias µA y µB desconocidas, y desviaciones t´ıpicas σA = 100 y σB = 50. Observados 100 puntos de venta, la demanda media de dichos art´ıculos ha resultado de 200 y 150 unidades, respectivamente. Constr´ uyase un intervalo de conﬁanza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se comprob´o que 280 se hab´ıan suscrito a cierto canal de televisi´on. Obt´engase un intervalo de conﬁanza del 95 % de la proporci´on real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una m´aquina produce engranajes cuyo di´ametro, debido a imperfecciones inherentes al funcionamiento de la m´aquina, es una variable aleatoria con distribuci´on N (µ ; σ = 0.03), de forma que µ puede ser ﬁjada a voluntad mediante un reglaje de la m´aquina. Para que un engranaje sea utilizable, su di´ametro debe estar comprendido entre 15.50 y 15.60 mm. Calc´ ulese: a) el valor de µ que hace m´axima la proporci´on de engranajes utilizables y dicha proporci´on m´axima. b) el tama˜ no n de la muestra de engranajes necesario para poder construir, a partir de la media muestral x¯, un intervalo de conﬁanza de µ al 95 % de amplitud menor que 0.02 mm. 13. De una poblaci´on normal de media µ desconocida se selecciona una muestra de tama˜ no n = 10, resultando: 40, 45, 39, 46, 58, 52, 50, 45, 57, 49 . Constr´ uyase un intervalo de conﬁanza al 95 % para el par´ametro µ, suponiendo que: a) la varianza poblacional es σ 2 = 49; b) la varianza poblacional es desconocida. 14. Sabiendo que X sigue una distribuci´on N (µ ; σ = 4), calc´ ulese el tama˜ no muestral m´ınimo para que, con una conﬁanza del 99 %, el intervalo (¯ x − 1.5� x¯ + 1.5) contenga al par´ametro µ. 15. El di´ametro (en cent´ımetros) de diez piezas met´alicas de forma esf´erica, seleccionadas al azar de la producci´on de una m´aquina, result´o 2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 . a) Suponiendo que el di´ametro sigue una distribuci´on normal, constr´ uyase un intervalo de conﬁanza al 95 % del di´ametro medio de las piezas producidas por esta m´aquina. b) ¿Cu´al deber´a ser el tama˜ no muestral m´ınimo si, a este nivel de conﬁanza, se pretende dar un intervalo de estimaci´on cuya amplitud no supere los 0.02 cm? 16. Con objeto de decidir si un nuevo proceso de fabricaci´on da mejores resultados que el antiguo, en cuanto a la proporci´on de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente. a) Obt´engase un intervalo de conﬁanza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos. b) ¿Se puede aﬁrmar que el n´ umero de elementos defectuosos es signiﬁcativamente menor en el nuevo proceso?

´ FRECUENTES 5. INTERVALOS DE CONFIANZA MAS

97

nos de funciona17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros a˜ miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de conﬁanza de nivel 0.95 para la probabilidad pedida. ¿Cu´antas piezas se deber´ıan observar para que, con el mismo nivel de conﬁanza, el margen de error en la estimaci´on de la proporci´on de fallos sea de ±0.01? 18. En una poblaci´on, la altura de los individuos varones sigue una distribuci´on N (µ; σ = 7.5). Halla el tama˜ no de la muestra para estimar µ con un margen de error inferior a ±2 cm. para un nivel de conﬁanza 0.90. 19. En una explotaci´on minera, las rocas excavadas se someten a un an´alisis qu´ımico para determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribuci´on normal de media µ y varianza σ 2 . Despu´es de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con una cuasidesviaci´on t´ıpica de 3.164. La explotaci´on comercial de este mineral es econ´omicamente rentable si el contenido medio en la mina es superior al 8 %. a) Construye un intervalo de conﬁanza de nivel 95 % para el contenido porcentual medio de cadmio en la mina. b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a trav´es de la varianza σ, que debe ser menor al 3 %. Construye un intervalo de conﬁanza de nivel 95 % para σ 2 . 20. Como parte de un estudio para la reducci´on de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. Sea X el n´ umero de kil´ometros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el n´ umero de kil´ometros recorridos con un litro de gasolina con el aditivo. Se observan los kil´ometros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son: 4 � i=1

xi = 25.4

4 � i=1

yi = 31.2

4 � i=1

x2i

= 173.53

4 �

yi2 = 261.22

i=1

a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especiﬁcando las hip´otesis necesarias, calcula un intervalo de conﬁanza al 95 % para la diferencia de medias. b) A la vista del intervalo obtenido en a), ¿hay alguna indicaci´on de que el aditivo tiene alg´ un efecto en el n´ umero de kil´ometros recorridos por litro de gasolina? 21. Se admite que el n´ umero de microorganismos en una muestra de 1 mm c´ ubico de agua de un r´ıo sigue una distribuci´on de Poisson de par´ametro λ. En 40 muestras se han detectado, en total, 833 microorganismos. Calcula un estimador puntual y un intervalo de conﬁanza al 90 % para λ.

Recommend Stories

Story Transcript

Get in touch

Social