Story Transcript
Tema 5 - Inferencia Estadística: ESTimación
Tema 5 - Infercncia Estadística: Estimación
5.3 Muestreo aleatorio simple Una muestra se conoce como 1nuestra aleatoria sbnple (171.a.s.) si:
Tema 5 .r Inferencia Estadística: Estimación
l. Cada elenlento de la población tiene la 171;SI11a probabilidad de ser elegido en cada selección de uno de sus componentes. 2. Las selecciones se realizan con reel1lplazanliento, y entonces la probabilidad de elegir cualquier elenlento de la población es idéntica en todas las selecciones. La primera condición a(z(a/2)] =~
es entero, se redondea al entero 111ás cercano.
5.4.5.2.6 Distribución en el muestreo de la razón de dos "arianzas de poblaciones normales
Operando, obtenemos:
P[-z(a/2)~ Z ~ z(a/2)) =l-a
Dadas dos muestras aleatorias simples, independientes, de tamaños ni Y n 2 , de dos poblaciones l1o/7nales, se verifica que:
~ p[-z(a/2)~ :/:}f; ~ z(a/2)] == )-a
S2/ 2 1 aJ
S2J a.,2 =~S2a·J F"1-1."2- 1 52 a 2 2/
2
~ 1-z(a/2)-J;;~X -~ ~ z(a/2}i]= )-a
Este resultado se aplica en la esti111ación por intervalos y contrastes de hipótesis en relación a la razón de las varianzas de dos poblaciones nornlales.
~ p[ X+z(a/2)i~ ~ ~ X-z(a/2)-J:;] =)-a
5.4.5.3 Intervalos de confianza 5.4.5.3.1 Introducción
~ p[ X- z(a/2)i~~ ~ X +z(a/2)±]== )-a
Una vez dados los resultados para las distribuciones nluestrales de estimadores de la última sección, podemos plantear ahora la construcción de los llamados intervalos de confianza.
e con
Llamaremos intervalo de confianza para el parámetro confianza 1- a , a una expresión del tipo:
nivel, o coeficiente, de
Finalmente, si seleccionamos una m.a.s. de tamaño 12 de una población nonnal con varianza conocida, cr 2, Y calculamos su media x, el intervalo de confianza del (1- a )100% para Jl viene dado por
el =x- z(a/2) vil a,
el~e~e2
y
e2= x + z(a/2) vil a,
es decir, los lbllites del intervalo vienen dados por:
e
donde los límites 8\ y 2 del intervalo dependen de la 171uestra y se calculan de manera tal que, si construimos intervalos de este tipo para l1luchas nluestras distilltas, 1000- a )0/0 de ellos contendrán el verdadero valor del parámetro (y lOen % no contendrán este valor). Por ejemplo, un intervalo de confianza para el parámetro con nivel 0,95 tiene la propiedad de que el 95% de los intervalos de este tipo contienen e) verdadero valor de] parámetro (y el 50/0 no).
e
5.4.5.3.2 Intervalo de confianza para
~
(muestra normal; cr conocida)
Para introducir la construcción de intervalos de confianza, consideramos la situación descrita anteriomlente en la sección 5.4.5.2.2. En este caso, sabemos que:
!X; (Jl, crr ')
X -_.i.=L. 12
N
I
Vil)
y entonces
cr
x±z(a/2) .¡;; Es importante notar que si tenemos una muestra de datos y construimos un intervalo de confianza de este tipo, el valor verdadero de Jl está de12tro o fuera de, este intervalo. Entonces, la uprobabilidad" de que el verdadero valor de Jl esté dentro de este intervalo es
°
ó 1.
Ejemplo 5.2 Un fabricante produce focos cuyos tieInpos de vida siguen una distribución normal con desviación típica de 40 horas. Si una muestra de 30 focos tiene un tiempo de vida media de 780, encuentre un estimación puntual, y un intervalo de confianza del 96%, para la media poblacional de todos los focos que produce esta empresa.
Solución z=X-Jl
crj'¡;;
-N(O,I)
Luego,
P[-z(a/2) ~ Z ~ z(a/2)) = l-a donde :( a
(e 1,e 2) donde:
/2)
es un valor de la distribución norma) estándar tal que:
15
Aquí, cr = 40,
12
= 30,
x = 780. Una estimación puntual de la media poblacional es
¡l =x =780. De la tabla de la distribución normal estándar,z(0,02) == 2,05 y entonces un intervalo de confianza de Jl del 96% es:
.x ± z(0,02)
a, : : 780 ±
vn
2,05
]6
~:= (765 ; 795)
,,30
Tema 5 - Inferencia Estadistica: Estimnción
Tema 5 . Inferencia Estadística: E.\"t;mació"
5.4.5.3.3 Otros inter\'alos de confianza importantes Utilizando los resultados para las distribuciones muestrales de estimadores introducidos en la sesión 5.4.5.2, y siguiendo un procedimiento análogo a el de la sección antérior, podemos obtener los siguientes intervalos de confianza.
Si la varianza no es conocida, podemos aproximar su valor por 6':! . En este caso, un intervalo de confianza para Jl, de nivel aproxil11adamente (1 - a. )1000/0 , viene dado por: Ó
-+ "7(a/2) vn I
x_"\:
5.4.5.3.3.1 Intervalo de confianza para J.1 (población normal; (j desconocido) Si tenemos una m.a.s. de tamaño n de una población nonnal con varianza desconocida, un intervalo de confianza para Jl, de nivel (I - ( l )100% viene dado por:
(j 2
x±t._¡(a/Z) ~ donde t n _ J (a/2) es el valor de la distribución t de Student con n - 1 grados de libertad que deja un área de a /2 a la derecha.
Ejemplo 5.3 Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos diámetros son 1,01, 0,97, 1,03, 1,04, 0,99, 0,98, 0,99, 1,01 Y l,03 centímetros. Encuentre una estimación puntual y un intervalo de confianza del 99% para el diámetro medio de piezas producidos por esta máquina, se supone una distribución nonnal. Solución Aquí,
11
= 9,
~
~Xi
~ ")
~xt=9,1051.
=9,05 y
estimación puntual de la media poblacional es distribución 1 de Student, 18 (0,005) = 3,36 Y
1)
2,x. 9
J
LXí2_~ s=
ti
(
n
;=1
il = x = 1,005.
s
.
S
0,024551533 ~
==
(
0,978 ; 1,033
)
5.4.5.3.3.2 Intervalo de confianza para J.1 (muestras grandes; población no-normal) Si tenemos una m.a.s. de tamaño n grande (n ~ 30) de una población no-nornza/ cualquiera, con varianza (j:! conocida, un intervalo de confianza para Jl, de nivel aproximadamente (I - (l )100% viene dado por: (j
x±.:(a/2) .¡;;
~=
~4¡g
5.4.5.3.3.3 Intervalo de confianza para una proporción (muestras grandes) Si tenemos una m.a.s. de tamaño n grande (n ~ 30) de una población de Benl0ulli, un intervalo de confianza para la proporción p, de nivel aproxinzadalncnte (}- a )1000/0, viene dado por:
p±z(a/Z) (Pq V~
Ejemplo 5.5 Calcule una estimación puntual, y un intervalo de confianza del 980/0, para la proporción de artículos defectuosos en un proceso, suponiendo que en una muestra de tamaño 100 se han encontrado ocho artículos con defecto.
Entonces un intervalo de confianza de Jl del 990/0 es: X±ls (0,005 ) .¡;;::: 1,005±3,36
Solución Una estimación puntual de la media poblacional es Ct = x = 4,113. El tamaño de la muestra es grande y entonces podemos utilizar una aproximación normal. Como, para la distribución de Poisson cr 2 = Jl, estimamos ]a varianza de la población por 6" 2 = Ji = x = 4,113 . Luego, un intervalo de confianza para Jl de nivel aproximadamente 950/0 es: 3 x ± z(0,025) 4,113 ± 1,96 '" (3,57 ; 4,66) vn ~53
De la tabla de la
(9,05):! 9,1051- -9- =0,024551533
"
11-1
9,05 . Entonces, x=-9-=1,005 y una
Ejemplo 5.4 En una m.a.s. de tamaño 53 de una población de Poisson, x = 4,113. Encuentre una estimación puntual y un intervalo de confianza del 950/0 para la media poblacional.
Solución Una estimación puntual de la media poblacional es p = ~00 = 0,08. El tamaño de la muestra es grande y entonces podemos utilizar una aproximación normal para calcular el intervalo de confianza. De la tabla de la distribución normal estándar, z( 0,01) ~ 2,33 Y entonces un intervalo de confianza para p de nivel aproximadamente 98% es:
p±z(O,Ol)
f!"
p q =0,OS±2,33, 11
/(0,OS)(O 92) .,..,..' =(0,017; 0,143)
Tema 5 - Inferencia E.HadíJTica: ESTimación
TelJla 5 _ inferC'ncia Estadística: Est;mación
5.4.5.3.3.4 Intervalo de confianza para cr ~ (población normal) Si 5~ es la varian:a (corregida) 111ue5rra/ de una nl.a.s. de tamaño 11 de una población /lor/nal, un intervalo de confianza para cr 2 de nivel (1- a)1 00%, viene dado por: (12 - 1) s 2
--~cr";~--2
X:-I(CY;)
donde
X:-I(CY;) y xL¡( 1-~)
Xn
son valores de la distribución chi-cuadrado con
12-1
Solución
= 10,
Ó';,
(
Ejemplo 5.6 Se han nledido los siguientes valores (en miles de personas) de la audiencia de un programa de TV en distintos días: 521, 742, 593, 635, 788, 717, 606, 639, 666, 624. Encuentre, en la hipótesis de normalidad, estimaciones puntuales e intervalos de confianza de nivel del 9590 de la audiencia media y la varianza.
1l
conocemos las varianzas poblacionales, cr)2 y cr;, es necesario estinlarlas por
_1(1-CY;)
grados de 1ibertad que dejan áreas de a /2 y 1- 0./2, respectivamente, a la derecha.
Aquí,
110
respectivamente. En este caso un intervalo de confianza para aproxi111adalnente (I - a )1000/0, viene dado por:
(12 - ])5 2
..
Si
10
ro
i=1
i=1
LXi = 6531 Y Lx;:! =4320401. Entonces,
x = 653,1 Y52 = 6] 11,65.
Una estimación puntual de la audiencia Inedia es f1 = x = 653,] Y una de la varianza es 6" 2 = 52 = 6111,65. Un intervalo de confianza del 950/0 para Jl es:
x ±19 (0,025)+ = 653,1 ± 2,26~6111,65 ~ (597 ; 10
"Vil
709)
Un intervalo de confianza del 95% para cr 2 es: 9(6111,65) 19,0
.,
9(6111,65) 2,70
5.4.5.3.3.5 Intervalo de confianza para J.l I - Jl2 (muestras grandes; poblaciones no normales) En la sección 5.4.5.2.5 deducimos que, para 111ueslras grandes, independientes y de poblaciones 12o-nornlales, la distribución en el muestreo de (X, - X2 ) es aprOXi/lladaUlenre: al2
cr;
11 1
11 2
1l2)' -+~
J
Utilizando este resultado, un intervalo de confianza para viene dado por:
",
n2
XI-X2)±z(a./2),/~+~
Ejemplo 5.7 Tomamos dos muestras aleatorias simples, independientes, de dos poblaciones de Poisson: una de tamaño 62 con media muestral 3,62 y otra de tamaño 74 con media muestral 3,84. Encuentre una estinlación puntual, y un intervalo de confianza de nivel del 920/0, para la diferencia entre las medias de las dos poblacionales. Solución Una estimación puntual de la diferencia entre las medias poblacionales, Jl 1 - Jl2 es Ct, - Ct2 =X, -.x2 =3,62 - 3,84 = -0,22.. Los tatnaños de lac; muestras son grandes y entonces podemos utilizar la aproxiInación normal para construir el intervalo de confianza. Sabemos que, para una distribución de Poisson, O' 2 = Jl Y entonces estimamos cr l2 por = Jl, = Xl = 3,62 Y cr22 por ó~ = ft2 = x2 =3,84. Luego, un intervalo de confianza para la diferencia entre las medias poblacionales de nivel aproximadamente 92% es:
6;
(XI -
x2 )± Z(O,04)Jcr ~ + cri ~ -0,22 ± 1,75 /3,62 + 3,84 11, n2 V 62 74
=:
(-0,80; 0,36)
(J;
es decir, (2895 ; 20372).
-
.... 2
Jl2' de nivel
5.4.5.3.3.6 Intervalo de confianza para PI - P2 (nluestras grandes) Con1o caso particular del último resultado, si las dos poblaciones son de Bernoulli. • X, = PI' x2 = P2 Y podemos estimar 0'12 por p,q, y por P2q2' don..de q¡ = (1- Pi)· Entonces, para 111ueslras grandes, un intervalo de confianza para Pl - P2' de nivel aproxiJnadal11enle(I - a. )1000/0, viene dado por:
---~cr-~---
N ( (1l1
.... 2
JlI -
a¡ y
J.l, - J.l2' de nivel
(PI - P2)±z(a/2) P,q, " 1
+
P2Q2 11 2
Ejemplo 5.8 Se comparan las producciones de dos máquinas, A y B, que fabrican en serie. En una muestra de 200 elenlentos de A, resultaron 16 defectuosas, mientras que en otra de 100 de B resultaron 12 defectuosas. Encuentre una estimación puntual, y un intervalo de confianza de nivel aproximadamente 95%, para la diferencia de las proporciones de elCInentos defectuosos producidos por las dos máquinas.
aproxinladaJl1ellIe (] - a)1 000/0,
(XI - X1) 11) ter," er; . . ± ...-(a /-+--= )
11,
n2
Solución Una estimación puntual de la diferencia entre las dos proporciones PA - PB' es
P
A -
1) B
= 1~OO -
poblacionale~
17{00 =0,08 - 0,12 = -0,04. Los tamaños de las muestras
Tema 5 . Inferencia Estadística: Estimación
Tema 5 . Inferencia EstadíStica: Estimación
son grandes y entonces podemos utilizar la aproximación normal para construir el siguiente intervalo de confianza:
(p
A-
ftB) ± z( 0,025),1 pA
A
+ PBqB= -0,04 ± 1,96 J( 0,08)(0,92) + (0,12)(0,88)
nA
V
ns
200
100
== (-0,114 ; 0,034)
5.4.5.3.3.7 Intervalo de confianza para JlI - Jl2 (poblaciones normales) Como vimos en la sección 5.4.5.2.5, en el caso de dos muestras independientes de poblaciones nonnales, la distribución en el muestreo de (XI - X2 ) es exactamente:
crl2
cr;]
N (Jl - Jl ), -+--= [ ) 2 1~ n2
Entonces, un iotervalo de confianza para JlI - Jl~, de nivel exactamente viene dado por:
0- a)1 000/0,
0 o; (XJ -x2 )±z(a/2) -l...+-=
grados de libertad, que deja un área de a /2 a la derecha. Si v no es entero, se redondea al entero más cercano. Ejemplo 5.9 Se sabe que los números diarios de piezas fabricados por dos máquinas, A y B, tienen distribuciones nonnales. El número de piezas fabricadas por la máquina A en cinco días ha sido: 50, 48, 53, 60 Y37. En esos mismos días, la máquina B ha hecho: 40, 51, 62, 55 Y64 piezas. Encuentre: a) Una estimación puntual para la diferencia entre las dos medias poblacionales. b) Un intervalo de confianza del 950/0 para la diferencia entre las dos medias poblacionales, suponiendo que:
2
nI
n2
= 8 ya; = 9.
i)
(J)2
ii) iii)
Las varianzas poblacionales son desconocidas pero son iguales. Las varianzas poblacionales son desconocidas y no son iguales.
Este último resultado supone que sabemos los valores de los parámetros poblacionales
cr l2 Y cr;. Si no conocemos sus valores, es necesario estimarlos. Como vimos en la sección 5.4.5.2.5, si cr)'2 = cri = cr 2, estimamos la varianza cOll11¡n, cr 2, por: S2
(ni
-l)s~ +(11 2 -1)s~ ni +n 2 -2
En este caso un intervalo de confianza para JlI - Jl 2 , de nivel exactalnente viene dado por: ~
-
2
nI
ii)
s donde tlll+1I2_2(a/2) es el valor de la distribución t de Student con nI + n 2- 2 grados de libertad, que deja un área de a /2 a la derecha.
11 2
donde t\, (a /2) es el valor de la distribución t de Student co~:
5
5,8)
2
=
4(S,38f +4(9,61)2 8
=8129 '
Y t 8 (0,025) = 2,31. Entonces, el intervalo es:
Si cr J2 y cri son distintas, estimamos cr l2 por s~ y cri por si. Luego, un intervalo de confianza para Jl I - Jl 2 , de nivel aproximadamente (J -a )]00%, viene dado por:
ni
5
11 2
En este caso,
2
2 2 J (XI - x2 )± t v (a/2),/( :1-+.:2
2
2
cr cr =-4,8±1,96~2 (x) -X2 )±z(0,025),/-l...+-l.. - +9- =(-15,4;
0- a)] 00%,
(XI - x2 )±t" +11 _.,(a/2),ls2(2.+~J n) n 1
Solución A partir de los datos, se puede calcular: xA = 49,6 ; xB = 54,4 ; SA = 8,38 Y SB = 9,61. a) Estimamos JlA - Jl B por }lA -}lB = XA- XB = 49,6- 54,4 = -4,8. b) i) Un intervalo de confianza para la diferencia entre las medias poblacionales de nivel 950/0, viene dado por:
(XI- - X- 2 )±t8 (0,025),/s-.,(-1+ -] nI
iii)
n2
J=-4,8±2,31 ~81,2{-+1 1J=(-18,0; 8,4) 5 5
En este caso,
2
8,38 9,612 ( - 5- + -5
J
Tema 5 - Infcrcncia Esradí.Hica: Esti11lllciún
Tema 5 - Inferencia Estadística: Estimación
Redondcando al entcro más cercano, v = 8. Entonces, el intervalo es: _
_
SI
s;
1Z 1
11:
J(
8,38 5
9,61 5
1(2"J =-4,8±2,31 - -2+ -2J =(-18,0; (x l -x:J±t8 (O,025),/-+
8,4)
5.4.5.3.3.8 Intervalo de confianza para la razón de varianzas (poblaciones normales) Suponganl0s que tenemos dos nluestras aleatorias simples independientes de tamaños 11 1 y 11 2 , respectivamente, de dos poblaciones nOr/na/es. Utilizando el resultado de la sección 5.4.5.2.6, un intervalo de confianza para cr l2 /o~, de nivel (I - a)l 00% , viene dado por: s; 1 a 2 S2 S2 F 2 .,-1.•,-1 (a. /2) 5: -l... a 22 -< ...L si F.,-1.•,-1 (a. /2 )
5.4.5.3.4 Determinación del tamaño nluestral Hasta ahora supusimos que el tamaño de una muestra era conocido. En la práctica. cuando estamos diseñando un experiJnento aleatorio, la determinación del taInaño de una nluestra es crucial. No queremos un tamaño más grande que lo necesario, porque no queremos gaslarnlás Inedias (tiempo, dinero, etc.) que los absolutamente necesarios. Por otro lado, si el tamaño de la muestra es demasiado pequejio, no será posible alcanzar una precisión adecuada. Las fórmulas obtenidas anteriormente para los intervalos de confianza, nos penniten deducir el tamaño muestral necesario para una precisión especificada. A continuación, consideramos dos casos particulares. 5.4.5.3.4.1 Estimación de una media
Supongamos que utilizamos una m.a.s. para construir un intervalo de confianza de nivel (I - a)1 000/0 para la media, )1, de una población. Según se ha visto en las secciones 5.4.5.3.2 y 5.4.5.3.3.2, el intervalo viene dado por: O'
donde Fnl_l.n~_)(a/2) es el valor de la distribución F de Fisher-Snedecor con nI -1 y 112 - 1grados de libertad, que deja un área de a /2 a la derecha. Fn~-J.'II_I (u /2) es análogo para 11 2 - 1 Y 11 1 - 1 grados de libertad.
Ejenlplo 5.10 Dos muestras dc dos poblaciones normales han dado los siguientes resultados:
IX;=12 y IX;"=46; 1:1
/1 2
= 11,
IY;=22
el valor (Este intervalo es exacto si la población es nOr1nal y una aprox;l1lación si la población es llo-nor1llal pero el tamaño de la muestra es grande.) Entonces, la al1lp/itud del 11
1
= 8,
intervalo es 2z(aj2)
a,-.. Si queremos un intervalo de amplitud 2L, es decir x± L,
vn
L= z(a./2) ~
y Iy;2=80. Calcule una estimación
i=1
1=)
x±z(a /2) .¡;;
i=J
y entonces,
puntual. y un intervalo de confianza de nivel 90%, para 0'12 / cr22 •
z2(a/2}cr2 11
Solución Aquí: 46 _ (12)2 Sl2
=
7 8
Obviamente, esta últiJna fórmula exige conocer O' 2. Cuando cr 2 sea desconocida tendremos que tomar una 111ueslra pilolo pequeña para conseguir una estimación, Ó 2 , de 2 2 2 0 y reemplazar cr por para estimar Il.
80- (22)2 =4
Entonces, una estimación puntual para
Y
s; =
ai la;
10
11
confianza de nivel 90% para (512 / a ; es:
J=(0,35 ; 4,04)
4] 4 ( (3,6) (3,1355); (3,6) (3,6365)
a
=3,6
4 s¡ Isi = 3.6 = 1,11
es
L2
Y un intervalo de
Ejemplo 5.11 Los tiempos de vida de los focos producidos por un fabricante tienen una distribución normal con desviación típica de 40 horas. ¿Qué tamaño muestral se requiere, si se desea tener una confianza del 960/0 de que la media muestral difiera en menos de 10 horas de la media poblacional? Solución
Aquí, cr =40, L = ]0 Y z(a/2) =z(0,02) = 2,05. Luego, Entonces, hay que tomar una muestra de tanlaño 68.
23
24
Il
Tema 5 . Inferencia EstmJúticu: Estimación
Q
5.4.5.3.4.2 Estimación de una proporción Supongamos que utilizamos una m.a.s. de una población de Bemolllli para construir un intervalo, de nivel (J - a )100%, para la proporción, p. Un intervalo de confianza de nivel aproximadamente (J -a )100% viene dado por:
-1=1
- '"
,Cl .... ~
1=
1=
.:o: '<
-'':1
~
_:>':1
I
I
:>':1
~""'-N
~ -::!v, ""' ....
'-----"
-,
.:~
-;'"
r'
+ ~ ~IQ ~ "",:::1-:",- ""''''''¿
I 1=
'-----"
I
--
I
~
• ,_
::
_>-el J "1
~
I~I :: +I .J-~:>':I ~:>':I- I-,".... ~ :: 1- J-.. + J
N";.I-~ ClCl-
(1,96)2 6 L=OI' n=--=9 04. , , 4(0,1)2 '
L = 0,05; n = (I,96Y, 4(0,05)
Q.
!:;. -l
~
,
_:>':1
,:':1
Solución • (1,96)2
AqU!, z(O,025) = 1,96. Entonces, n =~. Luego, cuando:
ii)
::s '"
,.,
'"
~
;r.
~
:::>
Q.
'"
:::
3
~Ct 11
-";.
Ejemplo 5.12 Calcular el tamaño de muestra que se debe tomar para estimar una proporción. si se desea que el intervalo del 95% sea del tipo p± L. para valores de L = 0,1; 0.05; 0.01.
.
-e
:;l:l
Q
y entonces,
1)
5'"
!:?
o:
:::.
:;
~
e
Q.
01
U.
c~
3" "c'
~
o
!:?
:::>
.....
~
L =z(a/2)~){,
4L
:::
::l
::l
o o
o ::l o n
~
n = -2
:l.
::l
o ::l o n "
:::>
o o n
"noen
Q
"tl
n
Q.
Q
o:
Q
1=
'<
La amplitud de este intervalo es 2z(a/2)jP!. El problema con este fónnula es que no
1=
Q
'"
-,
"n
1=
'"
Q
~~
P±z(a/2)jP!
Q
-1=I
I 1=
~ +
I,..Q>"" í=' - ,::: ..
+
-
I
3 t.:
",,=>
+
I 1=
~o
l}=>
~
~
1
-
~
::
~
_>