Story Transcript
INFERENCIA ESTADÍSTICA Notas de clase
Profesores:
A. Leonardo Bañuelos S. Nayelli Manzanarez Gómez
TEMA III ESTIMACIÓN DE PARÁMETROS POR INTERVALOS DE CONFIANZA
En donde a partir de una condición se ha generado un intervalo aleatorio, en el cual, la constante que ha quedado dentro del intervalo puede ser el valor de un parámetro objetivo .
Definición 3.1 Intervalo de confianza Un intervalo de confianza para el parámetro poblacional al nivel de confianza 100 , siendo un valor en el intervalo , se define como un intervalo de la forma cuyos extremos son estadísticos y tiene la
La estimación puntual es útil pues proporciona el valor más representativo para el parámetro que se desea estimar; sin embargo, la probabilidad de que el estimador tome el valor del parámetro es prácticamente cero, por lo que en algunos problemas es mucho más útil un intervalo para el cual la probabilidad de que el parámetro se encuentre en dicho intervalo sea alta. La estimación por intervalos parte de construir intervalos aleatorios. Un intervalo aleatorio es un intervalo en donde al menos uno de sus límites es una v.a. En general, un intervalo aleatorio se construye a través de los estadísticos y tales que
donde
recibe el nombre de nivel o coeficiente de confianza,
y
se denominan límites de confianza inferior y superior, respectivamente y se llama nivel de significación o nivel de significancia o simplemente significancia.
propiedad de que
Para obtener el intervalo de confianza se utiliza el método del pivote. método del pivote se basa en la determinación de una expresión pivote que función de las mediciones de la muestra y del parámetro desconocido , donde es la única cantidad desconocida y el pivote tiene una distribución probabilidad que no depende del parámetro . Por ejemplo, si el estadístico
tiene una distribución normal, tal que
entonces se puede calcular despejando y
Fig. 3.1 Considérese que se tiene una variable aleatoria contenida en un intervalo dado, por ejemplo: (Intervalo determinístico)
y
, y
se obtiene: son los estadísticos del intervalo de confianza.
INTERVALO DE CONFIANZA PARA LA MEDIA En los capítulos anteriores se estudió el estadístico
como estimador de la media poblacional
, y si se considera una muestra grande
, extraída de una población con
conocida, entonces del teorema del
el cual se podría escribir como: límite central
(Intervalo aleatorio)
El es en de
y en consecuencia
, donde
INFERENCIA ESTADÍSTICA Tema III Pág. 2 S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))) por lo que
El denotar a
como
, es una notación común en estadística, pero no
está completamente generalizada.
se obtiene de
Cuando la muestra es pequeña y la población tiene una distribución normal con variancia conocida, entonces puede emplearse (3.1), como se ilustra en el siguiente ejemplo )))))))))))))))))))))))))))))))))))) Ejemplo 3.1 Construir un intervalo del 95% de confianza para la media de una población normal con variancia , y . Además, utilizando los datos: y obtener una estimación. De donde el intervalo de confianza de dos lados para la media con un nivel de confianza de , cuando la muestra es grande es:
Resolución Puesto que se desea un intervalo para la media, la variancia es conocida y la distribución de la población es normal, de la expresión (3.1) se tiene
. . . (3.1) donde
y los límites son:
el valor
se obtiene de tablas de distribución normal estándar de forma que y de tablas El intervalo aleatorio es
y sustituyendo
Fig. 3.2 ))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
por
se obtiene la estimación
Estimación )))))))))))))))))))))))))))))))))))) El último intervalo no es aleatorio, es decir, la estimación no es un intervalo de probabilidad 0.95, puesto que la probabilidad de que la media poblacional esté contenida en el intervalo es ó , lo que significa que la media está o no contenida en el intervalo.
INFERENCIA ESTADÍSTICA Tema III Pág. 3 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))) La interpretación del intervalo aleatorio es, que en repetidas utilizaciones de la fórmula, el 95% de las veces el intervalo generado (estimación) contendrá a la media. A pesar de que la estimación contiene o no a la media de la población, es común decir que se tiene una confianza del 95% de que sí lo contenga. En muchos casos no se conoce la variancia de la población, la cual se puede aproximar puntualmente mediante el estimador insesgado sustituirlo en lugar de
y
en la expresión (3.1).
)))))))))))))))))))))))))))))))))))) Ejemplo 3.2 En una escuela de ingeniería, se seleccionaron 50 alumnos y se determinó el promedio de horas que estudian a la semana, el cual fue de con una desviación estándar de los datos igual a
Fig. 3.3 y sustituyendo por los valores de la muestra
. Con estos datos, estimar las horas que estudiaron en promedio los alumnos con un coeficiente de confianza igual a 95%. Resolución Se desea un intervalo para la media de las horas de estudio
.
Y sustituyendo en el intervalo se tiene:
Puesto que la muestra es grande entonces: operando como el valor de estimador insesgado
se desconoce se puede aproximar mediante el de donde la expresión (3.1) se reescribe
como:
)))))))))))))))))))))))))))))))))))) Cuando el tamaño de la muestra es pequeño, , la muestra se extrae de una población con distribución normal y la variancia se desconoce, entonces se utiliza el estadístico
. . . (3.2) al considerar un intervalo simétrico y centrado en
y puesto que
entonces, de tablas
el cual tiene una distribución confianza del
con es:
grados de libertad, y el intervalo de
. . . (3.3)
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
INFERENCIA ESTADÍSTICA Tema III Pág. 4 S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))) donde
se obtiene de tablas con distribución
de Student de forma operando
que
)))))))))))))))))))))))))))))))))))) Ejemplo 3.4 Un fabricante produce anillos de pistón para un motor de automóvil, se sabe que el diámetro de los anillos se distribuye aproximadamente en forma normal y con una desviación estándar . Una muestra aleatoria de 15 anillos tiene media de . a) Construir un intervalo de confianza de dos lados del 95% con respecto al diámetro medio de los anillos de pistón. b) Construir un límite de confianza inferior del 95% respecto al diámetro medio de los anillos de pistón. Fig. 3.4 )))))))))))))))))))))))))))))))))))) Ejemplo 3.3 Diez ejes de precisión fabricados en cierto proceso tienen un diámetro promedio de 0.908 cm, con una desviación estándar de 0.004 cm. Considerando que los datos provienen de una muestra aleatoria con distribución normal, construir un intervalo de confianza del 95% para el diámetro promedio real de los ejes fabricados.
Resolución a) Puesto que la población tiene distribución normal, el intervalo de dos lados está dado por:
De tablas se obtiene que
se satisface con
Resolución Puesto que la muestra es pequeña, los datos provienen de una población con distribución normal y la variancia es desconocida, entonces el intervalo de confianza para la media está dado por (3.3), de donde
Sustituyendo
,
,
y sustituyendo los valores obtenidos en la muestra b)
Un límite de confianza inferior es de la forma por lo que
y de tablas ... donde ))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
se obtiene de
(3.2a)
INFERENCIA ESTADÍSTICA Tema III Pág. 5 S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Definición 3.2 Cuando la muestra es grande el estadístico para la diferencia de medias está dado por
Por lo que el intervalo de confianza de dos lados para la diferencia de medias con un nivel de confianza de centrado en es
Fig. 3.5 De tablas sustituyendo
donde
se obtiene de tablas con distribución normal estándar
de forma que
)))))))))))))))))))))))))))))))))))) Como se observó en el ejemplo, es posible obtener intervalos unilaterales, tanto inferiores como superiores, procediendo de una manera muy similar que para los intervalos de dos lados.
Si se desconocen las variancias de las poblaciones
y
y la
muestra es grande, entonces se pueden sustituir por sus estimadores puntuales
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Al igual que el intervalo de confianza para la media, para el intervalo de confianza para la diferencia de medias pueden distinguirse dos casos: muestras grandes (variancia conocida o que se puede aproximar) y muestras pequeñas (distribución normal y variancia desconocida).
y
.
)))))))))))))))))))))))))))))))))))) Ejemplo 3.5 La resistencia del caucho a la abrasión aumenta si se agrega una carga de sílice y un agente de acoplamiento para enlazar químicamente a la carga con las cadenas de polímero del caucho. Cincuenta muestras de caucho con el agente de acoplamiento tipo I dieron una resistencia promedio de 92 y la variancia de las mediciones fue de 20. Cuarenta muestras de caucho con el agente de acoplamiento tipo II dieron un promedio de 98 y una variancia de 30 en sus mediciones. Estimar la diferencia verdadera entre las resistencias promedio a la abrasión en un intervalo de confianza del 95% . Resolución Puesto que las muestras son grandes y aproximando puntualmente las variancias, se tiene:
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
INFERENCIA ESTADÍSTICA Tema III Pág. 6 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
...(3.4) Sustituyendo:
)))))))))))))))))))))))))))))))))))) Ejemplo 3.6 Para dos muestras extraídas de distribuciones normales se obtuvieron los siguientes resultados
operando
)))))))))))))))))))))))))))))))))))) Cuando la variancia de la población es desconocida y la muestra es pequeña, se puede utilizar la distribución para obtener el intervalo de confianza.
Obtener un intervalo de confianza para la diferencia de medias con un coeficiente de confianza igual a , considerando igualdad de variancias poblacionales. Resolución
Definición 3.3 Cuando las muestras son pequeñas y provienen de poblaciones normales con variancias desconocidas pero iguales, entonces el estadístico para la diferencia entre dos medias está dado por
Puesto que la muestra proviene de una distribución normal y las muestras son pequeñas con variancias desconocidas
donde el valor de y
El intervalo es:
Por lo que el intervalo de confianza de dos lados para la diferencia de medias con un nivel de confianza de centrado en es valuando
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
con
grados de libertad para
INFERENCIA ESTADÍSTICA Tema III Pág. 7 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))) )))))))))))))))))))))))))))))))))))) Ejemplo 3.7 Considérense los siguientes datos: 8.2 8.28 8.23 8.21 8.24 8.23 8.25 8.2 8.19 8.23 Obtener:
Finalmente ))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA VARIANCIA
8.24 8.25 8.24 8.26 8.26
a) Un intervalo de confianza de dos lados del 95% para Definición 3.4 Si es una v.a. con distribución normal con media variancia
y
desconocidas, entonces el estadístico empleado es
b) Un intervalo de confianza inferior del 95% para
.
c) Un intervalo de confianza superior de 95% para Resolución De los datos de la tabla se obtiene
.
donde a) Sustituyendo en Utilizando el estadístico
se obtiene el intervalo de
confianza de dos lados con un coeficiente de confianza de , el cual es
para De tablas ...(3.5) Por lo que
b) Para un intervalo inferior
De tablas Fig. 3.6 ))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
entonces
.
INFERENCIA ESTADÍSTICA Tema III Pág. 8 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Utilizando el estadístico
se obtiene el intervalo de confianza de
dos lados con un coeficiente de confianza de
para la relación de
c) Para un intervalo superior las variancias
, el cual es
De tablas ...(3.6) entonces
))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA RAZÓN DE VARIANCIAS Definición 3.5 Si y
son vv.aa. independientes con distribuciones normales
con medias
y
desconocidas y variancias
y
desconocidas, respectivamente, entonces el estadístico empleado es
Fig. 3.7 )))))))))))))))))))))))))))))))))))) Ejemplo 3.8 Se extraen dos muestras independientes de poblaciones normales obteniéndose los siguientes datos
Construir un intervalo de confianza de dos lados del 95 % con respecto donde
a la relación de las variancias Resolución El intervalo está dado por
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
.
INFERENCIA ESTADÍSTICA Tema III Pág. 9 S)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Utilizando el estadístico
y aproximando la cantidad
De tablas e interpolando mediante su estimador puntual confianza de dos lados con un coeficiente es sustituyendo
.....(3.7)
))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN Definición 3.6 Si se toma una muestra de tamaño de una población muy grande ( o infinita), y observaciones pertenecen a la clase de interés, entonces
)))))))))))))))))))))))))))))))))))) Ejemplo 3.9 En una muestra al azar de 60 secciones de tubo en una planta química, 8 de ellos mostraron señales de corrosión seria. Construir un intervalo de confianza del 95 % para la proporción de los tramos de tubo con corrosión seria. Resolución Utilizando la fórmula (3.7), con de tablas, y recordando que
, se tiene:
es un estimador puntual de la
proporción de la población que pertenece a la clase en cuestión, y la distribución de muestreo es
donde y y
se obtiene el intervalo de para la proporción
son los parámetros de la distribución binomial.
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
Finalmente: ))))))))))))))))))))))))))))))))))))
INFERENCIA ESTADÍSTICA Tema III Pág. 10 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES Definición 3.8 Si dos muestras independientes de tamaño
y
Y
de tablas, se tiene
se extraen de
poblaciones infinitas con distribuciones binomiales, representa el número de observaciones de la primera muestra que corresponden a la clase de interés, y representa el número de observaciones de la segunda muestra que corresponden a la clase en cuestión, entonces la distribución de muestreo para la diferencia de proporciones está dada por
operando ))))))))))))))))))))))))))))))))))))
donde De la definición (3.8) se obtiene el intervalo de confianza de dos lados para la diferencia de proporciones, con un nivel de confianza de , el cual es
...(3.8) )))))))))))))))))))))))))))))))))))) Ejemplo 3.10 Dos grupos de 80 pacientes tomaron parte en un experimento en el cual un grupo recibió píldoras que contenían un antialérgico, mientras que al otro grupo se le administró un placebo, es decir, una píldora sin droga alguna. En el grupo que recibió el medicamento 23 exhibieron síntomas alérgicos, mientras que en el otro grupo 41 los exhibieron. Obtener un intervalo de confianza del 99 % para la diferencia entre las proporciones. Resolución Sustituyendo en la fórmula (3.8) con
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
TÓPICOS ESPECIALES: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS, CASOS ESPECIALES Existen algunos casos especiales para los intervalos de confianza de diferencia de medias. El primero de ellos es cuando se tienen datos apareados, o en pares, es decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El segundo de ellos, que queda un poco más allá del objetivo del presente curso, se tiene cuando las muestras son pequeñas, independientes, con distribuciones aproximadamente normales con variancias desconocidas y diferentes. DATOS EN PARES Cuando se observan datos en pares y se espera que exista una fuerte correlación entre cada pareja de datos, se debe generar una nueva variable aleatoria para construir el intervalo de confianza. Sea la variable aleatoria , donde , entonces: , y el intervalo se puede generar mediante:
INFERENCIA ESTADÍSTICA Tema III Pág. 11 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))) utilizando un intervalo de confianza para
con observaciones
apareadas, se tiene :
donde
y
son la media y la desviación estándar muestrales, que se calculan
mediante:
La afirmación es válida. S))))))))))))))))))))))))))))))))))))Q
S))))))))))))))))))))))))))))))))))))Q Ejemplo 3.11 Un gimnasio afirma que un nuevo programa de ejercicios reduce la talla de la cintura de una persona dos centímetros en promedio en un periodo de cinco días. Se indicó la talla de la cintura de seis hombres que participaron en este programa de ejercicios antes y después del periodo de cinco días y las cifras resultantes se registraron en la tabla:
VARIANCIAS DIFERENTES MUESTRAS PEQUEÑAS Cuando el problema consiste en encontrar una estimación por intervalos para la diferencia de medias , las muestras son pequeñas, las poblaciones son aproximadamente normales y las variancias desconocidas no pueden considerarse iguales, entonces no existe un estadístico exacto para el problema; sin embargo, algunos autores han encontrado muy buenas aproximaciones utilizando el estadístico:
H O M B R E S Talla anterior de la cintura Talla posterior de la cintura
1
2
3
4
5
6
90.4
95.5
98.7
115.9
104.0
85.6 el cual tiene una distribución aproximadamente cuales se aproximan mediante:
91.7
93.9
97.4
112.8
101.3
84.0
Determinar si la afirmación de este gimnasio es cierta, calculando un intervalo de confianza del para la reducción promedio de la talla de la cintura. Asumir que la distribución de las diferencias de las tallas antes y después del programa es aproximadamente normal. Resolución Si es la talla anterior y ,
,
la talla posterior, ,
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.
o bien mediante
, con
grados de libertad, los
INFERENCIA ESTADÍSTICA Tema III Pág. 12 S))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
BIBLIOGRAFÍA Hines, William W. y Montgomery, Douglas C., et al .- Probabilidad y Estadística para Ingeniería y Administración, Cuarta Edición..- CECSA.- México, 2004. Wackerly, Dennis D., Mendenhall, William, y Scheaffer, Richard L.- Estadística Matemática con Aplicaciones, Sexta edición.- Editorial Thomson.- México, 2002. Milton, Susan J. y Arnold, Jesse C.- Introduction to probability and statistics, Fourth Edition.- McGraw-Hill, 2003. puesto que
difícilmente es entero se aproxima al entero más cercano.
El intervalo de confianza de dos lados queda entonces:
Walpole, Ronald E., et al..- Probabilidad y Estadística para Ingenieros.- Prentice Hall.Sexta Edición.- México, 1999. Scheaffer, Richard L y McClave, James T.- Probabilidad y Estadística para Ingeniería.Grupo Editorial Iberoamérica.- México 1993. Canavos, George C.- Probabilidad y Estadística Aplicaciones y Métodos.- McGraw-Hill.México, 1988. Devore, Jay L.- Probability and Statistics for Engineering and the Sciences.- Sixth Edition.Canada 2004. Borras García, Hugo E., et al.- Apuntes de Probabilidad y Estadística.-Facultad de Ingeniería, México 1985. Rosenkrantz, Walter A.- Introduction to Probability and Statistics for Scientists and Engineers.- McGraw-Hill.- EE.UU. 1997.
))))))))))))))))))))))))))))))))))))))))))))))))))) A.L.B.S./ N.M .G.