Story Transcript
ESTADISTICA II Guía de Estudio Corte #1 Prof. Mariugenia Rincón
ESTIMACIÓN DE PARÁMETROS Estadística.Una estadística es cualquier función de las variables aleatorias que se observaron en la muestra de manera que esta función no contiene cantidades desconocidas.
Inferencia Estadística.Son aquellos métodos con los cuales se pueden realizar inferencias o generalizaciones acerca de una población. La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis.
Estimaciones.Los datos obtenidos a partir de una muestra, nos permiten inferir unos valores aproximados de una población en estudio, estos valores se llaman estimaciones. Las estimaciones vendrán afectadas de un error, que llamaremos “error debido al muestreo”. La estimación de un parámetro involucra el uso de los datos muestrales en conjunción con alguna estadística. Existen dos formas de llevar acabo la estimación: la puntual y por intervalos.
Estimador.Es un estadístico que se utiliza para obtener una estimación puntual. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la muestra es un estimador de la proporción en la población.
Estimador Puntual.Da origen a una estimación univaluada del valor del parámetro, con base en los datos muestrales. Una estimación puntual de algún parámetro “θ” de la población es un valor numérico ˆ de la estadística Ô.
Página 1 de 13
Notación de algunos Estimadores Puntuales.
Para μ, el estimador es ˆ = x , la media muestral
Para σ2, el estimador es ˆ 2 = s2, la varianza muestral.
Para μ1 – μ2, el estimador es ˆ 1 – ˆ 2 = x 1 – x 2, la diferencia entre las medias muestrales de dos muestras aleatorias independientes.
Estimación por Intervalos.Una estimación por intervalo de un parámetro poblacional “θ” es un intervalo de la forma ˆ L < θ <
ˆ U donde ˆ L y ˆ U dependen del valor del estadístico ˆ para una muestra particular y también de la distribución muestral de ˆ . El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual. El intervalo ˆ L < θ < ˆ U se llama intervalo de confianza del (1-α)100%, la fracción 1-α se llama grado de confianza y los puntos extremos se llaman límites de confianza inferior y superior ( ˆ L y
ˆ U). Entre mayor es el intervalo de confianza, se tiene más seguridad de que el intervalo dado contiene el parámetro desconocido.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadores más probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribución muestral indica la distribución de los valores que tomará el estimador al seleccionar distintas muestras de la población. Las dos medidas fundamentales de esta distribución son la media que indica el valor promedio del estimador y la desviación típica, también denominada error típico de estimación, que indica la desviación promedio que podemos esperar entre el estimador y el valor del parámetro. Más útil es la estimación por intervalos en la que calculamos dos valores entre los que se encontrará el parámetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al parámetro que se está estimando.
Página 2 de 13
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parámetro. Se indica por 1-α y habitualmente se da en porcentaje (1- α)100%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extraída la muestra, el intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que sabemos es que si repitiésemos el proceso con muchas muestras podríamos afirmar que el (1- α)% de los intervalos así construidos contendría al verdadero valor del parámetro. Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida del grado de fiabilidad en el intervalo. Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podría tener un límite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de 95%, es posible tener cualquier valor de μ o cualquier otro parámetro que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo. Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente de probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que si el experimento donde A está definido re realiza una y otra vez, a largo plazo A ocurrirá 95% de las veces. Para este caso del 95% de los intervalos de confianza calculados contendrán a μ. Intervalo de confianza para la media poblacional (μ ) con σ conocida.Conociendo σ, si x es la media de una muestra aleatoria de tamaño “n” de una población con varianza conocida σ2, el intervalo de confianza de (1-α)100% para μ es: < μ <
Donde Zα/2 es el valor de Z a la derecha del cual se tiene un área de α/2. Estimación para la media: Es conocido de nosotros durante este curso, que en base a la distribución muestral de medias que se generó en el tema anterior, la formula para el estadístico es:
Página 3 de 13
El cálculo de probabilidad también puede expresarse de la forma siguiente: Como en este caso se desconoce el parámetro y lo queremos estimar por medio de la media de la muestra, sólo se despejará
de la formula anterior, quedando lo siguiente: →
Son los límites de confianza.
1-α α/2 Zα/2
α/2 0
Z
Zα/2
Para muestras de tamaño n≥30, sin importar la forma de las poblaciones, la teoría muestral garantiza buenos resultados.
Determinación de Tamaños de Muestra para Estimaciones Con frecuencia se desea saber que tan grande debe ser una muestra para asegurar que el error en la estimación de μ será menor que una cantidad específica “e”. Entonces se debe seleccionar una “n” tal que Z / 2
n
e .
Si se usa x como una estimación de μ se puede tener una confianza del (1-α)100% de que el error no excederá una cantidad específica “e” cuando el tamaño de la muestra es:
Z . n /2 e
2
Si “n” resulta fraccional, se debe redondear al número entero superior más cercano.
Ejemplo 1: Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
Página 4 de 13
Caso 1: La estimación puntual de es 1.96, por lo tanto:
es = 2.6. El valor de z para un nivel de confianza del 95%
Caso 2: Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio:
El intervalo puntual. Si parte de las errónea. La
de confianza proporciona una estimación de la presición de nuestra estimación es realmente el valor central de intervalo, entonces estima sin error. La mayor veces, sin embargo, no será exactamente igual a y la estimación puntual es magnitud de este error será el valor absoluto de la diferencia entre y , y
podemos tener el nivel de confianza de que esta diferencia no excederá . Como se puede observar en los resultados del ejercicio se tiene un error de estimación mayor cuando el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de confianza del 95%.
EJERCICIOS PROPUESTOS: 1.- Se calcula que la media de los promedios de los puntos de calidad de una muestra aleatoria de 36 alumnos de último año es de 2,6. Encuentre los intervalos de confianza del 95% y del 99% para la media del total de alumnos. Asuma que la desviación estándar de la población es de 0,3.
2.- Qué tan grande se requiere que sea la muestra del ejemplo anterior si se desea una confianza del 95% de que la estimación de μ difiera de ésta por menos de 0,05.
3.- Para una muestra de 81 habitantes de cierta población se obtuvo una estatura media de 167 cm. Por estudios anteriores se sabe que la desviación típica de la altura de la población es de 8 cm. Construye un intervalo de confianza para la estatura media de la población al 95% Página 5 de 13
4.- En una muestra de 120 estudiantes que hicieron un examen se obtuvo una nota media de 5,6 y una desviación típica de 2,5. Calcula un intervalo de confianza para la nota media del examen al 94%.
5.- Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la población de todos los focos que produce esta empresa.
6.- El artículo "Testing the Bond Between Repair Materials and Concrete Substrate" informa que, en cierta investigación sobre un material de reparación y su sustrato de concreto, se obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48 observaciones de resistencia al corte, y la desviación estándar muestral fue 3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al corte.
Intervalo de confianza para la media poblacional (μ ) con σ desconocida.En ocasiones se desconoce
por lo que en esos casos lo correcto es utilizar otra distribución
llamada "t" de student si la población de donde provienen los datos es normal.
Si x y s son la media y la desviación estándar de una muestra aleatoria de una población normal con varianza desconocida σ2, un intervalo de confianza del (1-α)100% para μ es:
Donde tα/2 es el valor t con v = n-1 grados de libertad, que deja un área de
/2 a la derecha.
Ejercicio 1: El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores si se supone una distribución aproximadamente normal.
Página 6 de 13
Ejercicio 2: Un artículo publicado en el Journal of Testing and Evaluation presenta las siguientes 20 mediciones del tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir para niños: 9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75 9.83 9.92 9.74 9.99 9.88 9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.
Ejercicio 3: Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra. Diseña un experimento un experimento en el que se observan las tensiones de ruptura, en libras, de 16 hilos del proceso seleccionados aleatoriamente. Las tensiones son 20,8 20,6 21,0 20,9 19,9 20,2 19,8 19,6 20,9 21,1 20,4 20,6 19,7 19,6 20,3 20,7. Supóngase que la tensión de ruptura de una fibra se encuentra distribuida normalmente con varianza de 0,2025. Construir un intervalo de confianza del 98% para el valor real de la tensión de ruptura promedio de la fibra.
Ejercicio 4: La Cámara de Comercio de una ciudad se encuentra interesada en estimar la cantidad promedio de dinero que gasta la gente que asiste a convenciones, calculando comidas, alojamiento y entretenimiento por día. De las distintas convenciones que se llevan a cabo en la ciudad, se seleccionaron 60 personas y se les preguntó la cantidad que gastaban por día. Se obtuvo la siguiente información en dólares: 150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146, 155, 163. Si se supone que la cantidad de dinero gastada en un día es la variable aleatoria distribuida normal, obtener los intervalos de confianza estimados del 90%, 95% y 98% para la cantidad promedio real.
Intervalo de confianza para la diferencia de dos medias conociendo σ 12 y σ22 Un intervalo de confianza de (1-α)100% para μ1 – μ2 es:
1 2 ( x1 x 2 ) Z / 2
12 n1
22 n2
Donde Zα/2 es el valor de Z que tiene un área de α/2 a la derecha.
Página 7 de 13
En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual. Ejercicio 1: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el promedio para el motor B es 42 millas por galón. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estándar poblacionales son 6 y 8 para los motores A y B respectivamente.
Ejercicio 2: Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36.300 kilómetros y para la marca B 38.100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviación estándar de 5000 kilómetros para la marca A y 6100 kilómetros para la marca B. Solución:
-2662.68<
B-
A