Story Transcript
Universidad Nacional de Formosa Facultad de Recursos Naturales Ingeniería Zootecnista Cátedra: Estadística y Biometría
TRABAJOS DE APLICACIÓN INFORMÁTICA
ANÁLISIS EXPLORATORIO EJERCICIO N° 1: Realice un análisis exploratorio utilizando el archivo que incluya las siguientes etapas a) Confección de tablas de distribución de frecuencias b) Cálculo de medidas resumen d) Representación gráfica de frecuencias
DISTRIBUCIONES DE PROBABILIDAD EJERCICIO N° 1: Resuelva los ejercicios del práctico n° 5 empleando las funciones para calcular probabilidades y cuantiles de Infostat
ESTIMACIÓN DE PARÁMETROS Y PRUEBA DE HIPÓTESIS EJERCICIO N° 1: (Aplicaciones sobre intervalos de confianza) Se dispone de observaciones de perímetro de cabezas de ajo blanco, para bulbos obtenidos en dos campañas (1998 y 1999). Se desean estimar los parámetros distribucionales del variable diámetro (calibre) ya que dicha variable es utilizada en la clasificación de los ajos. La clasificación tipifica 3 tamaños: Grande, si el calibre es mayor que 7, Mediano si el calibre está entre 5 y 6, y Chico para calibres menores a 4. El perímetro es igual al producto del diámetro por el número = 3.1416. Utilice los datos registrados, disponibles en el archivo Ajoblanc.idb2, y realice las siguientes actividades: a) Realice una estadística descriptiva para el calibre para las campañas 1988 y 1999. b) Compare mediante un diagrama de densidad de puntos la distribución de calibres en ambas campañas. Utilizando el menú Estadísticas> Inferencia basada en una muestra > Intervalos de confianza, obtenga los intervalos de confianza para la media en ambas campañas. Utilizando el menú Estadísticas> Inferencia basada en dos muestras > prueba T, Compare los valores medios poblaciones del calibre entre el año 1988 y1999. De acuerdo a estos resultados ¿hubo un cambio significativo de tamaño de un año a otro? Utilizando el menú Datos> Categorizar genere una variable que indique a que categoría de ajo pertenece cada caso según los criterios de clasificación enunciados en la presentación del problema. Utilizando el menú Estadísticas> Datos categorizados>Tablas de contingencia, Año académico 2014 Titular: Ing. Inés González de Rubiano. JTP: Lic. Gladis Mazza – Prof. Enrique Sandoval
Universidad Nacional de Formosa Facultad de Recursos Naturales Ingeniería Zootecnista Cátedra: Estadística y Biometría
genere una tabla de clasificación cruzada que muestre las frecuencias de las categorías de tamaño en los distintos años. Utilizando las opciones de tablas de contingencias genere porcentajes de cada categoría por año. c) Grafique, mediante un diagrama de tortas los porcentajes en que cada categoría de tamaño está representada en cada año. EJERCICIO N° 2: (Aplicación sobre el cálculo del tamaño de muestra) En un laboratorio un investigador conduce un ensayo para estudiar características del hongo Phytophtora infestans. Los siguientes estadísticos corresponden a una muestra de 20 colonias del hongo, donde se midió la longitud de esporas (en micrones): μ =40 y s=6. Se desea estimar por intervalo de confianza la longitud media de las esporas, de modo que la amplitud del intervalo represente un 10% de la media muestral. ¿Qué número de colonias se deberían tomar al construir el intervalo para μ con una confianza del 90%? Para responder al interés del investigador, utilice el menú Estadísticas > Cálculo del tamaño muestral > Para estimar una media con una precisión deseada. Tenga en cuenta:
En la ventana Tamaño muestral para..., se debe activar la solapa Estimar una media En el panel Criterio para la obtención del tamaño muestral se deberá activar la opción correspondiente al criterio que se desea usar, elegir el nivel de confianza para el intervalo e ingresar el valor de referencia para el criterio indicado. En Cota superior para la varianza, se debe ingresar el valor de varianza para la variable en estudio. Luego de ingresar los valores requeridos, se debe pulsar la tecla . Completada la información en el campo Tamaño muestral requerido aparecerá el cálculo de “n”. EJERCICIO N° 3: (Cálculo de la probabilidad del error de tipo II) Se cree que la ganancia de peso promedio bajo una dieta experimental es de 140 gramos. Si se prueba la siguiente hipótesis: H0: μ=140 y H1: μ≠140, usando una muestra de 36 individuos y sabiendo que la desviación estándar es de 15 gramos a) Obtenga la probabilidad de aceptar la hipótesis nula cuando en realidad el aumento de peso promedio es de 143 gramos. Utilice un =0.05. b) Realice el cálculo de error de tipo II para el siguiente contraste H0: μ=140 y H1: μ>140. Utilice un =0.05. c) Compare los resultados obtenidos anteriormente y escriba una conclusión. A continuación se da un ejemplo para el cálculo de la probabilidad asociada a un error de tipo II, utilizando aplicaciones de Infostat Suponga el contraste de hipótesis H0: = 50 H1: > 50, y que dicha hipótesis fue aceptada cuando en realidad la verdadera media era 52. Este resultado conduce a pensar en la probabilidad de cometer un error de tipo II. Año académico 2014 Titular: Ing. Inés González de Rubiano. JTP: Lic. Gladis Mazza – Prof. Enrique Sandoval
Universidad Nacional de Formosa Facultad de Recursos Naturales Ingeniería Zootecnista Cátedra: Estadística y Biometría
Suponga conocer que la variable aleatoria estudiada, se distribuye como una normal con varianza s2=100 y que se trabajó con una muestra aleatoria de tamaño 25. Para calcular la probabilidad del Error de tipo II, previamente se debe delimitar la región de no rechazo bajo la hipótesis nula (H0: μ=50) y luego calcular el área correspondiente a dicha zona bajo la distribución con μ=52 (que es la distribución correcta). Para ello se pueden utilizar los siguientes procedimientos: 1) Graficación de la distribución de X y delimitación de la región de rechazo. La región de rechazo queda definida por los valores de X ³c, donde c es el punto crítico elegido de manera tal que P( X ³c| μ=50)=a; esto es, la probabilidad de observar valores de medias muestrales mayores o iguales al punto crítico cuando la H0 es verdadera (es decir μ=50), es igual a a. Tomando a=0.05, el punto crítico (c) puede ser obtenido en InfoStat de la siguiente manera: Nota: si X se distribuye normal media = 50 (como se postula en la H0) y varianza = 100, por el Teorema Central del Límite sabemos que el estadístico X se distribuirá normal con media μ=50 y varianza 100/25=4. Para delimitar la región de rechazo en El evento está definido por valores... activar la opción Mayores o iguales que..., aparecerá automáticamente el punto crítico c, ya que InfoStat reporta por defecto el cuantil 0.95 de la distribución al activar dicha opción. Luego, para estos datos, c=53.28 es el punto crítico que delimita las regiones de rechazo y aceptación. Al presionar aceptar se visualizará la distribución y el área sombreada correspondiente a la probabilidad del evento rechazar H0 verdadera. Así, en este ejemplo la región crítica corresponde a los puntos muestrales para los cuales X ³53.28. Nota: si se desean obtener regiones críticas de otro tamaño (un a distinto al 5%) se deberá primero utilizar el menú Probabilidades y cuantiles para obtener los puntos críticos (cuantiles) que necesita ingresar en El evento está definido por valores.... En el menú Aplicaciones ⇒ Didácticas ⇒ Gráficos de funciones de densidad continuas, generar la distribución del estadístico X bajo la hipótesis nula. Esto es, una normal con media = 50 y varianza = 4. 2) Cálculo del Error de tipo II. Considere ahora el problema de calcular b, asumiendo H0: μ=50 y H1: μ>50, n=25, varianza 100 y =0.05 para una prueba unilateral. Recordar que =P( x región de aceptación de H0/H1 verdadera), esto es la probabilidad asociada al evento “el estadístico pertenece a la región de aceptación dado que la hipótesis alternativa es verdadera”. Luego, en este ejemplo, =P( x < 53.28/μ=52). Para obtener el valor de en InfoStat se podrían seguir los siguientes pasos: Sobre la gráfica anterior generar la distribución del estadístico X bajo la hipótesis alternativa. Es decir graficar una densidad normal con parámetros media = 52 y varianza = 4. Para lograr esto se deberá Clonar la serie gráfica existente y cambiar el parámetro media ingresando 52, tarea realizada desde la ventana Herramientas gráficas. En Evento activar la opción