Story Transcript
PRUEBAS DE HIPOTESIS Es posible estimar un parámetro a partir de datos muestrales, bien sea una estimación puntual o un intervalo de confianza. Pero:
¿Si mi objetivo no es estimar un parámetro, sino determinar el cumplimiento de una hipótesis sobre el parámetro?
R=/ Pruebas de Hipótesis
PRUEBAS DE HIPOTESIS Resultados Población (N)
Decisión Parece que
Muestra (n)
µ =l
µ
X l Al parecer
µ >l
µ?
Evidencia
l
µ =l
O
µ >l
Hipótesis
X
PRUEBAS DE HIPOTESIS Definición: Procedimiento estadístico que, a través del estudio de una muestra aleatoria, permite determinar el cumplimiento de una hipótesis planteada sobre alguna característica de la población. Características: • La decisión se toma partiendo de la evidencia que se recaba a través de una muestra aleatoria • Determina mediante calculo de probabilidades si el cumplimiento de la hipótesis es razonable
PRUEBAS DE HIPOTESIS Algunas Definiciones: Hipótesis de investigación: Idea o conjetura que se tiene a priori y que se desea contrastar a través de la realidad. “Es la suposición de una verdad que aún no se ha establecido, es decir, una conjetura que se hace sobre la realidad que aún no se conoce y que se ha formulado precisamente con el objeto de llegar a conocimiento de nuevos hechos” Grasseau. Teoria de la Ciencia. Pag 103.
Ejemplos: H1. La Planta de tratamiento de aguas residuales (PTAR) remueve un 30% de las bacterias que llegan en los vertimientos. H2.El tiempo de vida promedio de determinada bacteria es menor a 10 días.
PRUEBAS DE HIPOTESIS Algunas Definiciones: Hipótesis Estadística: Representación de la hipótesis de investigación en forma de ecuación matemática y en función de parámetros poblacionales. Ejemplo: H1: P = 0.30 La Planta de tratamiento de aguas residuales (PTAR) remueve un 30% de las bacterias que llegan en los vertimientos.
H2:
µ < 10
El tiempo de vida promedio de determinada bacteria es menor a 10 días.
Las hipótesis de investigación pueden desglosarse en dos hipótesis estadísticas que se denominan Hipótesis nula e Hipótesis Alterna:
PRUEBAS DE HIPOTESIS La hipótesis nula siempre debe plantearse en términos de igualdad, mientras que la hipótesis alterna dependerá del conocimiento que tenga el investigar del problema o de la hipotesis de investigación. Ejemplo: Caso 1. La Planta de tratamiento de aguas residuales (PTAR) remueve un 30% de las bacterias que llegan en los vertimientos.
(H0): P = 0.3 vs (H1): P≠0.3 ó P>0.3 ó P µ0
µ < µ0
P ≠ P0
P = P0
P > P0
Estadístico de Prueba Z=
X − µ0 σ n
T=
X − µ0 S n
Varianza desconocida
Z=
P < P0
P − P0 Po (1 − Po ) n
Distribución
Z
t( n −1) Z
σ ≠ σ0
σ =σ0
σ >σ0 σ d µ1 − µ 2 < d
Varianzas desconocidas e iguales
T=
Varianzas desconocidas y diferentes
σ
2 1
P1 − P2 = d
P1 − P2 ≠ d
P1 − P2 > d P1 − P2 < d
σ 12 =1 σ 22
σ 12 ≠1 σ 22
Tamaño de muestra grande
Normalidad
Z=
+
σ
2 2
n2
( x1 − x2 ) − ( µ1 − µ 2 ) 1 1 Sp + n1 n2
Sp =
Z
( x1 − x 2 ) − ( µ 1 − µ 2 ) n1
µ 1− µ 2 = d
Distribución
(n1 − 1) * S12 + (n2 − 1) * S 22 n1 + n2 − 2
( pˆ1 − pˆ 2 ) − (P1 − P2 ) pˆ 1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) + n1 n2
S12 F= 2 S2
t ( n1 + n 2 − 2 )
t(v )
S12 S 22 n + n 2 1 V = ( S 12 n1 ) 2 ( S 22 n 2 ) 2 + n1 − 1 n2 − 1
Z F( n1 −1,n2 −1)
Forma de la Región de Rechazo La forma región de rechazo depende de cómo se plantee la hipótesis alterna: 1. Hipótesis alterna unilateral (Una sola cola)
2. Hipótesis Alterna Bilaterales (dos colas)
Ejemplo ASOFONDOS es la asociación que regula los fondos de pensiones. Esta entidad sugiere que la edad de jubilación debe incrementarse, debido a que las condiciones de riesgo de los individuos en la actualidad ha disminuido, logrando incrementar su esperanza de vida, que hasta hace algunos años se había calculado en 70 años, con una desviación estándar de 8.9 años. Su afirmación la plantea fundamentándose en una muestra de 100 registros de muertes que dio como resultado una edad promedio de muerte de 71,8 años Que opina usted sobre la afirmación. Determine el valor P.
Valor P como Criterio de Decisión Definición: Probabilidad de que el estadístico de prueba arroje un resultado tan extremo o más extremo que el observado cuando la Hipótesis nula es verdadera Criterio de Decisión
Si el valor P es relativamente grande (valor p > significancía) Es razonable pensar que la Hipótesis nula puede ser cierta (se acepta Ho)
Si el valor P es muy pequeño (valor p < significancía) se rechaza la Hipótesis nula
“De forma ligera puede verse como la probabilidad de que la Hipótesis Nula sea Verdadera”
SOLUCIÓN Paso 1. Planteamiento de Hipótesis de Investigación La edad promedio de muerte es superior a 70 años
µ > 70
Paso 2. Planteamiento de Hipótesis Estadísticas H 0 : µ = 70
VS
H1 : µ > 70
Paso 3. Selección nivel de significancia
α = 0.05 Paso 4. Selección y calculo del estadístico de prueba
zc =
x − µ 0 71.8 − 70 = = 2.02 σ n 8.9 100
SOLUCIÓN Paso 5. Determinación Región de Aceptación, Rechazo
z0.05 = 1.64 Región de rechazo
Paso 6. Contraste del estadístico de Prueba
zc = 2.02 Paso 7. Decisión Rechazo Ho
Parece lógico pensar que la esperanza de vida ha aumentado
Paso 8. Calculo del Valor P
p( z > 2.02) = 0.0217
Ejemplos Ejemplo 1: (una media con varianza conocida) Un fabricante de sistemas de aspersión utilizados para protección de incendios en edificios de oficina, afirma que el verdadero valor promedio de activación del sistema es de 130°F. Una muestra de 9 sistemas, produce un promedio muestral de temperatura de activación de 131.08°F. Si la distribución de los tiempos de activación es normal con desviación de 1.5°F, ¿Los datos contradicen la afirmación del fabricante al nivel de significancia del 0.01?
Estadístico de prueba
X − µ0 Z= σ n
Distribución Referencia
Z
Ejemplos Ejemplo 2: (Una media con varianza desconocida) Históricamente se ha observado que la cantidad promedio de oxigeno disuelto en cierto rió es de 4,7 mg/lt. En los últimos días se ha instalado una nueva fabrica que arroja sus vertimientos sobre este rió y se tiene la idea de que estos vertimientos están contaminándolo. Para probar lo anterior se han tomado muestras de agua durante 15 días, y se les mide la cantidad de oxigeno disuelto, observando un valor promedio de 3.8 con una desviación estándar de 0.9 mg/l. Será necesario tomar correctivos frente a esta fabrica?. Asuma que lo datos proviene de una distribución normal.
Estadístico de prueba
X − µ0 T= s n
Distribución Referencia
t( n −1)
Ejemplos Ejemplo 3: (Comparación de medias de 2 poblaciones independientes, Varianzas conocidas) Se investiga la resistencia a la tensión de ruptura del hilo proporcionado por dos fabricantes. De la experiencia con los procesos de los fabricantes, se sabe que psi yσ 1 = 5 psi.σUna muestra aleatoria de 30 especímenes de prueba proveniente 2 =4 de cada fabricante arroja como resultados x1 = 88 psi, S=5 y x2 = 91 psi, S = 4, respectivamente. ¿Existe alguna evidencia que apoye la fdfdfdfdd afirmación de que el hilo del fabricante 2 tiene mayor resistencia media?
Estadístico de prueba ( x − x ) − ( µ1 − µ 2 ) T= 1 2 1 1 Sp + n1 n2
Sp =
(n1 − 1) * S12 + (n2 − 1) * S 22 n1 + n2 − 2
Distribución Referencia
t(n1+n2 −2)
Ejemplos Ejemplo 4: (Comparación de medias de 2 poblaciones relacionadas (apareadas)) En un programa de control de enfermedades crónicas, la hipertensión está incluida como la primera patología a controlar. 15 pacientes hipertensos son sometidos al programa y controlados en su presión antes y después de 6 meses de tratamiento. Los datos son los siguientes: Inic.
180
200
160
170
180
190
190
180
190
160
170
190
200
210
220
Fin.
140
170
160
140
130
150
140
150
190
170
120
160
170
160
150
¿Se puede decir a un nivel de significación del 5% que el tratamiento es efectivo y logra disminuir en un promedio superior a 15 mmHg ?
Estadístico de prueba d − µd T= Sd n
Distribución Referencia
t ( n1 −1)
Ejemplos Ejemplo 5: (Comparación de medias de k poblaciones independientes) Un ingeniero de desarrollo tiene interés en investigar la resistencia a la tensión de una fibra sintética nueva que se usará para hacer telas de camisa para caballero. Por experiencia se sabe que la calidad de la tela se ve afectada por la composición de algodón, el cual debe variar entre el 10% y 40% de la mezcla. Por tanto decide probar cinco niveles de algodón (15,20,25,30 y 35%) y como necesita valoración de la variabilidad decide hacer 5 replicaciones por cada nivel.
Identifique: a) Factor (es) de diseño b) Niveles del factor de diseño c) Posibles Factores Perturbadores d) Unidades Experimentales e) Cual seria su estrategia para eliminar un posible efecto de factores perturbadores