Story Transcript
1. Análisis de la Varianza Curso 2011-2012 Estadística
1.1 Dos tratamientos
Comparación de dos tratamientos A 51,3 39,4 26,3 39,0 48,1 34,2 69,8 31,3 45,2 46,4
B 29,6 47,0 25,9 13,0 33,1 22,1 34,1 19,5 43,8 24,9
Sea desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas A y B. La tabla muestra la reducción conseguida después de dos meses.
Análisis de la Varianza
3
Método: 4 pasos Definición del modelo de distribución de probabilidad: Hipótesis Parámetros
Estimación de los parámetros Diagnosis de las hipótesis Aplicación
Análisis de la Varianza
4
Modelo
1
2
y11
y 21
y12
y 22
y1n1
y 2 n2
M O D E L O D A T O S 5
Análisis de la Varianza
Modelo: Hipótesis y Parámetros Hipótesis básicas: Parámetros
Normalidad yij
N( i, 2)
Homocedasticidad Var [yij] =
2
1 2 2
Independencia Cov [yij, ykl] = 0 Análisis de la Varianza
6
Modelo yij
i
uij ,
uij
N (0,
2
)
Las observaciones se descomponen en: Parte predecible
i
uij
Parte aleatoria
0 7
Análisis de la Varianza
Estimación medias: n1
y1 j 1:
y1
j 1
n1 n2
y2 j 2:
Análisis de la Varianza
y2
j 1
n2
A 51,3 39,4 26,3 39,0 48,1 34,2 69,8 31,3 45,2 46,4 43,1
B 29,6 47,0 25,9 13,0 33,1 22,1 34,1 19,5 43,8 24,9 29,3
8
Estimación varianza (residuos) yij
uij , uij
i
uij
yij
eij
yij
N (0,
2
Residuos
)
A 8,2 -3,7 -16,8 -4,1 5,0 -8,9 26,7 -11,8 2,1 3,3 0,0
i
yi
eij : RES IDUO 2 ni 2
:
eij2
i 1 j 1
s R2
n
n 2
i
j 1
B 0,3 17,7 -3,4 -16,3 3,8 -7,2 4,8 -9,8 14,5 -4,4 0,0
2 0;s R
eij
130.95 9
Análisis de la Varianza
2 s Varianza residual: R
1
2
y21
y11 y12
( y1 j
s12
y1 ) 2
y22
n1 1
s22
( y2 j n2
y2 ) 2 1
y2 n2
y1n1 2 ni
sR2 Análisis de la Varianza
eij2
i 1j 1
n 2
n1 1 2 s1 n 1
n2 1 2 s2 n 1 10
Diferencia de medias: y1
1
2
y21 y22
y11 2
y12
N(
y1
1,
)
n1
y2
( y1
2
y2
N(
2,
n2
)
y2 n2
y1n1 y1
y2
N(
2,
1
y2 ) ( 1 1 1 n1 n2
2
2
n1
n2
2)
) ( y1
N (0,1)
y2 ) ( 1 1 1 sR n1 n2
2)
tn
2
11
Análisis de la Varianza
Contraste de igualdad de medias
t0
H0 :
1
2
H1 :
1
2
y1 sR
y2 1 n1
tn-2
1tn
1 n2
R.R
R.R.
/2
R. Acept.
2
-t
/2
t0
t
/2
No se rechaza H 0
t0
t
/2
Se rechaza H 0
Análisis de la Varianza
/2
t
/2
12
Ejemplo:
t0
H0 :
1
2
H1 :
1
2
= 0.05 R.R.
R.R
t18
0.025
0.025
43.1 29.3 1 1 11.44 10 10
2.69 2.10
-2.10
2.69 2.10
Se rechaza H 0 13
Análisis de la Varianza
Ejemplo:
t0
= 0.01
H0 :
1
2
H1 :
1
2
43.1 29.3 1 1 11.44 10 10
t18
0.99 0.005
0.005
2.69
2.69 2.88 Análisis de la Varianza
R.R
R.R.
/2
-2.88
2.88
No se rechaza H 0 14
Nivel crítico (bilateral)
t0
H0 :
1
2
H1 :
1
2
43.1 29.3 1 1 11.44 10 10
p valor
t18 0.074
0.074
2.69
-2.69
Pr( t18
= 0.05 > p-valor = 0.01 < p-valor
2.69)
2.69
0.0147
Se rechaza H0 No se rechaza H0 15
Análisis de la Varianza
Conclusiones (fijado ) Si |to| > t /2 se dice que la diferencia de medias es significativa. O simplemente que los tratamientos son distintos (tienen medias distintas)
Análisis de la Varianza
Si |to| t /2 se dice que la diferencia de medias no es significativa. No hay evidencia suficiente para afirmar que las medias de los tratamientos sean diferentes. 16
No rechazar Ho, no implica que Ho sea cierta El resultado |to| t /2, (no se rechaza Ho) no debe interpretarse como se ha demostrado que las dos medias son iguales No-rechazar la hipótesis nula implica que la diferencia entre las medias 1 - 2 no es lo suficientemente grande como para ser detectada con el tamaño muestral dado. 17
Análisis de la Varianza
Intervalo de confianza para la diferencia de medias: 1 ( y1
y2 ) ( 1 1 1 sR n1 n2
2)
tn
tn-2
2
/2
1
Análisis de la Varianza
( y1
/2
2
( y1
y2 ) ( 1 1 1 sR n1 n2 y2 )
/2
1-t
Pr { t
2
t
t
/2
2)
/ 2 sR
t
/2}
1 n1
1 n2
/2
1
18
Ejemplo: intervalo de confianza
1
2
t18 0.025
0.025
-2.10
2.10 t / 2 sR
1 n2
2
1
2
(43.1 29.3) 2.10 11.44
1
2
13.8
1
y2 )
1 n1
( y1
1 1 10 10
10.74 19
Análisis de la Varianza
Hipótesis de homocedasticidad 1
2
1
2
y21 y22
y11 y12
s12
( y1 j
y1 ) 2
n1 1
( y2 j n2
y2 ) 2 1
y2 n2
y1n1
H0 : H1 : Análisis de la Varianza
s22
2 1 2 1
2 2 2 2 20
Distribución F y21
y11 y12
( y1 j
s12
y1 ) 2
y22
n1 1
( y2 j
s22
y2 ) 2
n2 1
y2 n2
y1n1 (n1 1) s12 2 1
2 n1 1
F
(n2 1) s22
2 n1 1
2 n2 1
2 2
2 n2 1
s12 (n1 1) (n2 1)
2 1 s22 2 2
Fn1
1,n2 1
21
Análisis de la varianza
Distribución F
F40,40 F20,40 F10,40
F5,40
Análisis de la varianza
22
Algunas distribuciones F F10,80 F10,40 F10,20 F10,10
23
Análisis de la varianza
Contraste de igualdad de varianzas H0 : H1 :
2 1 2 1
2 2 2 2 2 1
Si H 0 es cierto F0
s12 s12
Fn1
2 2,
1,n2 1
RR
RR /2
/2
1R.A. Ho
F1-
/2
F
/2
Si F0
F1
/ 2, F / 2
No se rechaza H 0
Si F0
F1
/ 2, F / 2
Se rechaza H 0
Análisis de la varianza
24
Ejemplo: Contraste de igualdad de varianzas H0 : H1 :
2 1 2 1
2 2 2 2
s12 154.02 s22 111.7
0.248 1.37
154.02 1.37 111.7
F0
1.37
RR 0.025
RR 0.025
0.248,4.03
4.03
No se rechaza H 0 25
Análisis de la varianza
F 1,
Tabla F
2
P( F 1 ,
,
2
F 1,
2
,
)
Grados de libertad del denominador:
2
=0.05 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
1 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4,03 4,00 3,98 3,96 3,95 3,94 3,92 3,84 1
2 199,5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,18 3,15 3,13 3,11 3,10 3,09 3,07 3,00 2
3 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,79 2,76 2,74 2,72 2,71 2,70 2,68 2,60 3
Ejemplo : P( F7,8
4 224,6 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,61 2,56 2,53 2,50 2,49 2,47 2,46 2,45 2,37 4
5 230,2 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,40 2,37 2,35 2,33 2,32 2,31 2,29 2,21 5
6 234,0 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,29 2,25 2,23 2,21 2,20 2,19 2,18 2,10 6
3.50) 0.05
7 236,8 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,25 2,20 2,17 2,14 2,13 2,11 2,10 2,09 2,01 7
8 238,9 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,32 2,31 2,29 2,28 2,27 2,18 2,13 2,10 2,07 2,06 2,04 2,03 2,02 1,94 8
9 240,5 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,12 2,07 2,04 2,02 2,00 1,99 1,97 1,96 1,88 9
10 241,9 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 2,03 1,99 1,97 1,95 1,94 1,93 1,91 1,83 10
12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,95 1,92 1,89 1,88 1,86 1,85 1,83 1,75 12
15 245,9 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,87 1,84 1,81 1,79 1,78 1,77 1,75 1,67 15
20 248,0 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,84 1,78 1,75 1,72 1,70 1,69 1,68 1,66 1,57 20
24 249,1 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2,05 2,03 2,01 1,98 1,96 1,95 1,93 1,91 1,90 1,89 1,79 1,74 1,70 1,67 1,65 1,64 1,63 1,61 1,52 24
30 250,1 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,69 1,65 1,62 1,60 1,59 1,57 1,55 1,46 30
40 251,1 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,81 1,79 1,69 1,63 1,59 1,57 1,54 1,53 1,52 1,50 1,39 40
60 252,2 19,48 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,79 1,77 1,75 1,74 1,64 1,58 1,53 1,50 1,48 1,46 1,45 1,43 1,32 60
100 253,0 19,49 8,55 5,66 4,41 3,71 3,27 2,97 2,76 2,59 2,46 2,35 2,26 2,19 2,12 2,07 2,02 1,98 1,94 1,91 1,88 1,85 1,82 1,80 1,78 1,76 1,74 1,73 1,71 1,70 1,59 1,52 1,48 1,45 1,43 1,41 1,39 1,37 1,24 100
120 253,3 19,49 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,58 1,51 1,47 1,44 1,41 1,39 1,38 1,35 1,22 120
Inf. 254,3 19,50 8,53 5,63 4,37 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,44 1,39 1,35 1,32 1,30 1,28 1,25 1,00 Inf.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
F 1,
Tabla F
2
P( F 1 ,
,
F 1,
2
2
,
)
=0.025
Grados de libertad del denominador:
2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
1 647,8 38,51 17,44 12,22 10,01 8,81 8,07 7,57 7,21 6,94 6,72 6,55 6,41 6,30 6,20 6,12 6,04 5,98 5,92 5,87 5,83 5,79 5,75 5,72 5,69 5,66 5,63 5,61 5,59 5,57 5,42 5,34 5,29 5,25 5,22 5,20 5,18 5,15 5,02 1
2 799,5 39,00 16,04 10,65 8,43 7,26 6,54 6,06 5,71 5,46 5,26 5,10 4,97 4,86 4,77 4,69 4,62 4,56 4,51 4,46 4,42 4,38 4,35 4,32 4,29 4,27 4,24 4,22 4,20 4,18 4,05 3,97 3,93 3,89 3,86 3,84 3,83 3,80 3,69 2
3 864,2 39,17 15,44 9,98 7,76 6,60 5,89 5,42 5,08 4,83 4,63 4,47 4,35 4,24 4,15 4,08 4,01 3,95 3,90 3,86 3,82 3,78 3,75 3,72 3,69 3,67 3,65 3,63 3,61 3,59 3,46 3,39 3,34 3,31 3,28 3,26 3,25 3,23 3,12 3
4 899,6 39,25 15,10 9,60 7,39 6,23 5,52 5,05 4,72 4,47 4,28 4,12 4,00 3,89 3,80 3,73 3,66 3,61 3,56 3,51 3,48 3,44 3,41 3,38 3,35 3,33 3,31 3,29 3,27 3,25 3,13 3,05 3,01 2,97 2,95 2,93 2,92 2,89 2,79 4
Ejemplo : P( F7,8
5 921,8 39,30 14,88 9,36 7,15 5,99 5,29 4,82 4,48 4,24 4,04 3,89 3,77 3,66 3,58 3,50 3,44 3,38 3,33 3,29 3,25 3,22 3,18 3,15 3,13 3,10 3,08 3,06 3,04 3,03 2,90 2,83 2,79 2,75 2,73 2,71 2,70 2,67 2,57 5
6 937,1 39,33 14,73 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,88 3,73 3,60 3,50 3,41 3,34 3,28 3,22 3,17 3,13 3,09 3,05 3,02 2,99 2,97 2,94 2,92 2,90 2,88 2,87 2,74 2,67 2,63 2,59 2,57 2,55 2,54 2,52 2,41 6
7 948,2 39,36 14,62 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,76 3,61 3,48 3,38 3,29 3,22 3,16 3,10 3,05 3,01 2,97 2,93 2,90 2,87 2,85 2,82 2,80 2,78 2,76 2,75 2,62 2,55 2,51 2,47 2,45 2,43 2,42 2,39 2,29 7
8 956,6 39,37 14,54 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,66 3,51 3,39 3,29 3,20 3,12 3,06 3,01 2,96 2,91 2,87 2,84 2,81 2,78 2,75 2,73 2,71 2,69 2,67 2,65 2,53 2,46 2,41 2,38 2,35 2,34 2,32 2,30 2,19 8
9 963,3 39,39 14,47 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,59 3,44 3,31 3,21 3,12 3,05 2,98 2,93 2,88 2,84 2,80 2,76 2,73 2,70 2,68 2,65 2,63 2,61 2,59 2,57 2,45 2,38 2,33 2,30 2,28 2,26 2,24 2,22 2,11 9
10 968,6 39,40 14,42 8,84 6,62 5,46 4,76 4,30 3,96 3,72 3,53 3,37 3,25 3,15 3,06 2,99 2,92 2,87 2,82 2,77 2,73 2,70 2,67 2,64 2,61 2,59 2,57 2,55 2,53 2,51 2,39 2,32 2,27 2,24 2,21 2,19 2,18 2,16 2,05 10
12 976,7 39,41 14,34 8,75 6,52 5,37 4,67 4,20 3,87 3,62 3,43 3,28 3,15 3,05 2,96 2,89 2,82 2,77 2,72 2,68 2,64 2,60 2,57 2,54 2,51 2,49 2,47 2,45 2,43 2,41 2,29 2,22 2,17 2,14 2,11 2,09 2,08 2,05 1,94 12
15 984,9 39,43 14,25 8,66 6,43 5,27 4,57 4,10 3,77 3,52 3,33 3,18 3,05 2,95 2,86 2,79 2,72 2,67 2,62 2,57 2,53 2,50 2,47 2,44 2,41 2,39 2,36 2,34 2,32 2,31 2,18 2,11 2,06 2,03 2,00 1,98 1,97 1,94 1,83 15
20 993,1 39,45 14,17 8,56 6,33 5,17 4,47 4,00 3,67 3,42 3,23 3,07 2,95 2,84 2,76 2,68 2,62 2,56 2,51 2,46 2,42 2,39 2,36 2,33 2,30 2,28 2,25 2,23 2,21 2,20 2,07 1,99 1,94 1,91 1,88 1,86 1,85 1,82 1,71 20
24 30 40 60 100 120 Inf. 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 39,46 39,46 39,47 39,48 39,49 39,49 39,50 14,12 14,08 14,04 13,99 13,96 13,95 13,90 8,51 8,46 8,41 8,36 8,32 8,31 8,26 6,28 6,23 6,18 6,12 6,08 6,07 6,02 5,12 5,07 5,01 4,96 4,92 4,90 4,85 4,41 4,36 4,31 4,25 4,21 4,20 4,14 3,95 3,89 3,84 3,78 3,74 3,73 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 3,37 3,31 3,26 3,20 3,15 3,14 3,08 3,17 3,12 3,06 3,00 2,96 2,94 2,88 3,02 2,96 2,91 2,85 2,80 2,79 2,72 2,89 2,84 2,78 2,72 2,67 2,66 2,60 2,79 2,73 2,67 2,61 2,56 2,55 2,49 2,70 2,64 2,59 2,52 2,47 2,46 2,40 2,63 2,57 2,51 2,45 2,40 2,38 2,32 2,56 2,50 2,44 2,38 2,33 2,32 2,25 2,50 2,44 2,38 2,32 2,27 2,26 2,19 2,45 2,39 2,33 2,27 2,22 2,20 2,13 2,41 2,35 2,29 2,22 2,17 2,16 2,09 2,37 2,31 2,25 2,18 2,13 2,11 2,04 2,33 2,27 2,21 2,14 2,09 2,08 2,00 2,30 2,24 2,18 2,11 2,06 2,04 1,97 2,27 2,21 2,15 2,08 2,02 2,01 1,94 2,24 2,18 2,12 2,05 2,00 1,98 1,91 2,22 2,16 2,09 2,03 1,97 1,95 1,88 2,19 2,13 2,07 2,00 1,94 1,93 1,85 2,17 2,11 2,05 1,98 1,92 1,91 1,83 2,15 2,09 2,03 1,96 1,90 1,89 1,81 2,14 2,07 2,01 1,94 1,88 1,87 1,79 2,01 1,94 1,88 1,80 1,74 1,72 1,64 1,93 1,87 1,80 1,72 1,66 1,64 1,55 1,88 1,82 1,74 1,67 1,60 1,58 1,48 1,85 1,78 1,71 1,63 1,56 1,54 1,44 1,82 1,75 1,68 1,60 1,53 1,51 1,40 1,80 1,73 1,66 1,58 1,50 1,48 1,37 1,78 1,71 1,64 1,56 1,48 1,46 1,35 1,76 1,69 1,61 1,53 1,45 1,43 1,31 1,64 1,57 1,48 1,39 1,30 1,27 1,00 24 30 40 60 100 120 Inf.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
4.53) 0.025
F 1,
Tabla F
2
P( F 1 ,
,
2
F 1,
2
,
)
Grados de libertad del denominador:
2
=0.01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
1 4052,2 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,18 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,17 7,08 7,01 6,96 6,93 6,90 6,85 6,63 1
2 4999,3 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 5,06 4,98 4,92 4,88 4,85 4,82 4,79 4,61 2
3 5403,5 99,16 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,19 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,51 4,31 4,20 4,13 4,07 4,04 4,01 3,98 3,95 3,78 3
4 5624,3 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,72 3,65 3,60 3,56 3,53 3,51 3,48 3,32 4
Ejemplo : P( F7,8
5 5764,0 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,51 3,41 3,34 3,29 3,26 3,23 3,21 3,17 3,02 5
6 5859,0 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3,53 3,50 3,47 3,29 3,19 3,12 3,07 3,04 3,01 2,99 2,96 2,80 6
7 5928,3 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,42 3,39 3,36 3,33 3,30 3,12 3,02 2,95 2,91 2,87 2,84 2,82 2,79 2,64 7
6.18) 0.01
8 5981,0 99,38 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,89 2,82 2,78 2,74 2,72 2,69 2,66 2,51 8
9 6022,4 99,39 27,34 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,18 3,15 3,12 3,09 3,07 2,89 2,78 2,72 2,67 2,64 2,61 2,59 2,56 2,41 9
10 6055,9 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 3,09 3,06 3,03 3,00 2,98 2,80 2,70 2,63 2,59 2,55 2,52 2,50 2,47 2,32 10
12 6106,7 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,96 2,93 2,90 2,87 2,84 2,66 2,56 2,50 2,45 2,42 2,39 2,37 2,34 2,18 12
15 6157,0 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,81 2,78 2,75 2,73 2,70 2,52 2,42 2,35 2,31 2,27 2,24 2,22 2,19 2,04 15
20 6208,7 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2,78 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,37 2,27 2,20 2,15 2,12 2,09 2,07 2,03 1,88 20
24 6234,3 99,46 26,60 13,93 9,47 7,31 6,07 5,28 4,73 4,33 4,02 3,78 3,59 3,43 3,29 3,18 3,08 3,00 2,92 2,86 2,80 2,75 2,70 2,66 2,62 2,58 2,55 2,52 2,49 2,47 2,29 2,18 2,12 2,07 2,03 2,00 1,98 1,95 1,79 24
30 6260,4 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,54 2,50 2,47 2,44 2,41 2,39 2,20 2,10 2,03 1,98 1,94 1,92 1,89 1,86 1,70 30
40 6286,4 99,48 26,41 13,75 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,42 2,38 2,35 2,33 2,30 2,11 2,01 1,94 1,89 1,85 1,82 1,80 1,76 1,59 40
60 6313,0 99,48 26,32 13,65 9,20 7,06 5,82 5,03 4,48 4,08 3,78 3,54 3,34 3,18 3,05 2,93 2,83 2,75 2,67 2,61 2,55 2,50 2,45 2,40 2,36 2,33 2,29 2,26 2,23 2,21 2,02 1,91 1,84 1,78 1,75 1,72 1,69 1,66 1,47 60
100 6333,9 99,49 26,24 13,58 9,13 6,99 5,75 4,96 4,41 4,01 3,71 3,47 3,27 3,11 2,98 2,86 2,76 2,68 2,60 2,54 2,48 2,42 2,37 2,33 2,29 2,25 2,22 2,19 2,16 2,13 1,94 1,82 1,75 1,70 1,65 1,62 1,60 1,56 1,36 100
120 6339,5 99,49 26,22 13,56 9,11 6,97 5,74 4,95 4,40 4,00 3,69 3,45 3,25 3,09 2,96 2,84 2,75 2,66 2,58 2,52 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,17 2,14 2,11 1,92 1,80 1,73 1,67 1,63 1,60 1,57 1,53 1,32 120
Inf. 6365,6 99,50 26,13 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,17 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,68 1,60 1,54 1,49 1,46 1,43 1,38 1,00 Inf.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf
1.2
K tratamientos
29
Análisis de la varianza
¿Existen diferencias entre las cuatro semillas? Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas. A 229.1 253.7 241.3 254.7 237.2 241.3 242.9 Análisis de la varianza
B 233.4 233.0 219.2 200.0 224.3 202.0 218.7
C 211.1 223.1 217.5 211.8 207.6 213.7 214.1
D 270.4 248.6 230.0 250.7 230.0 245.8 245.9 30
Método: 4 pasos Definición del modelo de distribución de probabilidad: Hipótesis Parámetros
Estimación de los parámetros Diagnosis de las hipótesis Aplicación
31
Análisis de la varianza
Modelo
... 1
2
K
y21
y11 y12
y22
y1n
y2 n
1
Análisis de la varianza
2
...
yK1 yK 2 y Kn
K 32
Hipótesis del modelo Normalidad yij
N( i, 2)
Homocedasticidad Var [yij] =
2
Independencia Cov [yij, ykl] = 0
33
Análisis de la varianza
Modelo: Hipótesis y Parámetros Hipótesis básicas:
Parámetros
Normalidad
1
yij
N( i, 2)
2
Homocedasticidad Var [yij] =
2
Independencia Cov [yij, ykl] = 0 Análisis de la varianza
K 2 34
Modelo: Forma alternativa yij
uij ,
i
uij
N (0,
2
)
Las observaciones se descomponen en: Parte predecible
i
uij
Parte aleatoria
0 35
Análisis de la varianza
Estimación medias:Max. Verosímil n1
y1 j 1:
y1
j 1
n1 n2
y2 j 2
:
y2
j 1
n2 nK
y Kj K
:
yK
Análisis de la varianza
A 229.1 253.7 241.3 254.7 237.2 241.3 242.9
B 233.4 233.0 219.2 200.0 224.3 202.0 218.7
C 211.1 223.1 217.5 211.8 207.6 213.7 214.1
D 270.4 248.6 230.0 250.7 230.0 245.8 245.9
j 1
nK
36
Estimación varianza (residuos) yij
uij , uij
i
uij
yij
eij
yij
N (0,
A -13.8 10.8 -1.6 11.8 -5.7 -1.6 0.0
yi
eij : RESIDUO
2
:
s R2
) Residuos
i
K ni
2
eij2
i 1j 1
B 14.8 14.4 0.6 -18.7 5.7 -16.7 0.0
sR2
n K
C -3.0 9.0 3.4 -2.3 -6.5 -0.4 0.0
D 24.5 2.7 -15.9 4.8 -15.9 -0.1 0.0
142.4 37
Análisis de la varianza
Comparación de medias La comparación de tratamientos con este modelo se reduce a comparar las medias 1, 2, ..., K , en primer lugar con el contraste:
H0 :
1
2
K
H1 : Al menos una es diferente
Análisis de la varianza
38
Descomposición de la variabilidad yij yij
uij
i
y
yij
( yi
yi
( yij
y ) ( yij
y i ) : restando y
yij n
,
yi )
elevando al cuadrado y sumando para todo i,j K ni
(donde
( yi
y )( yij
y i ) 0)
i 1j 1 K ni
( yij
y )
K ni
2
( yi
i 1j 1
y )
2
i 1j 1
K ni
( yij
y )
ni ( y i
i 1j 1
( yij i 1j 1
K
2
K ni
y )
2
i 1
K ni
( yij i 1j 1
y i )2 yi )2
39
Análisis de la varianza
Variabilidades Variabilid ades K ni
VT
( yij i 1j 1 K
VE i 1
ni ( y i
K ni
VNE
( yij i 1j 1
VT
yi )
Grados de libertad
y )2
n-1
y )2
K-1
2
VE
K ni
eij 2
n-K
i 1j 1
VNE
n 1 ( K 1) (n K ) Análisis de la varianza
40
Descomposición: ejemplo y
230.4
Datos
Medias
229.1 253.7 241.3 254.7 237.2 241.3
233.4 233.0 219.2 200.0 224.3 202.0
211.1 223.1 217.5 211.8 207.6 213.7
270.4 248.6 230.0 250.7 230.0 245.8
-1.3 23.3 10.9 24.3 6.8 10.9
3.0 2.6 -11.2 -30.4 -6.1 -28.4
-19.3 -7.3 -12.9 -18.6 -22.8 -16.7
40.0 18.2 -0.4 20.3 -0.4 15.4
yij
Residuos
=
242.9 242.9 242.9 242.9 242.9 242.9
218.7 218.7 218.7 218.7 218.7 218.7
214.1 214.1 214.1 214.1 214.1 214.1
245.9 245.9 245.9 245.9 245.9 245.9
=
12.5 12.5 12.5 12.5 12.5 12.5
-11.7 -11.7 -11.7 -11.7 -11.7 -11.7
-16.3 -16.3 -16.3 -16.3 -16.3 -16.3
15.5 15.5 15.5 15.5 15.5 15.5
y
yi
+
-13.8 10.8 -1.6 11.8 -5.7 -1.6
14.8 14.4 0.6 -18.7 5.7 -16.7
-3.0 9.0 3.4 -2.3 -6.5 -0.4
24.5 2.7 -15.9 4.8 -15.9 -0.1
+
-13.8 10.8 -1.6 11.8 -5.7 -1.6
14.8 14.4 0.6 -18.7 5.7 -16.7
-3.0 9.0 3.4 -2.3 -6.5 -0.4
24.5 2.7 -15.9 4.8 -15.9 -0.1
yij
y
yi 41
Análisis de la varianza
Variabilidades: ejemplo Variabilid ades K ni
VT
( yij i 1j 1 K
VE
ni ( y i
Grados de libertad
y )2
7645.5
n-1 23
y )2
4798.1
K-1 3
i 1
K ni
VNE
eij 2
2847.4
n-K
20
4798.1
2847.4
i 1j 1
7645.5 23 Análisis de la varianza
3
20 42
Interpretación gráfica de la descomposición y1 y2 yi
y3
yij
y
yi
y4 y
yij
y 43
Análisis de la varianza
Distribución de VE yij Si
N( i, 1
2
2
yi
)
2
K
N( i,
ni
)
que llamaremos 2
yi
i
y1 / n1
y1
y / n1
Análisis de la varianza
2
2
y2 / n2
y2
y / n2
N( , 2
2
ni
) yK / nK
yK
y / nK
2 2 K
2 2 K 1
44
Distribución de VNE ni
y i )2
( yij yij
2
N( i,
)
( yij
yi )
i 1j 1
( ni 1) si2
ni 1 1
2
n
( y1 j
y1 )
j 1
2
2
( y2 j
nK
2
( y Kj
j 1
y K )2
n K ( n1 1) s12
( n1 1) s12
2
y2 )
j 1
n K
( n K ) s R2
2 ni 1
2
n
K ni
s R2
j 1
si2
( n2 1) s22 n K
( n2 1) s22
2
(nK 1) s K2
2
2 n1 1
(nK 1) s K2
2
2 n2 1
2 nK 1
2 n K
45
Análisis de la varianza
Contraste (Análisis de la Varianza) H0 :
1
2
K
H1 : Al menos una es diferente K ) s R2 2
(n
F0
i 1
F0
F
F0
F
ni ( y i
y
y )2
ni ( yi
2 n K
K
K
Si Ho es cierto : i
1 2
2 K 1
)2
2 ( K 1) s R No se rechaza H 0
FK
1, n K
Se rechaza H 0
Análisis de la varianza
46
Tabla de Análisis de la Varianza Suma de Cuadrados
Fuentes Tratamient os
ni ( y i
Residual Total
y )
Grados de Libertad 2
K 1
( yij
yi )2
n K
( yij
y )2
n 1
Varianzas ni ( y i
2
y ) /( K 1)
F ni ( y i
y )2
( K 1) s R2
2 sR
47
Análisis de la varianza
Tabla de Análisis de la Varianza Suma de
Grados de
Fuentes
Cuadrados
Libertad
Varianzas
F
Tratamient os Residual
4798.1 2847.4
3 20
1599.3 142.4
11.2
Total
7645.5
23
Análisis de la varianza
48
Intervalos de confianza para las medias yij
N( i,
2
2
)
yi
yi i
N( i,
tn
sR ni
i
R.R
R.R. i
yi
)
N (0,1)
ni yi
ni
tn-K
1-
K
/2
/2
t
s
R. Acept. H0
-t
t
/2
/2
R /2 n i 49
Análisis de la varianza
Intervalos de confianza
Semilla A B C D
Análisis de la varianza
Media 242.9 218.7 214.1 245.9
L. Inferior L. Superior 235.7 211.4 206.9 238.7
250.1 225.8 221.3 253.1
50
Intervalos de confianza (95%)
Rendimiento
260 250 240 230 220 210 200 A
B
C
D
Semilla 51
Análisis de la varianza
Diferencia de medias: y1
1
2
y11 2
y12
y1
N(
1,
n1
)
y2 ( y1
y21 y22
2
y2
N(
2,
n2
)
y2 n2
y1n1 y1
y2
N( y2 ) ( 1 n1
1 1
1 n2
Análisis de la varianza
2, 2)
2
2
n1
n2
) ( y1
y2 ) (
1
1 n1
1 n2
N (0,1) sR
2)
tn
K
52
Contraste multiples
H0 :
tij
i
j
H1 :
i
yi
yj
sR
R.R
R.R.
1 ni
tn-K
j
1/2
tn
1 nj
/2
R. Acept. H0
K
-t
/2
t0
t
/2
No se rechaza H 0
t0
t
/2
Se rechaza H 0
Análisis de la varianza
Diagnosis del modelo
t
/2
53
Modelo
... 2
1
K
y21
y11 y12
y22
y1n
y2 n
1
...
2
yK1 yK 2 y Kn
K 55
Análisis de la varianza
Hipótesis del modelo Normalidad yij
N( i, 2)
Homocedasticidad Var [yij] =
2
Independencia Cov [yij, ykl] = 0
Análisis de la varianza
56
Residuos: Normales y homocedásticos
yij
i
uij
uij
yij
i
uij
N (0,
2
eij
yij
yi
)
Residuos A -13,8 10,8 -1,6 11,8 -5,7 -1,6 0,0
B 14,8 14,4 0,6 -18,7 5,7 -16,7 0,0
C -3,0 9,0 3,4 -2,3 -6,5 -0,4 0,0
D 24,5 2,7 -15,9 4,8 -15,9 -0,1 0,0
0
Análisis de la varianza
57
Comprobación de la normalidad Los residuos deben de tener distribución normal. Las observaciones originales también, pero cada grupo con media diferente, por ello es preciso estimar el modelo para descontar a cada observación su media y obtener valores con la misma distribución.
Herramientas de comprobación: Histograma de residuos Gráfico de probabilidad normal (Q-Q plot) Contrastes formales (Kolmogorov-Smirnov) Análisis de la varianza
58
Gráfico probabilista normal Es un gráfico X-Y de los residuos frente a los percentiles de la distribución normal.
Pasos: Ordenar los residuos de menor a mayor. e(1) e(2) e(n)
La idea básica es que cuando los residuos tienen distribución normal, los puntos deben formar aproximadamente una línea recta
Calcular los percentiles de la distribución normal 1
Yi
(
i 0.5 ) sR , i 1,2,..., n n
Representar
e(i ) , Yi 59
Análisis de la varianza
Gráfico prob. Normal (ejemplo) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Resid. Probab. Percen. Percen. eij (i-0.5)/n N(0,1) N(0, ) -18,7 -16,7 -15,9 -15,9 -13,8 -6,5 -5,7 -3,0 -2,3 -1,6 -1,6 -0,4 -0,1 0,6 2,7 3,4 4,8 5,7 9,0 10,8 11,8 14,4 14,8 24,5
0,021 0,063 0,104 0,146 0,188 0,229 0,271 0,313 0,354 0,396 0,438 0,479 0,521 0,563 0,604 0,646 0,688 0,729 0,771 0,813 0,854 0,896 0,938 0,979
Análisis de la varianza
-2,04 -1,53 -1,26 -1,05 -0,89 -0,74 -0,61 -0,49 -0,37 -0,26 -0,16 -0,05 0,05 0,16 0,26 0,37 0,49 0,61 0,74 0,89 1,05 1,26 1,53 2,04
-24,30 -18,30 -15,01 -12,58 -10,58 -8,85 -7,28 -5,83 -4,46 -3,15 -1,88 -0,62 0,62 1,88 3,15 4,46 5,83 7,28 8,85 10,58 12,58 15,01 18,30 24,30
Q-Q plot 30,0 20,0 10,0
Percentiles
Orden i
0,0 -10,0 -20,0 -30,0 -30,0
-20,0
-10,0
0,0
10,0
20,0
30,0
Residuos ordenados
60
Gráfico probabilista normal 99.9
Probabilidad
99 95 80 50 20 5 1 0.1 -30
-20
-10
0
10
20
30
Residuos 61
Análisis de la varianza
Ejemplos 99,9 99 95 80 50 20 5 1 0,1
99,9 99 95 80 50 20 5 1 0,1
Normal -2,6
-1,6
-0,6
99,9 99 95 80 50 20 5 1 0,1
0,4
1,4
2,4
3,4
0,4
0,8
Análisis de la varianza
1,2
1,6
0
3
6
99,9 99 95 80 50 20 5 1 0,1
No normal 0
No normal
2
9
12
15
No normal -3
-1
1
3
5
62
Comprobación de la homocedasticidad En el proceso de estimación se ha supuesto que los distintos tratamientos tienen la misma varianza
Herramientas Gráficos de residuos: Frente a valores previstos Frente a tratamientos (o factor,etc.)
Contrastes formales: Bartlett, Cochran, Hartley, Levene
63
Análisis de la varianza
Residuos - Valores previstos En este modelo los valores previstos corresponden a la media del tratamiento
30
residuos
20 10 0 -10 -20 -30 210
220
230
240
250
valores previstos 30
residuos
20 10 0 -10 -20 -30 0
5
10
Valores previstos
Análisis de la varianza
15
Los puntos deben aparecer dispuestos al azar en una banda horizontal alrededor del eje horizontal. Heterocedasticidad: a veces la dispersión aumenta conforme la media crece. 64
Residuos por tratamientos 25
máx.
mín.
Residuos
15 5 -5 -15 -25 A
B
C
D
Semilla
En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero. 65
Análisis de la varianza
Residuos por tratamientos 25
máx.
mín.
Residuos
15 5 -5
máx mín
3
-15 -25 A
B
C
D
Semilla
En cada grupo los residuos aparecen esparcidos con dispersión similar y media cero. Análisis de la varianza
66
Contrastes formales
1
2
1
2
H0 :
2 1
...
K
K
2 2
2 K
H1 : Alguna es distinta 67
Análisis de la varianza
Contraste de Bartlett n1=n2==nK=m 1
2
1
2
( y1 j y1 ) 2
s12
m 1
sG2
yK1 s22
( y2 j y2 ) 2 m 1
...
y2n2
y1m s R2
y22
s12
s22
sK2 K
K
s12 s22
s K2
Análisis de la varianza
K
K
y21
y11 y12
...
2 Si Ho n K log sR 2 sG cierto 1 c
yK 2
sK2
( y Kj y K ) 2 m 1
yKm 2 K 1
c
K 1 3(n K ) 68
Contraste de Bartlett (general) sR2
(n1 1) s12 (n2 1) s22 n K n K
sG2
s12
n1 1
(nK 1) sK2 s22
n2 1
1 3( K 1)
c
n K sR2 log 2 1 c sG
Si Ho cierto
nK 1
sK2 K
1
1 1 n K
i 1 ni
2 K 1
69
Análisis de la varianza
Contraste de Bartlett: ejemplo Datos B 233,4 233,0 219,2 200,0 224,3 202,0 218,7
C 211,1 223,1 217,5 211,8 207,6 213,7 214,1
D 270,4 248,6 230,0 250,7 230,0 245,8 245,9
96,8
216,2
29,9
227,2
Varianzas
p valor
0,25
A 229,1 253,7 241,3 254,7 237,2 241,3 Medias 242,9
2 3
0.177
0.05
0.01
0 0
4
8
12
16
x
sR2
96.8 216.2 29.9 227.2 142.4 4
sG2
4
96.8 216.2 29.9 227.2 109.1
Análisis de la varianza
2 0
n K s R2 log 2 1 c sG 20 142.4 log 1 (5 / 60) 109.1
4.91
70
0,57
0,57
0,37
0,37
residuos
residuos
Diagnosis: Tres gráficos básicos 0,17 -0,03
0,17 -0,03 -0,23
-0,23
-0,43
-0,43 0
0,3
0,6
0,9
1
1,2
probabilidad
3
Tratamientos
Valores previstos 99,9 99 95 80 50 20 5 1 0,1 -0,33
2
Homocedasticidad
Normalidad -0,13
0,07
0,27
0,47
residuos
probabilidad
Gráfico probabilista normal 99,9 99 95 80 50 20 5 1 0,1 -0,33
-0,13
0,07
0,27
0,47
residuos Análisis de la varianza
72
Transformaciones z=h(y) para estabilizar la varianza Desarrollo de Taylor para z
h( y ) en
1 z h( ) h' ( )( y ) h' ' ( )( y 2 La media y varianzas de z son aprox. E[z]
h( )
E[y] )2
1 h''( )Var (y) 2
h' ( ) 2 Var [ y ]
Var [ z ]
73
Análisis de la varianza
Ejemplo
z
a by
La media y varianzas de z son E[z]
a b
Var [ z ] b 2 Var [ y ]
La Var[ z ] depende de b Observación: Esta transformación no altera las características de y: si y no tiene varianza constante, z tampoco. Análisis de la varianza
74
z
Ejemplo
log( y)
La media y varianzas de z son aprox. E[z]
1
log ( ) 2
Var [ z ]
1 2
2
Var (y)
Var [ y ]
Si Var[ y] k
2
Var[ z]
k
79
Análisis de la varianza
h( yij )
zij homocedásticas
zij
yij heterocedásticas
Transformaciones Box-Cox z ij1,5
p>1
p=1
1
p1 o p µA . ¿ Qu´e condici´on debe cumplir la diferencia entre las medias muestrales de los dos m´etodos para rechazar H0 con α = 0.01? 3. Se ha realizado un experimento para estudiar el efecto de un u ´ nico factor con I niveles en la variable respuesta y con un n´ umero diferente de observaciones en cada tratamiento: n1 , n2 , ..., nI siendo el total n = n1 + n2 + · · · + nI . Llamando yij a la observaci´on j del tratamiento i, i = 1, ..., I, j = 1, 2, ..., ni e y¯i• la media del tratamiento i. Se desea estimar la media general ¿cu´al de los dos estimadores siguientes
y •• =
ni I P P
yij
i=1 j=1
I P
i=1
y¯i•
, y˜•• = n I tiene m´ınima varianza? Realiza la comprobaci´on para el caso I = 5, con ni = 3, 2, 3, 5, 6 el n´ umero de observaciones en cada tratamiento. Asumir que las observaciones son independientes y que se cumple la hip´otesis de homocedasticidad. 1
4. Considere la comparaci´on de dos tratamientos en poblaciones normales. Demuestre que el contraste t para comparar dos medias es an´alogo al contraste de la F en An´alisis de la Varianza (suponga n1 = n2 ). 5. Cinco tipos (A, B, C, D y E) de material sint´etico se han sometido a un ensayo de desgaste. Para cada tipo de material la prueba se repitio 6 veces. El desgaste medio y la desviaci´on t´ıpica corregida en cada caso es la siguiente:
media xi d. t´ıpica sˆi
A B C D E 14.1 16.3 13.5 14.8 15.3 1.3 1.2 1.4 1.2 1.5
(a) Contrastar (α = 0.05) la hip´otesis H0 : µ A = µ B = µ C = µ D = µ E frente a la hip´otesis alternativa, H1 : Alguna media es distinta a las dem´as. (b) Indicar con nivel de confianza 0.95 el material con desgaste menor y qu´e materiales tienen desgaste medio, distinto. (c) Obtener un intervalo de confianza con α = 0.01 para la varianza del error experimental. 6. Se desea comprobar el efecto de un tratamiento t´ermico sobre la resistencia de un nuevo material. Se han tomado 15 probetas y se han asignado al azar a los tres tratamientos T1 , T2 y T3 obteniendo como medida de resistencia superficial los valores siguientes: T1 2.65 2.67 2.46 1.90 2.62
T2 4.31 3.96 4.64 4.74 4.00
T3 4.81 5.32 4.93 5.49 4.45
(a) Contrastar mediante el test de an´alisis de la varianza si existen diferencias significativas entre los tratamientos t´ermicos (α = 0.01). (b) La temperatura del tratamiento 2 es la media de las temperaturas de los otros dos tratamientos. Si la relaci´on entre la resistencia y la temperatura es lineal, es de esperar que la media del tratamiento 2 verifique : H0 : µ2 = 21 (µ1 + µ3 ). Hacer el contraste bilateral de esta hip´otesis con α = 0.05. (Nota.- Usar la distribuci´on de y 2 −(y 1 +y 3 )/2, donde y i es la media de los datos correspondientes al tratamiento Ti ). 7. En el modelo de an´alisis de la varianza para contrastar la igualdad de medias de I grupos, con n1 , n2 , ..., nI observaciones en cada grupo; indicar, justificando la respuesta, si y¯•• , y¯i• y eij son independientes. Calcular los coeficientes de correlaci´on. 2
8. Explicar detalladamente la descomposici´on de la variabilidad en el modelo b´asico de an´alisis de la varianza para comparar I tratamientos. Obtener el estad´ıstico F de contraste, indicando en cada paso las hip´otesis utilizadas. 9. Demostrar que en el modelo para la comparaci´on de las medias de K tratamientos con el mismo n´ umero de observaciones, la varianza residual estimada (b s2R ) es igual a la media de las varianzas muestrales corregidas de cada tratamiento. Utilizando esta relaci´on, demostrar que el estimador sb2R es insesgado y obtener su distribuci´on de probabilidad. Suponer que se cumplen las hip´otesis de normalidad, independencia y homocedasticidad, y dar por demostrado que la varianza muestral corregida sb2 , en una muestra aleatoria simple de tama˜ no n de una distribuci´on normal, es un estimador centrado de la varianza de la distribuci´on σ 2 , y que (n − 1)b s2 /σ 2 se distribuye como una χ2 con n − 1 grados de libertad). 10. Explicar la descomposici´on de la variabilidad en el modelo b´asico de comparaci´on de K tratamientos (modelo con un factor ). Demostrar que si todos los tratamientos tienen la misma media VE χ2K−1 . σ2 Indicar en cada paso las hip´otesis requeridas. Nota.- Tener en cuenta que si X1 , X2 , ..., Xn son variables aleatorias independientes con distribuci´on normal de media µ y varianza σ 2 , y P X = Xi /n, 2 n X Xi − X χ2n−1 . σ i=1 11. Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un qu´ımico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido Lote 1 Lote 2 Lote 3 Lote 4 Lote 5 23.46 23.59 23.51 23.28 23.29 23.48 23.46 23.64 23.40 23.46 23.56 23.42 23.46 23.37 23.37 23.39 23.49 23.52 23.46 23.32 23.40 23.50 23.49 23.29 23.38 La tabla de an´alisis de la varianza se proporciona a continuaci´on. Comparar mediante el m´etodo de Bonferroni las medias de los cinco tratamientos con nivel de significaci´on total αT = 0.10.
Fuente Lote Residuos Total
An´alisis de la varianza Variabilidad g.l. Var. Media F 0.096976 4 0.024244 5.54 0.08760 20 0.00438 0.184576 24
3
Nivel cr´ıtico 0.0036