Story Transcript
Medidas de dispersión
E n u n s u p e r m e r c a d o , s e l e dio l a o r d e n a u n o d e los e m p l e a d o s d e t o m a r l a t e m p e r a t u r a d e los r e f r i g e r a d o r e s c o n v e g e t a l e s c a d a 2 0 m i n u t o s y , e n s u c a s o , c o n t r o l a r l a o h u m e c t a r l o s p a r a q u e n o p i e r d a n sus p r o p i e d a d e s . É l i n t e r p r e t ó q u e p o d í a h a c e r l a s i n s p e c c i o n e s c a d a 2 0 m i n u t o s e n p r o m e d i o . E n l o s ú l t i m o s dos días s e e c h a r o n a perder varios vegetales y recibió una a m o n e s t a c i ó n verbal. Para defenderse, m o s t r ó a s u j e f e e l r e p o r t e d e l o s t i e m p o s q u e t r a n s c u r r i e r o n e n t r e r e v i s i o n e s e n u n día, s e g ú n s e m u e s t r a e n l a t a b l a 1.37.
Tabla 1.37 T i e m p o s e n t r e revisiones
10
DATO
Tiempo transcurrido (min)
14
21
24
20
21
23
16
17
19
16
22
E f e c t i v a m e n t e , l a m e d i a a r i t m é t i c a e s d e 2 0 m i n u t o s , p e r o l a dispersión d e l o s datos implica que algunos lapsos de t i e m p o entre u n a y otra inspección son mayores a 20 m i n u t o s . En el r e p o r t e del e m p l e a d o , 4 de l o s p e r i o d o s s o n m a y o r e s q u e o iguales a 22 m i n u t o s . L a s m e d i d a s d e d i s p e r s i ó n d e los d a t o s j u n t o c o n l a m e d i d a d e u n p r o m e d i o m e j o r a n l a d e s c r i p c i ó n : U n p r o m e d i o solo n o p r o p o r c i o n a m u c h a i n f o r m a c i ó n ; p o r s í m i s m o , s ó l o i n d i c a l a p o s i c i ó n del c e n t r o , m i e n t r a s q u e u n a m e d i d a d e d i s p e r s i ó n p e r m i t e c o n o c e r c u á n t o s e e s p a r c e n los d a t o s a l r e d e d o r del c e n t r o . T o m e m o s c o m o referencia el siguiente caso, para comprender la diferencia entre
medidas
de
tendencia
central
y
medidas
de
dispersión.
El director de u n a escuela investiga cuál es el c o n s u m o diario de papel para imp r e s o r a en su e s c u e l a d u r a n t e p e r i o d o s de e x á m e n e s (E) y en p e r i o d o s n o r m a l e s de t r a b a j o (EE). O b t i e n e u n a m u e s t r a del c o n s u m o e n m i l e s d e h o j a s d u r a n t e seis d í a s e n e l p e r i o d o n o r m a l d e t r a b a j o : 1 . 5 , 1 . 4 , 1 . 3 , 1 . 5 , 1 . 6 y 1.3. U n a m u e s t r a d e c i n c o d í a s en p e r i o d o de e x á m e n e s a r r o j ó los s i g u i e n t e s d a t o s : 1.8, 2 . 4 , 1 . 6 , 2.8 y 1.4. C a l c u l ó la m e d i a a r i t m é t i c a y el r a n g o p a r a c a d a c o n j u n t o de d a t o s y o b t u v o lo s i g u i e n t e :
x — 1.433 m i l l a r e s / d í a ; r a n g o — 0.3 m i l l a r e s / d í a , EE
x = 2 m i l l a r e s / d í a ; r a n g o = 1.4 m i l l a r e s / d í a . E
El r a n g o es u n a medida de dispersión q u e se define c o m o la diferencia e n t r e el d a t o m a y o r y el m e n o r , y e x p l i c a e n t r e q u é v a l o r e s e s t á n d i s p e r s o s los d a t o s . Así, en
12
13
28
19
20
15
16
20
18
e s t e c a s o s e infiere q u e e n p e r i o d o s d e e x á m e n e s , a d e m á s d e q u e s e g a s t a m á s p a p e l d i a r i a m e n t e , las c a n t i d a d e s d e l o s c o n s u m o s s e p a r e c e n m e n o s . A l g u n a s d e l a s m e d i d a s d e d i s p e r s i ó n m á s u s a d a s p a r a d e s c r i b i r d a t o s s o n las q u e s e m u e s t r a n e n e l e s q u e m a d e l a f i g u r a 1.35.
NO
USAN
TODA
LA
USAN
TODA
LA
INFORMACIÓN
INFORMACIÓN
DISPONIBLE
DISPONIBLE
RANGO
PERCENTILES
DESVIACIÓN
VARIANZA
MEDIA
/
CUARTI LES
DESVIACIÓN ESTÁN DAR
RANGO ENTRE PERCENTILES
Figura 1.35
RANGO
INTERCUARTÍLICO
Medidas de dispersión
L a s m á s eficientes son aquellas en las que se utiliza toda la información disponible, pero las otras son a m p l i a m e n t e usadas para efectuar descripciones de distribucion e s d e f r e c u e n c i a s . T o d a s ellas s o n estadísticos s i s e c a l c u l a n c o n d a t o s d e u n a m u e s t r a , y s o n parámetros si en su c á l c u l o se u t i l i z a t o d a la i n f o r m a c i ó n de u n a población.
1.4.1 I Rango El rango de un conjunto de datos es la m e d i d a de dispersión m á s simple.
R a n g o de un c o n j u n t o de d a t o s n u m é r i c o s : Es la diferencia entre los valores mayor y
menor.
Deforma
simbólica: R — valor d a t o m a y o r — v a l o r d a t o m e n o r .
E l r a n g o t i e n e v a r i a s p r o p i e d a d e s q u e d e t e r m i n a n s u uso: • E s a f e c t a d o p o r u n valor e x t r e m o ; p o r e j e m p l o , u n o m u y g r a n d e e n e l c o n t e x t o de los d e m á s . • No m i d e ni d e s c r i b e la dispersión de los d a t o s e n t r e los valores m á x i m o y m í n i m o . • S u v a l o r e s m u y útil c u a n d o s e c o m p a r a n v a r i a s m u e s t r a s p e q u e ñ a s . a
Ejemplo 1.59
El r a n g o de l o s valores 2, 3, 4 y 1 0 0 es 9 8 ; 1 0 0 es un valor e x t r e m o y a f e c t a el v a l o r del rango, e l c u a l e n e s t e c a s o n o p r o p o r c i o n a i n f o r m a c i ó n a c e r c a d e l a d i s p e r s i ó n de los d a t o s e n t r e el 2 y el 1 0 0 .
I
Actividades de aprendizaje
Analiza
los
mientos
que
siguientes sigas y
ejercicios y las
contesta
respuestas
de
tu grupo.
Q
L O N G I T U D E S DÉ T O R N I L L O S
lo
que
que
obtengas
se
te pide.
con
las
Compara de
algunos
los procedicompañeros
En un p r o c e s o se m i d e n las l o n g i t u d e s de 5 t o r n i l l o s en c e n t í m e t r o s y se o b tienen los siguientes resultados: 10.09, 9.98, 9 . 9 9 , 1 0 . 0 4 y 10.10. H
¿ C u á l es el r a n g o ?
\b\
¿ C u á l es la m e d i a a r i t m é t i c a ?
H
¿ C u á l es la m e d i a n a ?
\á\
.
Compara la media aritmética c o n la mediana: x X
¿ Q u é significa el r e s u l t a d o ?
0.5
Un p e q u e ñ o negocio que se dedica al planchado de ropa recibe pedidos gen e r a l m e n t e p e q u e ñ o s . L o s pedidos de las dos ú l t i m a s s e m a n a s , en c a n t i d a d de prendas que se t i e n e n que planchar, se m u e s t r a n a continuación. Pedidos de la s e m a n a 21
Pedidos de la s e m a n a 20
PEDIDO
H
PEDIDO
i
PRENDAS
¡
PRENDAS
1
!
25
1
!
34
2
!
46
2
!
56
3
!
24
3
!
17
4
¡
20
4
!
12
5
|
15
5
!
26
6
!
28
6
i
35
7
!
35
7
¡
8
¡
40
8
¡
14
9
!
9
!
28
10
!
36
10
!
23
11
!
28
11
¡
40
12
!
37
12
¡
120
13
!
29
13
!
12
14
¡
18
14
!
12
15
!
38
15
!
16
16
!
28
16
¡
18
17
!
54
17
!•
38
18
!
16
18
¡
40
19
|
29
20
!
23
21
!
43'
22
!
34
3
4
.
4
0
C a l c u l a el r a n g o de c a d a s e m a n a y c o m p á r a l o s :
¿Cuántas veces es m a y o r o m e n o r el rango de la s e m a n a 1 al rango de la s e m a n a 2? ¿Qué significa eso?
\b\ 0
¿Cuál e s l a m e d i a a r i t m é t i c a d e p r e n d a s p o r p e d i d o d e c a d a s e m a n a ? ¿Cuál e s l a m e d i a n a del n ú m e r o d e p r e n d a s p o r c a d a p e d i d o d e c a d a s e mana?
\á\
¿ E n qué s e m a n a e x i s t e u n v a l o r a n o r m a l ? ¿ C u á l e s e s e v a l o r ? ¿ C ó m o afecta al rango, a la m e d i a a r i t m é t i c a y a l a m e d i a n a ? Explica.
1.4.2
I Percentiles
P a r a v e r c u á l e s l a utilidad d e l o s p e r c e n t i l e s , t o m e m o s c o m o r e f e r e n c i a e l s i g u i e n t e caso. °
Ejemplo 1.60
G e n e r a l m e n t e s e a p l i c a n e x á m e n e s d e i n g r e s o a las i n s t i t u c i o n e s d e e d u c a c i ó n superior. L o s r e s u l t a d o s de e s o s e x á m e n e s s u e l e n o r d e n a r s e del m a y o r al m e n o r , o vic e v e r s a , y c a d a p a r t i c i p a n t e a d q u i e r e a s í u n a p o s i c i ó n d e o r d e n d e n t r o del c o n j u n to. Cuarenta datos de ese tipo, provenientes de calificaciones en u n a escala que va d e 7 0 0 a 1 3 0 0 p u n t o s , s e m u e s t r a n e n l a t a b l a 1.38, o r d e n a d o s del m e n o r a l mayor.
Tabla 1.38 Resultados de un e x a m e n de ingreso a una universidad
DATO
|
1
2
3
4
5
6
7
8
9
10
CALIFICACIÓN
¡
774
786
853
890
894
903
908
925
926
930
DATO
!
12
13
14
15
16
iBÉ
18
19
20
CALIFICACIÓN
¡
933
937
939
952
956
969
991
993
993
DATO
|
21
22
23
24
25
26
27
28
29
30
CALIFICACIÓN
¡
999
1002
1007
1007
1010
1010
1013
1021
1023
1034
DATO
¡
31
32
33
34
35
36
37
38
39
40
CALIFICACIÓN
¡
1040
1043
1045
1056
1058
1059
1061
1105
1184
1215
1 1
De estos datos, se quiere d e t e r m i n a r u n a calificación que p a r t a al grupo de datos en dos subgrupos: uno c o n 75 p o r ciento m e n o r e s a esa calificación, y otro c o n 25 p o r c i e n t o m a y o r e s . E n e s t e p r o b l e m a s e r e q u i e r e c a l c u l a r e l percentil 7 5 ° .
El p e r c e n t i l p de un g r u p o de d a t o s o r d e n a d o s : Es el valor x ( p ) para el cual p por
ciento
de
las
mediciones
son
menores
que
él
El cálculo de un percentil de u n a m u e s t r a ordenada se realiza de la siguiente manera. 1) Se calcula el dato p e r c e n t i l p c o n la fórmula p{n)
D(p).
+p
100 d o n d e p e s e l p o r c e n t a j e d e d a t o s q u e d e b e n s e r m e n o r e s q u e e l v a l o r del p e r c e n til r e q u e r i d o : 1 0 % , 2 5 % , 3 8 % , 7 5 % , ...;yn e s e l n ú m e r o d e d a t o s . E l c á l c u l o del d a t o p e r c e n t i l 7 5 p o r c i e n t o , e n n u e s t r o e j e m p l o , s e h a c e a s í
75(40) + 7 5
=
3
0
7
5
-
100 Así, e l valor del d a t o p e r c e n t i l e s m a y o r q u e 1 0 3 4 p u n t o s , p e r o m e n o r q u e 1 0 4 0 puntos. 2) Se interpola p a r a o b t e n e r el valor del d a t o p e r c e n t i l p: x(p), y se c a l c u l a s e g ú n la regla x{p)
J
=D _ r p
1
[D + i p
— D _ ] [parte p
1
d o n d e D _ es e l d a t o a n t e r i o r a l d a t o D(p), y D p
1
d e c i m a l del dato D(p)]
?
p
+
1
e s el dato posterior al dato
D(p). Cálculo para nuestro ejemplo: T o m a en c u e n t a que 30.75 está entre los datos 30 ( 1 0 3 4 ) y 3 1 ( 1 0 4 0 ) ; así, t e n e m o s que 4 7 5 ) = 1 0 3 4 + [ 1 0 4 0 - 1034](0.75) = 1038.5 puntos. L u e g o , 7 5 p o r c i e n t o d e l a s c a l i f i c a c i o n e s s o n m e n o r e s a e s e valor.
CU ARTI LES
Los cuartiles son percentiles que parten un grupo de mediciones ordenadas a s c e n d e n t e o d e s c e n d e n t e m e n t e en cuartos, es decir, en s u b g r u p o s de d a t o s c a d a u n o c o n 2 5 % d e ellos, d e a c u e r d o c o n las s i g u i e n t e s d e f i n i c i o n e s y n o t a c i ó n ( v é a s e l a f i gura 1.36). • C u a r t i l 1 Q ( l ) = p e r c e n t i l 2 5 % = x(25). • C u a r t i l 2: Q ( 2 ) = p e r c e n t i l 5 0 % = x(50) =x
Q5
• C u a r t i l 3: Q ( 3 ) = p e r c e n t i l 7 5 % = x{75).
= la. m e d i a n a .
1 1 1
DATO MENOR
Cuartil 2:0(2) Percentil x(50)
Cuartil 1: QO) Percentil x(25)
DATO MAYOR
Cuartil 3:0(3) Percentil x(75)
MEDIANA
50% de los datos es menor a 0(2)
25% de los datos es menor a Q(1)
75% de los datos es menor a Q(3)
En virtud de lo anterior, el c á l c u l o de los c u a r t i l e s se r e a l i z a c o m o el de los r e s -
Figura 1 3 6 Significado de los valores
pectivos p e r c e n t i l e s .
de los cuartiles
Actividades de aprendizaje Reúnete Si
Q
con
tienen
tres
alguna
de duda,
tus
compañeros
coméntenla
de
con
grupo para su
relizar
la
siguiente
actividad.
maestro(a).
TERMOSTATO
E l c o n t r o l del t e r m o s t a t o d e u n c a l e n t a d o r d e gas e n c i e n d e c u a n d o l a t e m peratura baja. En un experimento c o n un nuevo termostato, se practicaron 60 ensayos obteniéndose los siguientes resultados, los cuales han sido orden a d o s del m e n o r a l mayor.
°C a los q u e reacciona el t e r m o s t a t o
12.0
16.8
17.9
18.6
19.9
20.4
21.5
22.2
23.0
24.0
12.5
16.9
18.0
18.7
19.9
20.5
21.6
22.4
23.6
25.3
12.9
17.0
18.1
18.7
19.9
20.6
21.6
22.7
23.8
25.5
15.3
17.1
18.1
18.9
20.0
20.9
21.9
22.7
23.9
25.7
15.8
17.5
18.3
19.1
20.2
21.2
21.9
22.8
24.0
26.1
16.3
17.8
18.5
19.4
20.3
21.2
22.0
22.8
24.0
28.4
[ a ] ¿ C u á l e s e l v a l o r del r a n g o ? [b] Calculen el valor de los cuartiles Q ( l ) , Q ( 2 ) y Q ( 3 ) . 0
¿Qué porcentaje de datos es mayor que Q(2)? ¿Por qué? ¿Qué significado tiene ese valor?
Gráfico
de
cajas
y
bigotes
C o n l o s c u a r t i l e s e s p o s i b l e c o n s t r u i r u n gráfico m u y s e n c i l l o l l a m a d o gráfico d e c a j a s y b i g o t e s . E s t u d i a la s i g u i e n t e s i t u a c i ó n y su s o l u c i ó n , en la q u e se o b t i e n e un gráfico de este estilo. a
Ejemplo 7 . 6 7
Los siguientes datos corresponden al número de empleados por empresa de la construcción, encontrado mediante un muestreo aleatorio de 70 empresas en la República M e x i c a n a . El registro lo realizó un consejo empresarial de la construcción a f i n a l e s del a ñ o 2 0 0 5 c o n l a f i n a l i d a d d e p o s e e r u n r e g i s t r o r á p i d o p a r a t o m a r algunas decisiones. En el padrón de empresas de ese tipo en el país aparecen registradas 8 500.
Tabla 1.39
1
13
35
55
68
91
132
153
213
333
3
20
39
57
71
94
133
166
221
334
6
20
39
60
77
95
138
175
229
340
6
22
42
61
78
101
142
178
248
351
8
22
50
66
86
113
147
180
258
454
10
32
53
66
87
127
150
184
261
693
12
35
55
66
88
132
153
204
326
718
E l o b j e t i v o d e l a e n c u e s t a fue d e t e r m i n a r a p r o x i m a d a m e n t e e l n ú m e r o d e e m pleados en todas las empresas y describir su c o m p o r t a m i e n t o . 1) La variable que se estudia es el n ú m e r o de empleados por empresa de la construcción. 2 ) S e prefiere e s t u d i a r u n a m u e s t r a y n o l a p o b l a c i ó n e n t e r a p o r q u e s e t i e n e p r i s a en adquirir información.
3) El v a l o r de la m e d i a n a es 88 + 91
= 89.5.
Así, s i l a m u e s t r a e s r e p r e s e n t a t i v a d e l a p o b l a c i ó n , a p r o x i m a d a m e n t e 5 0 % d e las empresas tiene 90 trabajadores o m e n o s . 4) L o s v a l o r e s de los p e r c e n t i l e s p e r c e n t i l e s 25 y 75 e s t á n , s e g ú n la f ó r m u l a d a d a al pricipio de esta sección, en los datos siguientes:
=
2 5 ( 7 0 ) + 25
? 3
100 75(70)
+
75
=
5 3
.
_ _ 2 5
100 Interpolando mediante la segunda fórmula dada en esta sección, se obtiene • Cuartil 1 o Q ( l ) : x ( 2 5 ) = 39 + [ 4 2 - 3 9 ] [ 0 . 7 5 ] = 4 1 . 2 5 t r a b a j a d o r e s . • Cuartil 3 o Q ( 3 ) : JE(75) = 1 7 8 + [ 1 8 0 - 1 7 8 ] [ 0 . 2 5 ] = 1 7 8 . 5 t r a b a j a d o r e s . E l h i s t o g r a m a d e f r e c u e n c i a s d e los d a t o s s e m u e s t r a e n l a f i g u r a 1.37. N ó t e s e que existe un e n o r m e sesgo a la derecha, lo cual t a m b i é n puede notarse construy e n d o un gráfico de cajas y bigotes, c o m o se m u e s t r a en la
figura
1.38.
EMPRESAS
Marco
DE
LA
CONSTRUCCIÓN
Barra del rango
x
Dato mayor: 718
Dato menor: 1
Cuartil 1,Q(1):42 Línea de la mediana, 0(2): 89.5
J _
-100
0
/
100
200
300
400
500
600
700
800
Figura 1.38 Gráfico de cajas y bigotes Cuartil 3,0(3): 178
L o s p a s o s p a r a l a c o n s t r u c c i ó n d e e s t e g r á f i c o s o n los s i g u i e n t e s .
1) Se c o n s t r u y e un m a r c o d e n t r o del c u a l se c o n s t r u i r á el gráfico de c a j a s y b i g o t e s . 2) Se i d e n t i f i c a n l o s v a l o r e s de l o s d a t o s m a y o r y m e n o r , 1 y 7 1 8 , y c o n e s o s v a l o r e s s e c o n s t r u y e n los e x t r e m o s d e l o s " b i g o t e s " , c o m o s e v e e n l a f i g u r a 1.38, c o n u n a s p e q u e ñ a s l í n e a s v e r t i c a l e s , a m a n e r a d e l í m i t e s del gráfico. 3) Desde esas pequeñas líneas se traza u n a línea auxiliar horizontal que las una: la b a r r a del r a n g o . 4 ) S o b r e l a b a r r a del r a n g o s e d i b u j a n p u n t o s q u e s e ñ a l e n los c u r t i l e s Q ( l ) , Q ( 2 ) y Q ( 3 ) . D e s d e ellos s e c o n s t r u y e n l a s c a j a s c o n l a a l t u r a q u e s e d e s e e . 5 ) S e t r a z a c o n l í n e a gruesa, sin a t r a v e s a r las c a j a s , l a l í n e a del r a n g o .
La l e c t u r a e i n t e r p r e t a c i ó n del g r á f i c o es la s i g u i e n t e .
1 ) D e s d e e l d a t o m e n o r h a s t a Q ( l ) s e c o n c e n t r a 2 5 % d e los d a t o s . 2) Desde Q ( l ) hasta Q(2) se c o n c e n t r a otro 2 5 % de datos. 3) E n t r e Q(l) y Q(3) se c o n c e n t r a 5 0 % de l o s d a t o s .
Así, 4) Hay m u c h a c o n c e n t r a c i ó n de d a t o s a la i z q u i e r d a , e s t o es, p a r a v a l o r e s p e q u e ñ o s del n ú m e r o d e t r a b a j a d o r e s . 5) El bigote de la derecha es m u c h o m á s largo que el de la izquierda, de lo c u a l se deduce que la distribución tiene un sesgo a la derecha. Compárese el gráfico de c a j a s de la figura 1.38 c o n el h i s t o g r a m a de f r e c u e n c i a s de la figura 1.37.
Actividades de aprendizaje Reúnete
con
tres alguna,
de
tus
compañeros
duda pregunten
a
de su
grupo,
y
resuelvan
la
siguiente
actividad.
Si
tienen
maestro(a).
Q
L a c a n t i d a d d e lluvia e n c e n t í m e t r o s p o r d í a r e g i s t r a d a e n e l a ñ o 2 0 0 4 e n u n a r e g i ó n d e s é r t i c a del n o r t e del p a í s e n l o s dí as q u e llovió s e m u e s t r a e n l a tabla siguiente.
CANTIDAD DE LLUVIA EN CENTÍMETROS (2004)
0.03
0.22
¡ 0.38
0.47
0.58
0.72
0.86
1.21
| 1.65
2.46
0.05
0.31
¡ 0.40
0.47
0.59
0.73
0.87
1.27
|
1.75
2.50
0.09
0.32
|
0.41
0.49
0.60
0.74
0.91
1.29
¡
1.81
2.57
0.17
0.35
¡ 0.41
0.52
0.66
0.75
0.93
1.33
| 1.87
2.90
0.1.8
0.36
| 0.43
0.54
0.66
0.75
0.97
1.34
| 1.93
3.12
0.21
0.37
¡ 0.46
0.54
0.69
0.79
1.16
1.40
| 2.38
3.87
[a] ¿Cuál es la variable en estudio? [b] C a l c u l e n l o s c u a r t i l e s Q ( l ) , Q ( 2 ) y Q ( 3 ) . 0
E x p l i q u e n el significado de c a d a u n o de l o s c u a r t i l e s .
[d] C o n s t r u y a n el gráfico de c a j a s y b i g o t e s .
CENTÍMETROS
-0.5
0.0
0.5
1.0
1.5
2.0
DE
LLUVIA
2.5
3.0
R e a l i c e n la l e c t u r a e i n t e r p r e t a c i ó n de l o s d a t o s .
3.5
4.0
4.5
Cálculo
de
cuartiles
para
datos
agrupados
Cuando se tienen datos agrupados, los cuartiles pueden calcularse de forma equivalente a c o m o se calcula la m e d i a n a para datos de ese tipo. °
Ejemplo 1.62
En u n a investigación sobre las cualidades de la redacción de un gran novelista, se midió el número de palabras por oración. Los resultados que se obtuvieron se m u e s t r a n e n l a t a b l a d e f r e c u e n c i a s 1.40.
Tabla 1.40 P a l a b r a s por oración
INTERVALOS REALES CLASE
i
1
DE CLASE PALABRAS/ORACIÓN
¡
FRECUENCIA
FRECUENCIA
¡
RELATIVA
i
/
FRECUENCIA RELATIVA
¡
ACUMULADA
fr
fra
1
!
20