Story Transcript
M´etodos Estad´ısticos de la Ingenier´ıa Tema 2: Representaciones Gr´aficas Grupo B ´ Area de Estad´ıstica e Investigaci´on Operativa Licesio J. Rodr´ıguez-Arag´on Enero 2010
Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Gr´ aficos para un Car´ acter Cualitativo Diagrama de Rect´ angulos, Bar Plot . . . . Diagramas de Rect´ angulos con R . . . . . Diagrama de Sectores, Pie Chart. . . . . . Diagrama de Sectores con R . . . . . . . . . Pictograma . . . . . . . . . . . . . . . . . . . . . Cartograma . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
3 4 5 6 7 8 9
Ordenaci´ on de datos de Car´ acter Cuantitativo 10 Intervalos y Marcas de Clase. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Ejemplo: Ingresos Anuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Gr´ aficos para un Car´ acter Cuantitativo Diagrama de Barras, Bar Plot. . . . . . . . . . . . Diagrama de Barras con R . . . . . . . . . . . . . . Histograma, Histogram. . . . . . . . . . . . . . . . . Histograma con R . . . . . . . . . . . . . . . . . . . . Pol´ıgonos de Frecuencias, Frequency Polygon . Frecuencias Acumuladas, Ogive. . . . . . . . . . . Tallo y Hojas, Stem and Leaf . . . . . . . . . . . . Tallo y Hojas con R . . . . . . . . . . . . . . . . . . . Box Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . Box Plot con R . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
1
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
13 14 15 16 17 18 19 20 21 22 23
Contenidos
Representaciones Gr´ aficas para un Car´ acter Cualitativo. – Rect´ angulos, Sectores, Pictogramas y Cartogramas. – Bar Plot, Pie Chart, Pictograph and Cartograph.
Ordenaci´ on de datos de un Car´ acter Cuantitativo.
Representaciones Gr´ aficas para un Car´ acter Cuantitativo. – Diagrama de barras, tallo y hojas, histograma, pol´ıgono de frecuencias, diagramas de
frecuencias acumuladas, pol´ıgonos de frecuencias acumuladas y Box Plot. – Bar Plot, Stem-and-leaf, Histogram, Frequency Polygon, Ogive, Box Plot
La Representaci´ on Gr´ afica de los datos contribuye a facilitar su “lectura” una vez ordenados y agrupados.
Once the data have been sorted and grouped together, Plots and Charts makes it easier to read them. Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 2 / 23
3 / 23
Gr´ aficos para un Car´ acter Cualitativo Diagrama de Rect´ angulos, Bar Plot
0.2
Frecuencia 0
0.0
0.1
5
Frecuencia
10
0.3
0.4
15
Sobre el eje de Abcisas se representan las distintas modalidades de un car´ acter cualitativo y se levantan sobre ellos rect´ angulos de bases iguales, no solapados y cuya altura es proporcional a la frecuencia Absoluta o Relativa de cada modalidad.
nd
Pr
Se
Su
nd
Formación
Pr
Se
Su
Formación
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 4 / 23
2
Diagramas de Rect´ angulos con R Datos referentes a la formaci´ on de trabajadores de una empresa: > + + + + > > +
form pie(table(form)) Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 7 / 23
Pictograma
Cada modalidad se representa mediante un dibujo de tama˜ no proporcional a la frecuencia de la misma.
Todos los dibujos empleados son del mismo tama˜ no, a cada modalidad se le asignan tantos dibujos o partes del mismo seg´ un su frecuencia.
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 8 / 23
4
Cartograma Representaci´ on por medio de un mapa.
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 9 / 23
5
10 / 23
Ordenaci´ on de datos de Car´ acter Cuantitativo Intervalos y Marcas de Clase En las observaciones de un Car´ acter Cuantitativo puede ocurrir:
La variable estad´ıstica tome pocos valores diferentes.
The statistical variable takes few different values.
Confeccionar la tabla de frecuencias ordenando los valores del car´ acter de menor a mayor: Car´ acter Ci C1 C2 .. . Cm Total
P
ni n1 n2 .. .
Ni N1 = n1 N2 .. .
nm ni = n
Nm = n
P
fi f1 f2 .. .
Fi F1 = f1 F2 .. .
fm fi = 1
Fm = 1
La variable estad´ıstica tome muchos valores diferentes, caracteres cuantitativos continuos y muestras de gran tama˜ no.
Agrupar los valores de la variable estad´ıstica en Intervalos de Clase, Class Interval or Bin, contiguos y elegidos convenientemente para perder la m´ınima informaci´ on posible. Los extremos de los intervalos de clase se denominan Extremos de Clase, bi , Class Limits, y sus puntos medios Marcas de Clase, xi , Class Mark. El n´ umero de Intervalos de Clase se elige entre 4 y 15 de forma que en cada intervalo haya al menos 5 observaciones. Los Intervalos de Clase no pueden solaparse, Class Intervals shouldn’t overlap.
Intervalo de Clase: [bi−1 , bi ).
Marca de Clase: xi =
bi−1 +bi . 2
[b1 , b2 ) [b2 , b3 ) .. . [bm−1 , bm ] Total
xi x1 x2 .. . xm
P
ni n1 n2 .. .
Ni N1 = n1 N2 .. .
nm ni = n
Nm = n
Licesio J. Rodr´ıguez-Arag´ on
P
fi f1 f2 .. .
Fi F1 = f1 F2 .. .
fm fi = 1
Fm = 1
Tema 2, M.E.I. – 11 / 23
6
Ejemplo: Ingresos Anuales 66814.19 61674.64 78121.21 69897.92 59618.82
42144.33 53451.35 28781.49 58590.90 25697.76
25697.76 16446.57 12334.92 52423.44 26725.67
35976.87 39060.60 13362.83 9867.94 35976.87 7195.37 45947.61 54479.26 43172.24 25697.76 51395.53 87372.40 71953.74 48311.80 6475.83
[bi−1 , bi ) [0, 20000) [20000, 40000) [40000, 60000) [60000, 80000) [80000, 100000] Total
xi 10000
90000
ni
P
Ni
fi
30
P
ni = 30
Fi
1 fi = 1
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 12 / 23
13 / 23
Gr´ aficos para un Car´ acter Cuantitativo Diagrama de Barras, Bar Plot
0.3
Frecuencia
0.2
6 2
0.1
4
Frecuencia
8
0.4
10
0.5
Se utiliza para representar variables estad´ısticas no agrupadas, las alturas de las barras deben ser proporcionales a las frecuencias, absolutas o relativas. La suma de la altura de las barras deber´ a ser n o 1.
119.0
119.5
120.0
120.5
121.0
121.5
122.0
119.0
Nº Vueltas
119.5
120.0
120.5
121.0
121.5
122.0
Nº Vueltas
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 14 / 23
7
Diagrama de Barras con R N´ umero de vueltas completas en 1 m de barra roscada. > pvuelta barplot(table(pvuelta),space=c(100,2)) > barplot(table(pvuelta)/length(pvuelta),space=c(100,2)) Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 15 / 23
Histograma, Histogram Se utiliza para representar las frecuencias absolutas o relativas cuando los datos est´ an agrupados, el ´ area de los rect´ angulos ser´ a proporcional a las frecuencias. La suma de las ´ areas deber´ a ser n o 1. Densidades de Frecuencias: altura de los rect´ angulos. hi =
ni fi , o bien hi = bi+1 − bi bi+1 − bi
Cuidado cuando la amplitud de los Intervalos de Clase no sean del mismo tama˜ no. Histogram: The grouping of data into bins (spaced apart by the so-called class interval) plotting the number of members in each bin versus the bin number.
1.0e−05
Densidad de Frecuencia
0.0e+00
5.0e−06
1.0e−05 5.0e−06 0.0e+00
Densidad de Frecuencia
1.5e−05
Histograma de Ingresos
1.5e−05
Histograma de Ingresos
0e+00
2e+04
4e+04
6e+04
8e+04
1e+05
0
Ingresos
20000
40000
60000
80000
Ingresos
Histogramas de los Ingresos Anuales. El ´ area de cada rect´ angulo, es proporcional a la frecuencia relativa, fi . La suma de las ´ areas de los rect´ angulos es 1. Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 16 / 23
8
Histograma con R > + + + + + > + + > > > > >
Ingresos ingresos stem(ingresos) The decimal point is 4 digit(s) to the right of the | 0 2 4 6
| | | |
70236 69669 23 278
> ingresos [1] 66814.195 42144.338 25697.767 35976.874 39060.606 13362.839 61674.641 [8] 53451.356 16446.571 9867.943 35976.874 7195.375 78121.212 28781.499 [15] 12334.928 Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 21 / 23
13
Box Plot Permite mostrar la distribuci´ on de los datos de una muestra. Est´ a especialmente indicado para detectar valores at´ıpicos, outliers.
Mediana, Median , l´ınea central, Q2 .
Primer y Tercer Cuartiles, Quartiles , l´ımites de la caja, Q1 , Q2 . Ingresos Anuales Modificado
0e+00
20000
1e+05
40000
2e+05
3e+05
60000
4e+05
80000
Ingresos Anuales
L´ımites superior e Inferior, LI = Q1 − 1.5(Q3 − Q1 ), LS = Q3 + 1.5(Q3 − Q1 ).
Se considerar´ an como valores at´ıpicos los valores fuera del intervalo (LI, LS).
Dibujar las l´ıneas que van desde los extremos de la caja hasta el valor m´ as extremo, no at´ıpico. Ingresos Anuales Modificado
0e+00
20000
1e+05
40000
2e+05
3e+05
60000
4e+05
80000
Ingresos Anuales
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 22 / 23
14
Box Plot con R library(UsingR) ingresos > > >
Licesio J. Rodr´ıguez-Arag´ on
Tema 2, M.E.I. – 23 / 23
15