Probabilidad y estadística MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE DISPERSIÓN , GRÁFICAS, E INTERPRETANDO RESULTADOS INTERPRETANDO RESULTADOS Prof. Miguel Hesiquio Garduño. Est Mirla Benavides Rojas Est. Depto. De Ingeniería Química Petrolera ESIQIE-IPN
[email protected] [email protected]
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Datos no agrupados
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Medidas de tendencia central Los parámetros L á d tendencia de d i centrall son valores l numéricos que tienden a localizar en la parte central de un conjunto de datos. Es un valor que se puede tomar como representativo de todos los datos Entre los parámetros de tendencia central se encuentran:
PROF. MIGUEL HESIQUIO GARDUÑO
Medidas de tendencia Central MEDIA ARITMÉTICA MEDIA ARITMÉTICA
MEDIA ARMÓNICA MEDIA ARMÓNICA
Conocida como promedio, se define como la suma de los valores de todas las x i divididas por el observaciones numero total de datos n
Es la inversa aritmética.
x =
i =1
la
media
Se utiliza para promediar variables con unidades complejas o compuestas, como aceleraciones, energía trabajo etc. energía, etc
n
∑
de
H =
xi
n
n n
∑
i =1
PROF. MIGUEL HESIQUIO GARDUÑO
1 xi
Medidas de tendencia Central MEDIA GEOMÉTRICA MEDIA GEOMÉTRICA
RAÍZ CUADRADA MEDIA RAÍZ CUADRADA MEDIA
Proporciona una medida promedio precisa de una variable que mide l cambios los bi porcentuales l en una serie de valores positivos
La media cuadrática o RMS se define como la raíz cuadrada de la di aritmética i é i de d los l elementos l media al cuadrado. Es utilizada para el cálculo de la media de un conjunto de números ú e os co con las as aalternancias e a c as de cantidades con valores positivos y negativos.
n
G = x1 x2 x3...xn n
rms =
∑
i =1
x i2
n
Medidas de Dispersión Varianza La varianza es el promedio de las desviaciones cuadráticas de _ cada dato x i respecto a su media aritmética x
Poblacional
Muestral
n
σ = 2
∑ (x − μ) i
i=1
n
2
2 ( x x ) − ∑ i
s = i =1 2
n
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
n −1
Medidas de Dispersión Desviación Estándar Es una medida de dispersión usada en la estadística que nos dice cuanto tienden a alejarse los valores puntuales del promedio en una distribución. promedio de la distancia de cada p punto respecto p del p promedio” “es el p
n
σ=
∑ ( xi − μ )
i =1
n
2
s=
n PROF. MIGUEL HESIQUIO GARDUÑO
∑ ( xi − x)
i =1
n −1
2
Y estas ecuaciones son fáciles de implementar en una p calculadora ordinaria? Hay una ecuación equivalente, porque la ecuación que define a la varianza es complicada de implementar en una calculadora:
⎛ ⎞ n ⋅ ∑ x − ⎜ ∑ xi ⎟ 2 ⎝ ⎠ i =1 i =1 s = n(n − 1) n
2 i
n
2
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Ejercicio En el laboratorio de una planta de carbón, se realizan diferentes análisis del mismo, uno de ellos es el análisis de ceniza. Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos, Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos, se obtuvo lo siguiente: Gramos 10.7225 11.5442 21.8136 24.5388 27.4321 30 2883 30.2883 27.7839 22.5670 30.5572 36.2593 34.8619 38.3817 26 2470 26.2470 39.6775 PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
De éstos datos: a)) Calcular C l l la l mediana di y la l moda, d H, H G, G rms b) Encontrar la varianza y la desviación estándar
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
En EXCEL =moda(a1: a30) =mediana( a1:a30) =promedio( a1:a30)
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Datos agrupados Para los datos cuantitativos continuos, los datos se suelen agrupar en clases, que son intervalos que no se juntan y cuya unión cubre todo el rango de los datos rango de los datos Suelen elegirse de la misma longitud, de modo que basta con seleccionar el numero de clase a tomar. l i l d l
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Criterios para generar una p g tabla de datos agrupados Cómo los organizo?
PROF. MIGUEL HESIQUIO GARDUÑO
Ordenando Datos en Clases MiguelHG Cuantas clases C t l 2K=n Tamaño de intervalo de clase: c=(Lrs‐Lri) c≅Rango/k X=marca de clase=(Lrs‐Lri)/2 ¿O podemos establecer tamaños un poco mayores?Responder despues de hacer el ejercicio
PROF. MIGUEL HESIQUIO GARDUÑO
Medidas de tendencia central I di Indican valores con respecto a los datos agrupados l l d d ¾Media ¾Mediana ¾Moda
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Ecuaciones para datos agrupados Ecuaciones para datos agrupados Media Conocida como promedio, se define como la suma de los valores de todas las observaciones x i divididas por el número total de datos n k
x=
∑x
i
i =1
fi
n
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Mediana
Es el valor que se encuentra en el centro de los datos, es decir, nos permite it conocer ell valor l que se encuentra t exactamente t t en la l mitad it d del d l conjunto j t de d datos. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.
L1 = Límite real inferior de la clase mediana
n − (∑ f i ) m ~ c x = L1 + 2 f med
n= Número de datos
(∑ fi ) m =
Suma de las frecuencias de todas las clases por debajo de la clase mediana
f med = c=
Frecuencia de la clase mediana
Ancho del intervalo de la clase mediana
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Moda Es el valor de variable que mas veces se repite. Es decir cuya frecuencia es mayor.
L1= Límite real Inferior de la clase modal
⎛ Δ1 ⎞ ⎟⎟c x = L1 + ⎜⎜ ⎝ Δ1 + Δ 2 ⎠ ∧
Δ1= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior clase contigua inferior Δ2= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior c= ancho del intervalo de la clase modal clase modal
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Medidas de dispersión IIndican la mayor o menor concentración de los datos con di l ió d l d respecto a las medidas de centralización ¾Varianza ¾Varianza ¾Desviación estándar ¾Coeficiente de variación ¾Coeficiente de variación
PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS
Ecuaciones para datos p agrupados V i Varianza
n ⋅ ∑ xi2 f i − ⎛⎜ ∑ xi f i ⎞⎟ ⎝ i =1 ⎠ s 2 = i =1 n(n − 1) k
k
n ⋅ ∑ x f i − ⎛⎜ ∑ x i f i ⎞⎟ ⎝ i =1 ⎠ i =1 n (n − 1) k
Desviación estándar Desviación estándar
s=
2
PROF. MIGUEL HESIQUIO GARDUÑO
2 i
k
2
Medidas de dispersión Medidas de dispersión Coeficiente de variación Determina el grado de dispersión de un conjunto de datos relativo a de un conjunto de datos relativo a su medida. Se calcula dividiendo la desviación estándar de una distribución por su media y multiplicando por 100
s CV = *100 x
PROF. MIGUEL HESIQUIO GARDUÑO
Crear unas diapositivas intermedias que vinculen al p q tratamiento de datos dispersos con el de agrupados
PROF. MIGUEL HESIQUIO GARDUÑO
Manejo de Datos , Manejo de Datos , n>20 PROF. MIGUEL HESIQUIO GARDUÑO
Contenido de Carbono en un mineral Contenido de Carbono en un mineral sub‐bituminoso 87
86
85
87
86
87
87
81
77
85
88
89
86
84
88
90
83
82
84
79
92
88
92
91
87
83
79
82
73
85
PROF. MIGUEL HESIQUIO GARDUÑO
Calcular para los datos del problema de Carbón ( ver la p p tabla de datos ordenados de menor a mayor) 73
77
79
79
81
82
82
83
84
84
n
∑ ( xi − x)
s 2 = i =1 83
85
85
85
86
86
86
87
87
87
87
87
88
88
88
89
90
91
92
92
2
n −1
n ⋅ ∑ x − ⎛⎜ ∑ xi ⎟⎞ ⎝ i =1 ⎠ s 2 = i =1 n(n − 1) n
¿Cómo se hace en excel?
PROF. MIGUEL HESIQUIO GARDUÑO
2 i
n
2
Además de obtener unas gráficas, el agrupar los datos en clases sirve para agrupar los datos en clases sirve para otra cosa más? Lri- Lrs
Marca de clase x
fabs
frel
73-76
72.5-76.5
74.5
1
77-80
76.5-80.5
78.5
3
16 14 12 10
81-84
80.5-84.5
82.5
7
8 6 4
85 88 85-88
84 5 88 5 84.5-88.5
86 5 86.5
14
f
Li- Ls
2 0 74.5
78.5
82.5 % de C
89-92
88.5-92.5
90.5
5
PROF. MIGUEL HESIQUIO GARDUÑO
86.5
90.5
Relaciones empíricas x = xˆ + 3( x − ~ x) xˆ = x − 3( x − ~ x)
PROF. MIGUEL HESIQUIO GARDUÑO
Dato mayor, dato menor (podriamos Dato mayor dato menor (podriamos ordenarlos) 87
86
85
87
86
87
87
81
77
85
88
89
86
84
88
90
83
82
84
79
92
88
92
91
87
83
79
82
73
85
PROF. MIGUEL HESIQUIO GARDUÑO
Ordenados de menor a mayor 73
77
7 79 9
81
82
82
83
84
84
83
85
8 85 5
86
86
86
87
87
87
87
87
8 88 8
88
89
90
91
92
92
PROF. MIGUEL HESIQUIO GARDUÑO
Nuestros resultados Nuestros resultados Datos de % contenido de D d % id d carbon en mineral. n=30 30
x= ≈
x= Mo = PROF. MIGUEL HESIQUIO GARDUÑO
Cálculos H ll Hallar media, Mediana, Moda, rms di M di M d Hallar desviación estándar
PROF. MIGUEL HESIQUIO GARDUÑO
Construyendo la tabla Li- Ls
Lri- Lrs
Marca de Fabs clase x
73 76 73-76
72 5 76 5 74.5 72.5-76.5 74 5
77-80 77 80
76 5-80 76.5 80.5 5 78.5 78 5
81-84
80.5-84.5 82.5
85-88
84.5-88.5 86.5
89-92
88.5-92.5 90.5
PROF. MIGUEL HESIQUIO GARDUÑO
Frecuencia absoluta y relativa Li Ls Li-
Lri Lrs Lri-
Marca fabs de clase x 74.5
73-76
72.5-76.5
77-80
76.5-80.5
81-84
80.5-84.5
85-88
84.5-88.5
78.5 82.5 86.5
89-92
88.5-92.5
90.5
PROF. MIGUEL HESIQUIO GARDUÑO
frel
Generando gráficos
PROF. MIGUEL HESIQUIO GARDUÑO
16 14
Histograma
12 10 f
8 6 4 2 0 74.5
78.5
82.5
86.5
90.5
%d de C
Polígono de Frecuencias
16 14
f
12 10 8 6 4 2 0 74.5
78.5
82.5 % de C
PROF. MIGUEL HESIQUIO GARDUÑO
86.5
90.5
Una ojiva de frecuencia j relativa Ojiva
frell acumulada
1.2 1 0.8 0.6
frecuencia relativa acumulada
0.4 0.2 0 70
75
80
85
90
95
%C
PROF. MIGUEL HESIQUIO GARDUÑO
Hay una hipótesis: H hi ót i l los d t datos están tá uniformemente if t distribuidos. En general esto no es válido todo el tiempo. El histograma ayuda a interpretar, pero es necesario d desarrollar ll cálculos. ál l
PROF. MIGUEL HESIQUIO GARDUÑO
Tratando el problema de las muestras de carbón. Datos Agrupados Li Ls LiL
L i Lrs LriL
Marca de M d clase x
f b fabs
73-76 73 76
72 5-76 72.5 76.5 5
74 5 74.5
1
77-80
76.5-80.5
78.5
3
81-84
80.5-84.5
82.5
7
85 88 85-88
84 5 88 5 84.5-88.5
86 5 86.5
14
89-92
88.5-92.5
90.5
5
xi2fi
PROF. MIGUEL HESIQUIO GARDUÑO
xifi
¿Podíamos tomar Hacerlo en equipo
otros
valores
Iniciando en 70, con ancho de clase de 5, Elaborar Histograma, frecuencias,ojiva.
poligono
de
Calcular medidas de tendencia central ( como datos agrupados) Realizar el cálculo de varianza y desviacion estándar
de
Li-Ls 70 74 70-74 7580859090
PROF. MIGUEL HESIQUIO GARDUÑO
limites
de
f
clase?