Probabilidad y estadística

Probabilidad y  estadística MEDIDAS DE TENDENCIA CENTRAL,  MEDIDAS DE DISPERSIÓN , GRÁFICAS,  E  INTERPRETANDO RESULTADOS INTERPRETANDO RESULTADOS Pro

4 downloads 115 Views 638KB Size

Recommend Stories


Probabilidad
Ejercicios probabilidad

PROBABILIDAD
Capítulo 3 PROBABILIDAD 3.1.1 – 3.1.3 Si bien la definición de probabilidad es simple, calcular las probabilidades de un evento determinado puede s

Story Transcript

Probabilidad y  estadística MEDIDAS DE TENDENCIA CENTRAL,  MEDIDAS DE DISPERSIÓN , GRÁFICAS,  E  INTERPRETANDO RESULTADOS INTERPRETANDO RESULTADOS Prof. Miguel Hesiquio Garduño. Est Mirla Benavides Rojas Est. Depto. De Ingeniería Química Petrolera ESIQIE-IPN [email protected] [email protected]

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Datos no agrupados 

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Medidas de tendencia central ™Los parámetros ™L á d tendencia de d i centrall son valores l numéricos que tienden a localizar en la parte central de un conjunto de datos. ™Es un valor que se puede tomar como representativo de todos los datos Entre los parámetros de tendencia central se encuentran:

PROF. MIGUEL HESIQUIO GARDUÑO

Medidas de tendencia Central MEDIA ARITMÉTICA MEDIA ARITMÉTICA

MEDIA ARMÓNICA MEDIA ARMÓNICA

Conocida como promedio, se define como la suma de los valores de todas las x i divididas por el observaciones numero total de datos n

Es la inversa aritmética.

x =

i =1

la

media

Se utiliza para promediar variables con unidades complejas o compuestas, como aceleraciones, energía trabajo etc. energía, etc

n



de

H =

xi

n

n n



i =1

PROF. MIGUEL HESIQUIO GARDUÑO

1 xi

Medidas de tendencia Central MEDIA GEOMÉTRICA MEDIA GEOMÉTRICA

RAÍZ CUADRADA MEDIA RAÍZ CUADRADA MEDIA

Proporciona una medida promedio precisa de una variable que mide l cambios los bi porcentuales l en una serie de valores positivos

La media cuadrática o RMS se define como la raíz cuadrada de la di aritmética i é i de d los l elementos l media al cuadrado. Es utilizada para el cálculo de la media de un conjunto de números ú e os co con las as aalternancias e a c as de cantidades con valores positivos y negativos.

n

G = x1 x2 x3...xn n

rms =



i =1

x i2

n

Medidas de Dispersión Varianza  La varianza es el promedio de las desviaciones cuadráticas de _ cada dato x i respecto a su media aritmética x

Poblacional

Muestral

n

σ = 2

∑ (x − μ) i

i=1

n

2

2 ( x x ) − ∑ i

s = i =1 2

n

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

n −1

Medidas de Dispersión Desviación Estándar Es una medida de dispersión usada en la estadística que nos dice cuanto  tienden a alejarse los valores puntuales del promedio en una distribución. promedio de la distancia de cada p punto respecto p del p promedio” “es el p

n

σ=

∑ ( xi − μ )

i =1

n

2

s=

n PROF. MIGUEL HESIQUIO GARDUÑO

∑ ( xi − x)

i =1

n −1

2

Y estas ecuaciones son fáciles de implementar en una  p calculadora ordinaria? Hay una ecuación equivalente, porque la ecuación que define a la varianza es complicada de implementar en una calculadora:

⎛ ⎞ n ⋅ ∑ x − ⎜ ∑ xi ⎟ 2 ⎝ ⎠ i =1 i =1 s = n(n − 1) n

2 i

n

2

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Ejercicio ƒEn el laboratorio de una planta de carbón, se realizan diferentes análisis del mismo,  uno de ellos es el análisis de ceniza. Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos,  Para este análisis se tomaron muestras del tajo la conquista de los diferentes mantos, se obtuvo lo siguiente:  Gramos 10.7225 11.5442 21.8136 24.5388 27.4321 30 2883 30.2883 27.7839 22.5670 30.5572 36.2593 34.8619 38.3817 26 2470 26.2470 39.6775 PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

De éstos datos: a)) Calcular C l l la l mediana di y la l moda, d H, H G, G rms b) Encontrar la varianza y la desviación estándar

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

En EXCEL =moda(a1: a30) =mediana( a1:a30) =promedio( a1:a30)

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Datos agrupados  ™Para los datos cuantitativos continuos, los datos se suelen agrupar en  clases, que son intervalos que no se juntan y cuya unión cubre todo el  rango de los datos rango de los datos  ™Suelen elegirse de la misma longitud, de modo que basta con  seleccionar el numero de clase a tomar. l i l d l

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Criterios para generar una  p g tabla de datos agrupados Cómo los organizo?

PROF. MIGUEL HESIQUIO GARDUÑO

Ordenando Datos en Clases  MiguelHG Cuantas clases C t l 2K=n Tamaño de intervalo de clase: c=(Lrs‐Lri) c≅Rango/k X=marca de clase=(Lrs‐Lri)/2 ¿O podemos establecer tamaños un poco  mayores?Responder despues de hacer el ejercicio

PROF. MIGUEL HESIQUIO GARDUÑO

Medidas de tendencia central I di Indican valores con respecto a los datos agrupados  l l d d ¾Media  ¾Mediana  ¾Moda

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Ecuaciones para datos agrupados Ecuaciones para datos agrupados Media Conocida como promedio, se define como la suma de los valores de todas las observaciones x i divididas por el número total de datos n k

x=

∑x

i

i =1

fi

n

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Mediana

Es el valor que se encuentra en el centro de los datos, es decir, nos permite it conocer ell valor l que se encuentra t exactamente t t en la l mitad it d del d l conjunto j t de d datos. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo.

L1 = Límite real inferior de la clase mediana

n − (∑ f i ) m ~ c x = L1 + 2 f med

n= Número de datos

(∑ fi ) m =

Suma de las frecuencias de todas las clases por debajo de la clase mediana

f med = c=

Frecuencia de la clase mediana

Ancho del intervalo de la clase mediana

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Moda Es el valor de variable que mas veces se repite. Es decir cuya frecuencia es mayor.

L1= Límite real Inferior de la  clase modal

⎛ Δ1 ⎞ ⎟⎟c x = L1 + ⎜⎜ ⎝ Δ1 + Δ 2 ⎠ ∧

Δ1= Exceso de la frecuencia  modal sobre la frecuencia de la  clase contigua inferior clase contigua inferior Δ2= Exceso de la frecuencia  modal sobre la frecuencia de la  clase contigua superior c= ancho del intervalo de la  clase modal clase modal

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Medidas de dispersión  IIndican la mayor o menor concentración de los datos con  di l ió d l d respecto a las medidas de centralización ¾Varianza   ¾Varianza ¾Desviación estándar   ¾Coeficiente de variación ¾Coeficiente de variación 

PROF. MIGUEL HESIQUIO GARDUÑO / MIRLA BENAVIDES ROJAS

Ecuaciones para datos  p agrupados V i Varianza

n ⋅ ∑ xi2 f i − ⎛⎜ ∑ xi f i ⎞⎟ ⎝ i =1 ⎠ s 2 = i =1 n(n − 1) k

k

n ⋅ ∑ x f i − ⎛⎜ ∑ x i f i ⎞⎟ ⎝ i =1 ⎠ i =1 n (n − 1) k

Desviación estándar Desviación estándar

s=

2

PROF. MIGUEL HESIQUIO GARDUÑO

2 i

k

2

Medidas de dispersión Medidas de dispersión  Coeficiente de variación  Determina el grado de dispersión  de un conjunto de datos relativo a de un conjunto de datos relativo a  su medida. Se calcula dividiendo la desviación estándar de una distribución por su media y multiplicando por 100

s CV = *100 x

PROF. MIGUEL HESIQUIO GARDUÑO

Crear unas diapositivas intermedias que vinculen al  p q tratamiento de datos dispersos con el de agrupados

PROF. MIGUEL HESIQUIO GARDUÑO

Manejo de Datos ,  Manejo de Datos , n>20 PROF. MIGUEL HESIQUIO GARDUÑO

Contenido de Carbono en un mineral  Contenido de Carbono en un mineral sub‐bituminoso 87

86

85

87

86

87

87

81

77

85

88

89

86

84

88

90

83

82

84

79

92

88

92

91

87

83

79

82

73

85

PROF. MIGUEL HESIQUIO GARDUÑO

Calcular para los datos del problema de Carbón ( ver la  p p tabla de datos ordenados de menor a mayor) 73

77

79

79

81

82

82

83

84

84

n

∑ ( xi − x)

s 2 = i =1 83

85

85

85

86

86

86

87

87

87

87

87

88

88

88

89

90

91

92

92

2

n −1

n ⋅ ∑ x − ⎛⎜ ∑ xi ⎟⎞ ⎝ i =1 ⎠ s 2 = i =1 n(n − 1) n

¿Cómo se hace en excel?

PROF. MIGUEL HESIQUIO GARDUÑO

2 i

n

2

Además de obtener unas gráficas, el  agrupar los datos en clases sirve para agrupar los datos en clases sirve para  otra cosa más? Lri- Lrs

Marca de clase x

fabs

frel

73-76

72.5-76.5

74.5

1

77-80

76.5-80.5

78.5

3

16 14 12 10

81-84

80.5-84.5

82.5

7

8 6 4

85 88 85-88

84 5 88 5 84.5-88.5

86 5 86.5

14

f

Li- Ls

2 0 74.5

78.5

82.5 % de C

89-92

88.5-92.5

90.5

5

PROF. MIGUEL HESIQUIO GARDUÑO

86.5

90.5

Relaciones empíricas x = xˆ + 3( x − ~ x) xˆ = x − 3( x − ~ x)

PROF. MIGUEL HESIQUIO GARDUÑO

Dato mayor, dato menor (podriamos  Dato mayor dato menor (podriamos ordenarlos) 87

86

85

87

86

87

87

81

77

85

88

89

86

84

88

90

83

82

84

79

92

88

92

91

87

83

79

82

73

85

PROF. MIGUEL HESIQUIO GARDUÑO

Ordenados de menor a mayor 73

77

7 79 9

81

82

82

83

84

84

83

85

8 85 5

86

86

86

87

87

87

87

87

8 88 8

88

89

90

91

92

92

PROF. MIGUEL HESIQUIO GARDUÑO

Nuestros resultados Nuestros resultados Datos de  % contenido de   D d % id d carbon en mineral. n=30 30

x= ≈

x= Mo = PROF. MIGUEL HESIQUIO GARDUÑO

Cálculos H ll Hallar media, Mediana, Moda, rms di M di M d Hallar desviación estándar

PROF. MIGUEL HESIQUIO GARDUÑO

Construyendo la tabla Li- Ls

Lri- Lrs

Marca de Fabs clase x

73 76 73-76

72 5 76 5 74.5 72.5-76.5 74 5

77-80 77 80

76 5-80 76.5 80.5 5 78.5 78 5

81-84

80.5-84.5 82.5

85-88

84.5-88.5 86.5

89-92

88.5-92.5 90.5

PROF. MIGUEL HESIQUIO GARDUÑO

Frecuencia absoluta y relativa Li Ls Li-

Lri Lrs Lri-

Marca fabs de clase x 74.5

73-76

72.5-76.5

77-80

76.5-80.5

81-84

80.5-84.5

85-88

84.5-88.5

78.5 82.5 86.5

89-92

88.5-92.5

90.5

PROF. MIGUEL HESIQUIO GARDUÑO

frel

Generando gráficos

PROF. MIGUEL HESIQUIO GARDUÑO

16 14

Histograma

12 10 f

8 6 4 2 0 74.5

78.5

82.5

86.5

90.5

%d de C

Polígono de Frecuencias

16 14

f

12 10 8 6 4 2 0 74.5

78.5

82.5 % de C

PROF. MIGUEL HESIQUIO GARDUÑO

86.5

90.5

Una ojiva de frecuencia  j relativa Ojiva

frell acumulada

1.2 1 0.8 0.6

frecuencia relativa acumulada

0.4 0.2 0 70

75

80

85

90

95

%C

PROF. MIGUEL HESIQUIO GARDUÑO

Hay una hipótesis: H hi ót i l los d t datos están tá uniformemente if t distribuidos. En general esto no es válido todo el tiempo. El histograma ayuda a interpretar, pero es necesario d desarrollar ll cálculos. ál l

PROF. MIGUEL HESIQUIO GARDUÑO

Tratando el problema de las muestras de carbón.  Datos Agrupados Li Ls LiL

L i Lrs LriL

Marca de M d clase x

f b fabs

73-76 73 76

72 5-76 72.5 76.5 5

74 5 74.5

1

77-80

76.5-80.5

78.5

3

81-84

80.5-84.5

82.5

7

85 88 85-88

84 5 88 5 84.5-88.5

86 5 86.5

14

89-92

88.5-92.5

90.5

5

xi2fi

PROF. MIGUEL HESIQUIO GARDUÑO

xifi

¿Podíamos tomar Hacerlo en equipo

otros

valores

Iniciando en 70, con ancho de clase de 5, Elaborar Histograma, frecuencias,ojiva.

poligono

de

Calcular medidas de tendencia central ( como datos agrupados) Realizar el cálculo de varianza y desviacion estándar

de

Li-Ls 70 74 70-74 7580859090

PROF. MIGUEL HESIQUIO GARDUÑO

limites

de

f

clase?

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.