Story Transcript
Estadística Descriptiva SESIÓN 11 Medidas de dispersión
Contextualización de la sesión 11 En la sesión anterior se explicaron los temas relacionados con la
dispersión, una de las medidas de dispersión, además de los diversos temas relacionados con ella. Esta es una cuantificación del grado de alejamiento de los datos respecto a su media aritmética. Ahora es necesario conocer otra de las medidas de dispersión conocida como desviación típica o estándar y los temas relacionados con esta medida. Al terminar esta sesión habrás comprendido el concepto de
desviación estándar relacionado con los estudios estadísticos.
Introducción de la sesión 11 Las
medidas de dispersión se asocian a la precisión estadística de las observaciones o datos muestrales. Cuando la dispersión de un conjunto de datos es muy alta, las estimaciones que se realizan en función de éstas conllevan un notable grado de imprecisión. Y en sentido inverso, cuando un conjunto de datos presenta una dispersión baja, el nivel de incertidumbre disminuye notablemente.
Explicación: Desviación típica o estándar La desviación típica o estándar, denotada por la literal s, es una
medida de dispersión que se emplea para variables de razón (también conocidas como ratio o cociente) y para variables de intervalo. La desviación estándar se considera una medida cuadrática que representa el promedio de las desviaciones (distancias) de los datos muestrales respecto de su media aritmética, expresada en las mismas unidades que la variable.
Explicación: Desviación típica o estándar
La fórmula para calcular la desviación estándar para
datos no agrupados está dada por la siguiente expresión:
Explicación: Desviación típica o estándar
Dónde: n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1, 2, 3...n.
xi =
Valor del i-ésimo dato de la muestra.
=
Media aritmética de la muestra.
Explicación: Desviación típica o estándar
Es importante señalar que la siguiente fórmula se
considera más apropiada para una mejor estimación de la desviación estándar de la población a partir de la muestra:
Explicación: Desviación típica o estándar Cualquiera de las fórmulas puede usarse indistintamente, pero en la práctica es común el uso de la segunda. En ésta, al cociente n – 1 se le denomina corrección de Bessel.
Calculemos la desviación estándar para el siguiente conjunto de datos no agrupados: A = {2, 4, 6, 8, 10} De este conjunto se desprende que: n=5
x1 = 2
x2 = 4
x3 = 6
x4 = 8
x5 = 10
Explicación: Desviación típica o estándar Con estos datos, procedemos a calcular la media aritmética
del conjunto:
Y a continuación se sustituyen los valores anteriores en la
fórmula:
Explicación: Desviación típica o estándar
Tal como se muestra a continuación:
Explicación: Desviación típica o estándar Por su parte, la fórmula para calcular la desviación estándar de
datos agrupados está dada por la siguiente expresión:
Dónde: k=
Número de intervalos de clase en la distribución de frecuencias.
n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1,2,3...k.
fi =
Frecuencia del i-ésimo intervalo de clase.
xi = Marca de clase del i-ésimo intervalo de la muestra. Media aritmética de la muestra.
Explicación: Desviación típica o estándar Para calcular la desviación estándar en un conjunto de datos
agrupados, también empleamos la versión que incorpora la corrección de Bessel. Como puede observarse, cada elemento de la fórmula se toma directamente de la tabla de datos agrupados. Considerando el caso práctico de una bebida, se toma de la tabla de datos agrupados las columnas referentes a las frecuencias de clase (fi) y a las marcas de clase (xi).
Explicación: Desviación típica o estándar
De esta tabla se obtienen los siguientes valores para las
frecuencias de clase: f1 = 5
f2 = 10
f3 = 30
f4 = 40
f5 = 15
x3 = 17.5
x4 = 22.5
x5 = 27.5
Y para las marcas de clase: x1 = 7.5
x2 = 12.5
Asimismo, dado que hay cinco intervalos de clase y la muestra
tiene 100 elementos, los valores de k y n respectivamente son: k=5
n = 100
Y como ya se determinó en ejercicios anteriores:
= 20
Explicación: Desviación típica o estándar
Ahora, sustituyendo estos valores en la respectiva
fórmula se tiene que:
Explicación: Desviación típica o estándar
La desviación estándar es una medida de dispersión que
nos permite evaluar la incertidumbre de los datos obtenidos por la muestra; es decir, analiza todos aquellos datos que se alejan de nuestro promedio para determinar si nuestra predicción o teoría está alejada del modelo que se construyó con la muestra.
Conclusión
En esta sesión se han explicado la desviación estándar como
una medida de dispersión, que sirve para evaluar la incertidumbre de los datos de una muestra, además, se explicó el procedimiento para el correcto cálculo de esta desviación en un conjunto de datos no agrupados y agrupados.
Conclusión
En la siguiente sesión conocerás los temas correspondientes a
la varianza como la última de las medidas de dispersión, así como el procedimiento para su cálculo en conjuntos de datos agrupados y no agrupados.