Story Transcript
Estadísticas Elemental Cuartiles y los diagramas de caja
3.1 - 1
Rango intercuartil El rango intercuartil, se denota IQR, es el rango del 50% central de los datos. Esto es la diferencia entre Q3 y Q1 .
𝐼𝑄𝑅 = 𝑄3 − 𝑄1 El rango intercuartil es una medida de dispersión alrededor de la mediana. Generalmente, es una mejor medida de dispersión, ya que es resistente a los valores extremos. 3-2
3.1 - 2
EJEMPLO Determinar e interpretar el rango intercuartil para los datos sobre velocidad en la zona de construcción 20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
Determinar Q1 y Q3
Q1 = 28
Q3 = 38
3-3
3.1 - 3
Identificar valores extremos usando IQR 𝑥𝑖 se considera un valor extremo si: • 𝑥𝑖 < 𝑄1 − 1.5(𝐼𝑄𝑅) ó • 𝑥𝑖 > 𝑄3 + 1.5(𝐼𝑄𝑅) donde 𝑄1 − 1.5(𝐼𝑄𝑅) es el límite inferior del conjunto y 𝑄3 + 1.5(𝐼𝑄𝑅) es el límite superior del conjunto
© 2010 Pearson Prentice Hall. All rights reserved
3-4
3.1 - 4
EJEMPLO Determinar valores extremos en el conjunto de velocidades en la zona de construcción 10, 20, 24, 27, 28, 29, 30, 30, 32, 35, 35, 36, 38, 40, 40, 55 Paso 1: Determinar Q1 y Q3
Paso 2: Determinar IQR
Paso 3: Calcular los límites
Paso 4: Los datos extremos son: 3-5
3.1 - 5
Resumen de 5 valores Cinco valores que resumen un conjunto de datos son:
Resumen de 5 valores Mínimo
𝑸𝟏
M
𝑸𝟑
© 2010 Pearson Prentice Hall. All rights reserved
Máximo
3-6
3.1 - 6
EJEMPLO Obtener un resumen de cinco valores
Cada seis meses, la Junta de la Reserva Federal de los Estados Unidos realiza un estudio de los planes de tarjetas de crédito en los EE.UU. Los datos siguientes son las tasas de interés cobradas por los 10 emisores de tarjetas de crédito, seleccionados al azar para la encuesta de julio de 2005. Determine el resumen de cinco valores para los datos que se muestran a continuación. © 2010 Pearson Prentice Hall. All rights reserved
3-7
3.1 - 7
EJEMPLO Obtener un resumen de cinco valores (cont.) Institución Pulaski Bank and Trust Company
Taza 6.5%
Ordenar los datos:
Rainier Pacific Savings Bank
12.0%
Wells Fargo Bank NA
14.4%
6.5%, 9.9%, 12.0%, 13.0%, 13.3%, 13.9%, 14.3%, 14.4%, 14.4%, 14.5%
Firstbank of Colorado
14.4%
Resumen de 5 valores:
Lafayette Ambassador Bank
14.3%
Mínimo:.
Infibank
13.0%
Máximo:
United Bank, Inc.
13.3%
𝑸𝟏 =
First National Bank of The Mid-Cities
13.9%
𝑸𝟐 ó M =
Bank of Louisiana Bar Harbor Bank and Trust Company
9.9%
𝑸𝟑 =
14.5%
Fuente: http://www.federalreserve.gov/pubs/SHOP/survey.htm © 2010 Pearson Prentice Hall. All rights reserved
3-8
3.1 - 8
Diagrama de caja 1.
2. 3. 3. 4. 5.
Determinar los extremos inferior y superior del diagrama. a) 𝑄1 − 1.5(𝐼𝑄𝑅) b) 𝑄3 + 1.5(𝐼𝑄𝑅) donde IQR = 𝑄3 − 𝑄1 Marcar los extremos encontrados en paso 1. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea vertical dentro de la caja en M. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1 hasta el mínimo. Cualquier valor menor que el extremo inferior o mayor que el extremo superior se marca con * Remover los extremos del IQR
3-9
3.1 - 9
Paso 1: IQR
= 14.4% - 12% = 2.4%.
Paso 2: límites inferior y superior: límite inferior = Q1 – 1.5(IQR)
Paso 3 al 5:
*
lïmite superior = Q3 + 1.5(IQR)
= 12 – 1.5(2.4)
= 14.4 + 1.5(2.4)
= 8.4%
= 18.0%
[
]
𝑄1 = 12.0%. M= 13.6%. 𝑄3 = 14.4% Mín: 6.5% Máx: 14.5%.
© 2010 Pearson Prentice Hall. All rights reserved
3-10
3.1 - 10
EJEMPLO Construir un diagrama de caja para el conjunto de velocidades en la zona de construcción
𝑄1 = 27.5 M= 31. 𝑄3 = 37 Mín: 10 Máx: 55 LI: 13.25 LS: 51.25
3-11
3.1 - 11
Ejemplo • A continuación se enumeran medidas de tendencia central, medidas de variación, y el resumen de 5 valores para los pulsos de una muestra aleatoria de 40 hombres y de otra muestra de 40 Desviación Media Estándar Mínimo Q1 Mediana Q3 Máximo Hombres
69.4
11.3
56
60
66
76
96
Mujeres
76.3
12.5
60
68
74
80
124
• Construya diagramas de caja para cada conjunto.
3.1 - 12
Comparar diagramas de caja *
Mujeres
Hombres
Indicar si cada enunciado es cierto o falso. 1. En promedio, el pulso de los hombres es más rápido. 2. En promedio, el pulso de las mujeres es más rápido 3. La data de las mujeres muestra mayor variabilidad. 4. La data de los hombres muestra mayor variabilidad. 5. El pulso mayor lo tiene un hombre.
6. El pulso menor lo tiene una mujer.
3.1 - 13
Resumen
Resumen: ¿Cuál medida debes reportar? Forma de la distribución
Medida de tendencia central
Medida de dispersión
Simétrica
Media
Desviación estándar
Sesgado
Mediana
Rango intercuartil
© 2010 Pearson Prentice Hall. All rights reserved
3-14
3.1 - 14
Describir la forma de la distribución de los datos usando un diagrama de caja
El diagrama de caja anterior sobre la taza de interés indica que la distribución es sesgada hacia la izquierda. * 3-15
3.1 - 15