Grafico de Cajas y Bigotes

STATGRAPHICS – Rev. 9/14/2006 Grafico de Cajas y Bigotes Resumen El procedimiento del Gráfico de Cajas y Bigotes crea un gráfico diseñado para ilustr

19 downloads 168 Views 82KB Size

Recommend Stories


Con bigotes: un pensamiento metamoderno
SUGERENCIAS Y FRUSTRACIONES Con bigotes: un pensamiento metamoderno E. P. MESA GARCIA y F. PARAMO

Los bigotes de la Mona Lisa 1
Primer Congreso Nacional de Gestión Cultural “Escenarios, tensiones y desafíos de la Gestión Cultural en Chile” Los bigotes de la Mona Lisa 1 Álvaro

Emiliano Zapata, un soñador con bigotes
CA de EyM Emiliano Zapata, un soñador con bigotes 6° Cuando Emiliano Zapata tenía 11 años y era nada más un niño, no un héroe que sale en los libro

Story Transcript

STATGRAPHICS – Rev. 9/14/2006

Grafico de Cajas y Bigotes Resumen El procedimiento del Gráfico de Cajas y Bigotes crea un gráfico diseñado para ilustrar propiedades importantes de una columna de datos numérica. El primero en describirlo fue John Tukey (1977) en su libro Exploratory Data Análisis (EDA). El gráfico de cajas y bigotes resume una muestral de datos a través de 5 estadísticas: 1. 2. 3. 4. 5.

mínimo cuartíl inferior mediana cuartíl superior máximo

También podemos detectar la presencia de datos atípicos.

Ejemplo StatFolio: boxplots.sgp Datos del Ejemplo: El archivo 93cars.sf3 contiene información sobre 26 variables para n = 93 marcas y modelos de automóviles, tomados de Lock (1993). La tabla de abajo muestra una lista parcial de 3 columnas del archivo: Make (Marca) Acura Acura Audi Audi BMW Buick Buick Buick Buick Cadillac Cadillac Chevrolet

Model (Modelo) Integra Legend 90 100 535i Century LeSabre Roadmaster Riviera DeVille Seville Cavalier

© 2005 por StatPoint, Inc.

MPG Highway (MPG en carretera) 31 25 26 26 30 31 28 25 27 25 25 36

Gráfico de Cajas y Bigotes - 1

STATGRAPHICS – Rev. 9/14/2006

Entrada de Datos Los datos que se analizan consisten en una sola columna numérica que contiene n = 2 o más observaciones.

• •

Datos: Columna numérica que contiene los datos a ser resumidos. Selección: Selección de un subconjunto de los datos.

Resumen del Análisis El Resumen del Análisis muestral el numero de observaciones en la columna de datos. Gráfico de Caja y Bigotes - MPG Highway Datos/Variable: MPG Highway (miles per gallon in highway driving) 93 valores con rango desde 20.0 a 50.0

También despliega los valores mínimo y máximo.

© 2005 por StatPoint, Inc.

Gráfico de Cajas y Bigotes - 2

STATGRAPHICS – Rev. 9/14/2006

Gráfico de Cajas y Bigotes Este panel presenta el gráfico de cajas y bigotes. Gráfico de Caja y Bigotes

20

25

30

35 MPG Highway

40

45

50

El gráfico está construido de la siguiente manera: •

Se dibuja una caja extendiéndose del cuartíl inferior de la muestral al cuartíl superior. Esto es un intervalo cubierto por la mitad de los datos (50%), los valores fueron ordenados de menor a mayor.



Una línea vertical se dibuja en la mediana. (mitad de los datos)



Si este definido, un signo (+) se pone en la localización de la media muestral.



Los bigotes se dibujan de los extremos de la caja a los valores más grandes y pequeños de los datos, a menos que existan valores inusuales muy lejanos a la caja (Tukey los llamaba puntos atípicos). Los puntos atípicos, son aquellos puntos más allá de 1.5 veces el rango intercuartil (ancho de caja) por arriba o debajo de la caja, se indican por un punto símbolo. Cualquier punto más allá de 3 veces el rango intercuartil por arriba o debajo de la caja son llamados puntos extremos, y se indican por un punto símbolo con un signo mas (+) sobrepuesto encima de el.. Si puntos extremos están presentes, los bigotes se dibujan de los valores más grandes y pequeños de los datos sin tomar en cuenta los puntos extremos.

El gráfico anterior para los datos de kilómetros por litros en carretera es notable por diversas razones. Primero, nos indica una asimetría en la muestra de los datos. Esto se observa por el hecho que la media muestral miente a la derecha sobre la línea de la mediana. Además, los datos se extienden hacia arriba de la mediana más que por debajo de ella. Segundo, existen 4 puntos atípicos. Cuando muestreamos 100 observaciones de una distribución normal, podemos esperar que ocurran puntos atípicos cerca de la mitad de las veces, pero © 2005 por StatPoint, Inc.

Gráfico de Cajas y Bigotes - 3

STATGRAPHICS – Rev. 9/14/2006 generalmente solamente son uno o dos. Para los puntos extremos, si existe 1, ocurre muy raramente. Para identificar el punto extremo del lado derecho, presionar clic del ratón sobre el. Una caja pequeña aparecerá indicando que el dato es de la fila 39 en la base de datos y el valor sobre el eje X es 50 kilómetros/litros. Si ahora selecciona la base de datos, la fila 39 habrá sido resaltada. El automóvil en la fila 39 es un GeoMetro, sucede que también es el carro con el peso más pequeño de la base de datos. Opciones del Panel



Dirección: La orientación del gráfico, correspondiente a la dirección de los bigotes.



Mediana con Muesca: Si se selecciona, una muesca será agregada al grafico mostrando una aproximación con un intervalo de confianza 100(1-α)% para la mediana en los defectos del nivel de confianza del sistema (configuración sobre la sección General de la caja de dialogo de Preferencias dentro del menú Edición).



Puntos Atípicos: Si se selecciona, indica la localización de los puntos atípicos.



Marcar Media: Si se selecciona, muestra la localización de la media muestra así como también la mediana.

© 2005 por StatPoint, Inc.

Gráfico de Cajas y Bigotes - 4

STATGRAPHICS – Rev. 9/14/2006 Ejemplo – Gráfico de Cajas y Bigotes con Muesca El siguiente gráfico presenta adicionalmente la mediana con muesca al nivel de confianza del 95%. Gráfico de Caja y Bigotes Intervalos de confianza del 95% intervalo de confianza para la mediana: [27.0591

20

25

30

35 MPG Highway

40

45

50

La muesca cubre el intervalo mediana muestral ± zα / 2

1.25( IQR) 1.35 n

(1)

donde IQR es rango intercuartil muestral, n es tamaño de muestra, y zα/2 es valor critico superior (α/2)% de una distribución normal estándar. La muesca, tiene un rango de aproximadamente 27 a 29, proporciona una indicación del error de muestreo potencial en la mediana, asumiendo que los datos son muestras aleatorias de una población normal (una asunción dudosa en este caso).

© 2005 por StatPoint, Inc.

Gráfico de Cajas y Bigotes - 5

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.