Curso de Estadística Unidad de Medidas Descriptivas. Lección 3: Medidas de Tendencia Central para Datos Agrupados por Clases

Curso de Estadística Unidad de Medidas Descriptivas Lección 3: Medidas de Tendencia Central para Datos Agrupados por Clases Creado por: Dra. Noemí L

1 downloads 91 Views 360KB Size

Story Transcript

Curso de Estadística Unidad de Medidas Descriptivas

Lección 3: Medidas de Tendencia Central para Datos Agrupados por Clases

Creado por: Dra. Noemí L. Ruiz Limardo, EdD © 2010 Derechos de Autor

Objetivos 1. Definir el concepto de Clase Modal y Clase Mediana. 2. Calcular las medidas de tendencia central para datos agrupados por clases. 3. Interpretar los resultados obtenidos en las medidas de tendencia central a la luz del conjunto de datos. 4. Realizar análisis estadísticos de tendencia central en un conjunto de datos agrupados por clases.

Introducción Medidas de Tendencia Central para Datos Agrupados por Clases Cuando los datos están agrupados por clases se facilita la manipulación y presentación de los datos y el análisis estadístico, principalmente cuando la cantidad de datos es relativamente grande. No obstante, ofrece la desventaja de que se pierde información ya que no se puede determinar cuáles fueron los valores que fueron recopilados originalmente. Sólo se conocen los intervalos dentro de los cuales están incluidos los valores dentro de las clases. Por ejemplo, si en una clase cuyo intervalo es de 30 a 39, la frecuencia absoluta es 4, no se sabe con certeza cómo se distribuyen esos 4 datos a lo largo de los valores comprendidos en el intervalo. Para representar los datos comprendidos en un intervalo se utiliza la Marca de Clase (Punto Medio de la clase). La marca de clase es el valor que representa los datos que están incluidos en cada clase. Se asume que la frecuencia de una clase corresponde a la marca de clase repetida tantas veces como establezca la frecuencia. Por esta razón, la mayoría de las fórmulas de tendencia central que se utilizan cuando los datos están agrupados en clases, multiplican la frecuencia de la clase por la marca de clase. En esta lección se discutirá la manera de calcular las medidas de tendencia central cuando los datos están agrupados por clases.

A. MEDIA O PROMEDIO ARITMÉTICO Ejemplo – 1 Un hospital especializado en condiciones del riñón realiza un estudio con un grupo de pacientes. Desea probar los efectos de un nuevo medicamento que alega ayuda a los pacientes a mejorar su condición renal. El experimento consiste en administrar el nuevo medicamento y medir el tiempo que tarda en funcionar en el riñón. Los resultados del estudio se muestran en la Tabla 1 a continuación.

Tabla 1- Cantidad de segundos que el nuevo medicamento tarda en funcionar en el riñón Segundos

frecuencia

5-7

1

8-10

2

11-13

3

14-16

5

17-19

2

20-22

1

Total

14

Para hallar la media aritmética se utiliza la fórmula a continuación: n

mi f i x

i 1

n

x - Representa la media aritmética. n - Es la cantidad total de datos que haya en el conjunto. mi -Representa la marca de la clase i . ( m1 es la marca de la clase 1, la marca de la última clase).

m2 es la marca de la clase 2, hasta mn que es

(Recuerde que la marca de clase es el punto medio de la clase. Se determina sumando los dos límites de la clase y dividiendo por 2).

f i -Es la frecuencia con que se repite la marca de clase mi . mi fi -Significa la multiplicación de la marca de clase mi por su correspondiente frecuencia f i .

-Este es el símbolo de sumatoria y significa que se suma la serie de valores que están definidos por el símbolo. En este caso, como i comienza en 1 ( i 1 ) y termina en n , se suman los productos correspondientes, desde el valor

m1 f1 hasta el valor mn f n .

Para poder aplicar la fórmula de media aritmética se necesita añadir dos columnas: la columna de las marcas de clases y la columna de la multiplicación de las marcas de clase por su frecuencia correspondiente. Tabla 2- Cantidad de segundos que el nuevo medicamento tarda en funcionar en el riñón Segundos

f

mi

5-7

1

6

6

8-10

2

9

18

11-13

3

12

36

14-16

5

15

75

17-19

2

18

36

20-22

1

21

21

Total

14

mi fi

192

Ahora se puede sustituir en la fórmula: n

mi f i x

i 1

n

n

mi fi x

i 1

n

192 13.714285 14

La media aritmética de este grupo es de aproximadamente 13.71 segundos. Esto significa que el tiempo promedio que el nuevo medicamento tardó en funcionar en el riñón es aproximadamente 13.71 segundos. Ejemplo – 2 Un grupo de legisladores desea aprobar una nueva ley que implantaría penas severas a los conductores que se encuentren manejando vehículos de motor con niveles equivalentes a 4 onzas o más de alcohol. Para poder tomar una mejor decisión, designan un grupo de estadísticos para realizar un estudio. El estudio consistió en administrar 4 oz de alcohol a un grupo de 52 voluntarios. Después de consumir el alcohol, se les presentó un estímulo visual y se registró el tiempo en segundos que tardaron en reaccionar ante el estímulo. Los resultados se presentan en la tabla a continuación. Determina el tiempo promedio que tardó este grupo de personas.

Tabla 3- Segundos de reacción ante estímulo después de consumir 4 oz alcohol Segundos

f

7-8

2

9-10

5

11-12

9

13-14

20

15-16

16

Total

52

Para determinar el tiempo promedio se necesita añadir dos columnas a la tabla anterior, como se ilustra a continuación:

Tabla 4- Segundos de reacción ante estímulo después de consumir 4 oz alcohol Segundos

f

mi

7-8

2

7.5

15

9-10

5

9.5

47.5

11-12

9

11.5

103.5

13-14

20

13.5

270

15-16

16

15.5

248

Total

52

mi fi

684

Ahora se tienen todos los valores que se necesitan para sustituir en la fórmula: n

mi f i i 1

x

n

n

mi fi x

i 1

n

684 13.153846 52

La media aritmética de este grupo es de aproximadamente 13.15 segundos. Esto significa que el tiempo promedio que los participantes en el estudio tardaron en reaccionar al estímulo después de consumir 4 oz de alcohol es aproximadamente 13.15 segundos. Ejemplo – 3 Un grupo de estudiantes de enfermería estaba interesado en conocer cuál es la edad promedio de una persona diabética. Realizó un estudio donde registraron la edad de distintos familiares que padecían de diabetes. Los resultados se presentan en la tabla a continuación. Determina la edad promedio de esta muestra.

Tabla 5: Edades de Personas Diabéticas Edades 20-29 30-39 40-49 50-59 60-69 70-79 Total

f 1 3 2 3 2 2 13

Para poder sustituir en la fórmula de media aritmética, se necesita añadir dos columnas, según se ilustra a continuación:

Tabla 6: Edades de Personas Diabéticas Edades

f

mi

mi fi

20-29 30-39 40-49 50-59 60-69 70-79 Total

1 3 2 3 2 2 13

24.5 34.5 44.5 54.5 64.5 74.5

24.5 103.5 89.0 163.5 129.0 149.0 658.5

Ahora se puede sustituir en la fórmula: n

mi f i x

i 1

n

n

mi f i x

i 1

n

658.5 13

50.653846

La media aritmética de este grupo es de aproximadamente 50.65. Esto significa que la edad promedio de esta muestra de personas diabéticas es aproximadamente 50.65 años.

B. MODA Según se explicó anteriormente, cuando los datos están agrupados por clases no se tiene acceso directo a los datos crudos. Por lo tanto, no tiene sentido hablar de la moda. En este caso nos referimos a la Clase Modal. La clase modal es la clase que más datos contiene, esto es, la clase que tiene la frecuencia mayor. Es posible que la muestra no tenga clase modal o que tenga más de una. Cuando los datos están agrupados por clases, a veces se utiliza la marca de la clase modal para representar la moda. Ejemplo – 4 Una muestra de 20 corredores participó en una competencia y se registró el total de minutos que corrió cada uno. La Tabla 7 muestra los resultados. Determine la clase modal de esta muestra. Tabla 7- Tiempo que corrieron en competencia Minutos

f

6-10

1

11-15

2

16-20

4

21-25

3

26-30

4

31-35

2

36-40

2

Total

20

Observe que la frecuencia mayor es 4 y esta corresponde a la tercera y la quinta clase. Por lo tanto, esta muestra tiene dos clases modales (bimodal) la tercera y la quinta clase. Estas clases corresponden a los intervalos de 16-20 y 26-30. Las

marcas de clases de estas clases modales son: 18 y 28. Podemos decir también, que la moda de este grupo lo fue 18 y 28 minutos. Ejemplo – 5 Considere los datos del Ejemplo – 1 y determine la clase modal de esta muestra. Tabla 1- Cantidad de segundos que el nuevo medicamento tarda en funcionar en el riñón Segundos

frecuencia

5-7

1

8-10

2

11-13

3

14-16

5

17-19

2

20-22

1

Total

14

La frecuencia mayor es 5, por tanto la clase modal es la cuarta clase, de 14 a 16 segundos.

C. MEDIANA Para calcular la mediana cuando los datos están agrupados por clases es necesario repasar varios conceptos estudiados anteriormente, tales como, frontera, frecuencia absoluta y frecuencia acumulada. En la lección sobre distribuciones de frecuencias se presentó el concepto frontera. La frontera es el valor común a dos clases contiguas en una distribución de frecuencias donde la variable es cuantitativa continua. Las fronteras son los límites reales entre las clases de la distribución de frecuencias. Las fronteras se obtienen restando 0.5 al límite inferior de cada clase y sumando 0.5 al límite superior de cada clase.

En la lección sobre distribuciones de frecuencias se estudió también el concepto frecuencia. La frecuencia de un dato se refiere a la cantidad de veces que se repite dicho dato en el conjunto de valores. En una distribución de frecuencias se indica la frecuencia con que ocurren los datos dentro de una clase. Esta frecuencia se conoce también como frecuencia absoluta. Para distinguir la frecuencia de la frecuencia acumulada, a veces conviene llamar a la frecuencia, frecuencia absoluta. La frecuencia acumulada es el total de frecuencias que se va acumulando a través de las clases en una distribución de frecuencias. En general, para determinar la frecuencia acumulada de una clase, se suma la frecuencia absoluta de esa clase a la frecuencia acumulada en la clase anterior. La frecuencia acumulada es la suma acumulativa de las frecuencias absolutas de cada uno de los datos. La última frecuencia acumulada es igual al total de datos n. La Tabla 8 a continuación muestra un ejemplo de cada uno de estos conceptos anteriores. Tabla 8: Ejemplo de Distribución de Frecuencias Fronteras

Clases

24.5 - 35.5 35.5 - 46.5 46.5 - 57.5 57.5 - 68.5 68.5 - 79.5 Totales

25 - 35 36 - 46 47 - 57 58 - 68 69 - 79

Frecuencias (absolutas) 3 3 4 2 2 14

Frecuencias Acumuladas 3 6 10 12 14

En la lección 1 y 2 se estudió el concepto mediana y cómo se calcula cuando se tienen los datos crudos y cuando los datos están agrupados por valor simple. La mediana es el valor que divide un grupo en dos partes iguales. Es el valor que está localizado justo en el centro de una distribución de datos. Para determinar la mediana se ordenan los datos en forma ascendente, o sea, de menor a mayor. Luego se determina la clase dónde se acumula el 50% de los datos. Esta será la clase dónde está localizada la mediana. A esta clase se le conoce como la Clase Mediana. Para calcular la mediana cuando los datos están agrupados por clases se aplica la siguiente fórmula:

Mediana Finf

n 2

fa w

f

Finf es la frontera inferior de la clase mediana. fa es la frecuencia acumulada de la clase anterior a la clase mediana. f es la frecuencia absoluta de la clase mediana. n es el total de datos en la muestra. w es el ancho de clase o intervalo.

A continuación se ilustra un ejemplo de cómo se aplica esta fórmula para calcular la mediana.

Ejemplo – 6 Considere los datos del Ejemplo – 2. Determine la mediana de esta muestra. Tabla 3- Segundos de reacción ante estímulo después de consumir 4 oz alcohol Segundos

f

7-8

2

9-10

5

11-12

9

13-14

20

15-16

16

Total

52

Para poder aplicar la fórmula se necesita añadir la columna de frecuencias acumuladas. A continuación se ilustra esta columna:

Tabla 9- Segundos de reacción ante estímulo después de consumir 4 oz alcohol Segundos

f

Frecuencias Acumuladas

7-8

2

2

9-10

5

7

11-12

9

16

13-14

20

36

15-16

16

52

Total

52

Ahora se necesita determinar cuál es la clase mediana, o sea dónde se localiza la mitad de los datos. Esto se determina dividiendo el total de datos por 2: n 2

52 2

26

La clase mediana será aquella donde se acumulan los primeros 26 datos. En la tercera clase se habían acumulado hasta 16 datos y en la cuarta clase se acumulan 36 datos. Como se ilustra a continuación, la clase mediana es la cuarta clase.

Frontera de la clase mediana es 12.5

Segundos

f

Frecuencias Acumuladas

7-8

2

2

9-10

5

7

11-12

9

16

13-14

20

36

15-16

16

52

Total

52

Frecuencia acumulada de la clase anterior a la clase mediana (fa) Clase mediana Frecuencia absoluta de la clase mediana (f)

Ahora que se conoce la clase mediana, se puede sustituir en la fórmula siguiente:

Mediana Finf

Mediana 12.5

n 2

fa f

26 16 20

w

2

10 2 20 12.5 0.5(2) 12.5

12.5 1 13.5 La mediana de esta muestra es 13.5. Se puede decir que 13.5 es el valor que queda en el centro de este grupo.

Ejemplo – 7 Una muestra de 20 corredores participó en una competencia y se registró el total de minutos que corrió cada uno. La Tabla 10 muestra los resultados. Determine la mediana de esta muestra.

Tabla 10- Tiempo que corrieron en competencia

Minutos

f

6-10

1

11-15

2

16-20

3

21-25

5

26-30

4

31-35

3

36-40

2

Total

20

Para hallar la mediana se necesita añadir la columna de frecuencias acumuladas Tabla 11- Tiempo que corrieron en competencia Minutos

f

Frecuencias Acumuladas

6-10

1

1

11-15

2

3

16-20

3

6

21-25

5

11

26-30

4

15

31-35

3

18

36-40

2

20

Total

20

Ahora se necesita determinar cuál es la clase mediana, o sea dónde se localiza la mitad de los datos. Esto se determina dividiendo el total de datos por 2:

n 2

20 2

10

La clase mediana será aquella donde se acumulan los primeros 10 datos. En la tercera clase se habían acumulado hasta 6 datos y en la cuarta clase se acumulan 11 datos. Por tanto, la clase mediana es la cuarta clase.

Frontera de la clase mediana es 20.5

Minutos

f

Frecuencias Acumuladas

6-10

1

1

11-15

2

3

16-20

3

6

21-25

5

11

26-30

4

15

31-35

3

18

36-40

2

20

Total

20

Ahora se puede sustituir en la fórmula:

Mediana Finf

Mediana 20.5

n 2

fa f

w

10 6 5 5

Frecuencia acumulada de la clase anterior a la clase mediana (fa) Clase mediana Frecuencia absoluta de la clase mediana (f)

4 5 5 20.5 0.8(5) 20.5

20.5 4 24.5 La mediana de este grupo es 24.5. Este es el valor que está localizado en el centro de la distribución de datos en esta muestra.

EJERCICIOS EJERCICIO – 1 Considere los siguientes datos para hallar la media, clase modal, y mediana. Interprete los resultados. Tabla 12: Salario Mensual por Familia en una comunidad Salario Mensual en dólares 1001-1500 1501-2000 2001-2500 2501-3000 TOTAL

MARCA DE CLASE 1250.50 1750.50 2250.50 2750.50

FRECUENCIA 2 4 3 1 10

EJERCICIO – 2 Una universidad deseaba conocer cuál es el coeficiente intelectual (IQ) de los estudiantes que ingresan en primer año. Seleccionó una muestra de 108 estudiantes que ingresaron a primer año y le realizaron las pruebas pertinentes para determinar los coeficientes intelectuales (IQ) de estos estudiantes. Los resultados se indican en la tabla a continuación. Determine la media, clase modal y mediana de esta muestra. Interprete los resultados. ¿Cuál es el valor más típico de este grupo?

Tabla 13: Coeficiente Intelectual de Estudiantes Primer Año Coeficiente Intelectual 90-98 99-107 108-116 117-125 126-134

Frecuencia 6 22 43 28 9

ASIGNACION ESPECIAL (OPCIONAL) Considere el siguiente cuestionario: ¿CUAL ES EL VALOR DE SU AUTO? Con el propósito de realizar un estudio para la clase de estadística, solicito su cooperación para que indique con una X el apartado que corresponde al valor aproximado actual de su automóvil. Puede utilizar el precio que usted cree podría vender su auto. [] Menos de $3000 [] $15001 - $18000 [] $3001 - $6000 [] $18001 - $21000 [] $6001 - $9000 [] $21001 - $24000 [] $9001 – $12000 [] $24001 - $27000 [] $12001 -$15000 [] $27001 ó más

Permita que 30 personas contesten el mismo. Agrupe sus datos por clase según las alternativas del propio cuestionario. Construya la distribución de frecuencias de esta muestra. Halle la Media, Mediana y Moda.

RESPUESTAS A EJERCICIOS

EJERCICIO – 1

Media = 1900.5 La Clase Modal es la segunda. Mediana = 1875.5 El salario medio mensual de este grupo es de $1,900.50. El salario mensual más frecuente fue en el intervalo de $1,501 a $2,000.00. La mitad de la muestra tenía un salario mensual menor que $1,875.50. EJERCICIO – 2

Media = 113 La clase modal es la tercera. Mediana = 112.94 El cociente intelectual promedio de este grupo de estudiantes es 113. El cociente intelectual más frecuente está en el intervalo de 108 a 116. La mitad de la muestra tenía un cociente intelectual menor que 112.94. En esta muestra, siendo la media y la mediana valores muy cercanos, podrían ser ambos el valor más típico del grupo. Además, ambos valores quedan en el intervalo definido por la clase modal. Por lo que también lo podría ser la marca de clase de la clase modal que es

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.