Escalas de Medición en Estadística, http://www.byrong.tk
Escalas de Medición en Estadística
Ing. Byron Humberto González Ramírez Director Centro de Telemática Facultad de Agronomía Universidad de San Carlos de Guatemala Enero del 2004
[email protected] http://www.byrong.tk
1
Ubicación Temática
La Estadística es una disciplina que proporciona principios y herramientas para emitir juicios sobre colectivos basados en datos obtenidos para propósitos específicos. Es decir, brinda el soporte para saber qué datos obtener, cómo, cuándo, dónde obtenerlos, y una vez obtenidos proporciona métodos y procedimientos para organizarlos con diferentes propósitos. La correspondencia entre los análisis aplicados y datos recabados permite construir juicios concluyentes sobre el colectivo en estudio. Los datos que precisamos deben ser generados de alguna forma, la cual siempre está asociada a la definición de variables, que constituyen los conceptos de referencia más importantes en los inicios de una investigación.
Variable:
Es la característica de la muestra o población que se está estudiando. Los datos son el producto de su medición sobre los elementos o sujetos de estudio. Por ejemplo en un estudio sobre la cantidad mensual devengada por los trabajadores de una empresa, la variable es ingreso y está medida en quetzales (Q)
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
Una vez definida la variable y obtenidos los datos, los análisis que se apliquen son afectados por la manera en que las variables fijadas se clasifiquen. Dicha clasificación obedece a las escalas de medición propuestas por el Psicólogo Steven en 1946, casi universalmente aceptadas. Los datos están siempre referidos a una de estas escalas. 2
Objetivos de Aprendizaje
El presente escrito aporta elementos para que usted pueda: a. Diferenciar cada uno de las cuatro escalas de medición usadas para clasificar variables b. Asociar metodologías y procedimientos estadísticos de análisis en función de la escala de medición definida para una variable dada c. Dada una variable, definir la escala en qué está medida
3
Contenidos Temáticos I. II.
4
Características de las escalas de medición Pruebas estadísticas asociadas a cada una de las escalas de medición
Características de la Escalas de Medición
De acuerdo a la clasificación de Stevens, las variables pueden clasificarse en:
a. b. c. d.
Nominales Ordinales De Intervalo De razón
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
4.1
Nominales
Una variable está medida en escala nominal cuando se utilizan nombres para establecer categorías. Para distinguir los agrupamientos se emplean símbolos, letras e incluso números, aunque estos últimos solo cumplen una función de carácter simbólico y no numérico. Los cálculos matemáticos con estos números no tendrían sentido. Como ejemplo, el estado de una persona para determinada enfermedad se puede clasificar como “sano” o “enfermo”, o bien como “1” o “2”. Adicionalmente debemos mencionar que ninguna de las categorías definidas tiene mayor jerarquía que las otras. Ellas únicamente reflejan diferencias en la variable.
4.2
Ordinales
Presidente Vice-presidente Director General Gerente Jefe Empleado
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
En este nivel también se definen varias categorías, pero además de mostrar un ordenamiento existe una relación de “mayor o menor que” entre ellas. Las etiquetas, símbolos o números asignados si indican jerarquía, aunque no es posible conocer la magnitud de la diferencia entre cada una de las categorías. En el gráfico, el presidente (10) es más que el director general (8) y así sucesivamente, aunque no puede precisarse en cada caso cuánto más. 4.3
De Intervalo
Esta escala mide las variables de manera numérica. Los números de esta escala permiten establecer “distancias” entre dos individuos, y las operaciones aritméticas de suma y resta son perfectamente realizables y significativas, no así la multiplicación y división. En la escala de intervalo el cero es un valor que no indica ausencia de la característica o variable medida, y es colocado arbitrariamente en algún lugar de la escala. El ejemplo típico es la temperatura (medida en grados centesimales, Fahrenheit o Kelvin) donde un valor de cero no implica que exista ausencia de temperatura.
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
4.4
De Razón
Es la escala más fuerte, dado que usa un sistema numérico en el que el cero es un valor que indica ausencia de la característica que se está midiendo. Las operaciones aritméticas de multiplicación y división adquieren significación. La diferencia entre dos valores es importante y de magnitud definida. Así por ejemplo, el valor de cero quetzales en ingresos de una tienda, puede interpretarse de manera lógica que no se han producido ventas. De la misma manera un artículo con un peso de 6 Kg. tiene el doble de peso de otro que registra 3 Kg. 5
Pruebas estadísticas asociadas a cada una de las escalas de medición
Los cuadros 1,2 y 3 contienen las principales pruebas estadísticas que pueden usarse para el análisis de datos. Estos cuadros únicamente representan una guía de elección sobre una prueba o procedimiento estadístico en particular. Esto significa que antes de usar una prueba en definitiva, deberán estudiarse a fondo las condiciones para su empleo.
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
Cuadro 1:
Pruebas estadísticas descriptivas más frecuentes de acuerdo a la escala de medición de la variable en estudio.
Tipo de descripción Variables individuales
Variables individuales
Escala de la variable o Método o técnica asociación estadística Categóricas (nominal y − Frecuencias, ordinal) proporciones o porcentajes representados por gráficos de barras, pastel o pictogramas. Numéricas (intervalo y − Distribución de razón) frecuencias en clases − Frecuencias acumuladas − Percentiles − Medidas de tendencia centra, dispersión, curtosis y oblicuidad con − − −
Asociación entre variables
Categóricas categóricas
Asociación entre variables
Categórica con numérica
−
Asociación entre variables
Numérica con numérica
− − −
[email protected] Enero 2004 ©
Tablas de contigencias Gráficos de barras Pruebas de Kendall, de Kramer, de Spearman Tablas con clasificación categórica, con promedios y desviaciones o error estándar en cada entrada Gráfico de puntos Coeficiente de correlación Recta de regresión
Escalas de Medición en Estadística, http://www.byrong.tk
Cuadro 2:
Pruebas estadísticas inferenciales más frecuentes de acuerdo a la escala de medición de la variable en estudio.
Tipo de descripción Variables individuales
Variables individuales
Asociación entre variables
Escala de la variable o Método o técnica asociación estadística Nominales − Prueba de Z para una proporción poblacional − Prueba de X2 para varias proporciones en un sola población − Intervalos de confianza para proporciones Ordinales − Prueba del signo o binomial para la mediana poblacional − Intervalo de confianza para proporciones Muestras grandes distribución normal
con − −
Asociación entre variables
Muestras pequeñas distribución normal
sin − −
[email protected] Enero 2004 ©
Prueba de “t” para un promedio poblacional Intervalo de confianza para el promedio Prueba del signo o binomial para la mediana poblacional Intervalo de confianza para el promedio
Escalas de Medición en Estadística, http://www.byrong.tk
Cuadro 3:
Pruebas estadísticas para estudios comparativos más frecuentes de acuerdo a la escala de medición de la variable en estudio.
Tipo de descripción
Escala de variable asociación Independientes (sin control Nominal de factores de confusión)
Independientes (sin control Ordinal de factores de confusión)
la Método o técnica estadística o − − − − − − −
Independientes
Razón
− −
− − Dependientes con bloques Nominal o igualación de atributos (con control de factores de confusión)
Dependientes con bloques Ordinal o igualación de atributos (con control de factores de confusión) Dependientes con bloques Razón o igualación de atributos (con control de factores de confusión)
Prueba exacta de Fisher Prueba de X2 Cálculo de riesgo relativo Modelos logísticos y logarítmicolineales Prueba U de Mann Whitney (dos poblaciones) Prueba de Kruskall Wallis (dos o más poblaciones) Modelos logarítmicos-lineales Prueba de “t” (dos poblaciones) Análisis de varianza para la prueba de F (más de dos poblaciones) seguida de prueba de medias de Tukey, Duncan, SNK, etc. Prueba de Logrank para comparar sobreviva Regresión múltiple
− − −
Prueba de McNemar Método de Mantel Haenzel Prueba Prueba de X2 para cada nivel de confusión − Modelos logísticos Modelos logísticos y logarítmicolineales − Prueba de Friedman − Prueba de Wilcoxon para rangos señalados − Modelos logarítmico-lineales − Prueba de “t” apareada − Análisis de varianza para prueba de F con dos criterios de clasificación con prueba de Tukey − Regresión múltiple
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
6
Síntesis Esquemática
La complejidad aumenta con cada una de las escalas de medición. Desde la simpleza de la escala nominal hasta el refinamiento de la escala de razón. La mayoría de pruebas estadísticas requieren medidas en escala de intervalo o razón para ser aplicadas (Pruebas Paramétricas basadas en la distribución normal), aunque existen pruebas diseñadas para aplicarse a medidas en escala nominal u ordinal (Pruebas No Paramétricas o de libre distribución)
Pruebas Paramétricas
Pruebas No Paramétricas
7
a.
Actividades de Aprendizaje
La revista “Lugares” en su número 42 ofreció datos sobre condiciones y atracciones de los principales destinos de Guatemala. Algunos de estos datos se reproducen en el cuadro 4.
[email protected] Enero 2004 ©
Escalas de Medición en Estadística, http://www.byrong.tk
Cuadro 4:
Ciudad
Condiciones y atracciones de los principales destinos turísticos de Guatemala Población en miles
Promedio de ingreso/hogar (Q)
Mejor Hotel
Atracción visitada
Ruinas Reserva ecológica Lago Lago Jardín botánico
Antigua G. Cobán
45 35
3500 2700
Radisson Radisson
Izabal Panajachel Petén
40 27 49
4000 2500 5100
Del Lago Hyatt Espléndido
más
Tasa de criminalidad /10,000 hab. 84 26 69 63 42
Identifique la escala en que están medidas cada una de las variables del cuadro 4.
b.
Diríjase a la biblioteca de su Facultad o Universidad y tome al azar 10 títulos diferentes de tesis de grado. Identifique en cada una de ellas por lo menos una de las variables usadas en la investigación y defina en qué escala está medida. Finalmente anote la prueba estadística usada para su análisis y juzgue si fue correctamente aplicada en función de la escala de medición definida.
Referencias Bibliográficas Allen L.W. 2000. Estadística aplicada a los negocios y la economía. McGraw-Hill. Anderson R., Sweeney D. 1999. Estadística para administración y economía. Internacional Thomson. Levin R., Rubin D. 1996. Estadística para administradores. Prentice Hall. Levin D. et al. 2000. Estadística: Teoría y aplicaciones usando Microsoft Excel. Prentice Hall. Mendenhall W. Iberoamericana.
1989.
Introducción
a
la
Probabilidad
[email protected] Enero 2004 ©
y
Estadística.