Estadística para administración

Estadística para administración Estadística para administración Jesús Rodríguez Franco Alberto Isaac Pierdant Rodríguez Elva Cristina Rodríguez Jimé

2 downloads 255 Views 2MB Size

Recommend Stories


PARA FOR POUR PARA Wii
TM FOR /POUR/PARA DE Es gibt wichtige Hinweise zur Sicherheit und Handhabung dieses Produkts sowie, sofern zutreffend, Sicherheitsinformationen z

Para poner la mesa Para comer Para beber
Realidades Nombre Hora VIDEO Fecha Antes de ver el video Actividad 1 Select from the word bank the appropriate nouns to write under each heading:

Prospecto: información para el usuario. INVANZ 1 g polvo para concentrado para solución para perfusión ertapenem
Prospecto: información para el usuario INVANZ 1 g polvo para concentrado para solución para perfusión ertapenem Lea todo el prospecto detenidamente an

MARCO DE REFERENCIA PARA TRABAJOS PARA ATESTIGUAR
MARCO DE REFERENCIA  PARA TRABAJOS PARA ATESTIGUAR  CONTENIDO  Párrafo  Introducción  Definición y objetivo de un trabajo para atestiguar  1­6  7­11 

catálogo para profesionales catálogo para profesionales
catálogo para profesionales catálogo para profesionales 2015 2016 visítenos en: www.myc-5.com www.myc-5.com ETIQUETAS ETIQUETAS Rafia Sintéti

Story Transcript

Estadística para administración

Estadística para administración Jesús Rodríguez Franco Alberto Isaac Pierdant Rodríguez Elva Cristina Rodríguez Jiménez

PRIMERA EDICIÓN EBOOK MÉXICO, 2014

GRUPO EDITORIAL PATRIA

info

editorialpatria.com.mx

www.editorialpatria.com.mx

Dirección editorial: Javier Enrique Callejas

Coordinadora editorial: Verónica Estrada Flores Diseño de interiores:Eliud Reyes

Diseño de portada: Juan Manuel Loyola Silva Revisión técnica:

M.C. Alex Polo Velázquez

Universidad Autónoma Metropolitana Azcapotzalco ( U.A.M. ) Estadística para Administración Derechos reservados:

© 2014, Jesús Rodríguez Franco, Alberto Isaac Pierdant Rodríguez, Elva Cristina Rodríguez Jiménez © 2014, GRUPO EDITORIAL PATRIA, S.A. DE C.V. Renacimiento 180, Colonia San Juan Tlihuaca,

Delegación Azcapotzalco, Código Postal 02400, México, D.F. Miembro de la Cámara Nacional de la Industria Editorial Mexicana Registro núm. 43

ISBN ebook: 978-607-438-861-9 Queda prohibida la reproducción o transmisión total o parcial del contenido de la presente

obra en cualesquiera formas, sean electrónicas o mecánicas, sin el consentimiento previo y por escrito del editor.

Impreso en México Printed in Mexico

Primera edición ebook: 2014

Estadística para Administración

Dedicatorias

A mi familia Cristina, Katia, Jesús Miguel y a mis padres Martha Ester y Manuel. Jesús Rodríguez Franco

A mi familia María Irma y Alberto Isaac y a mi madre Raquel Rodríguez H. Alberto Isaac Pierdant Rodríguez

A Jesús, por su apoyo y motivación; a mis hijos: Katia y Jesús Miguel, por su perseverancia y constancia en el estudio y a mis padres Ángel y Angelina, por estar siempre presentes en mi mente y en mi corazón. Elva Cristina Rodríguez Jiménez



Estadística para Administración

Acerca de los autores Jesús Rodríguez Franco Profesor-investigador del Departamento de Política y Cultura en la Universidad Autónoma Metropolitana Unidad Xochimilco (UAM-X) y profesor definitivo de asignatura “B” en Matemáticas Financieras y Estadística en la Facultad de Contaduría y Administración de la Universidad Nacional Autónoma de México (UNAM). Estudió la carrera de Ingeniero en Comunicaciones y Electrónica en el Instituto Politécnico Nacional (IPN), tiene la maestría en ciencias en la especialidad de Bioelectrónica del Centro de Investigación y Estudios Avanzados del Instituto Politécnico Nacional (CINVESTAV-IPN), diplomados en: “Educación Superior” en la Universidad Autónoma Metropolitana – Xochimilco y de “Formación Docente para las Disciplinas Financiero Administrativas.” Facultad de Contaduría y Administración Universidad Nacional Autónoma de México. Tiene 28 años de experiencia docente impartiendo cursos de matemáticas e informática, cuenta con la acreditación de Profesor de Perfil Idóneo otorgado por la Secretaria de Educación Pública (SEP), es miembro del área de investigación: “Desarrollo de las Matemáticas en las Ciencias Sociales” en la UAM-X y es miembro de la Academia de Matemáticas de la Facultad de Contaduría y Administración (UNAM), es integrante de la Comisión Dictaminadora en Matemáticas de la Facultad de Contaduría y Administración (UNAM), también es representante ante el Consejo Académico de Departamento de Política y Cultura (UAM-X) y Colegiado de la División de Ciencias Sociales (UAM-X) ante el Colegio Académico de la Universidad Autónoma Metropolitana (periodo 2007-2009). Ha publicado un libro de matemáticas como coordinador y seis libros de matemáticas como coautor hasta ahora, también ha publicado 16 artículos de difusión enfocados a la pequeña y mediana empresa mexicana. Ha presentado diferentes ponencias en ciclos de conferencias, encuentros y foros a nivel nacional. Fue fundador y primer presidente de la Academia de Matemáticas de la Facultad de Contaduría y Administración de la Universidad Nacional Autónoma de México de (noviembre de 1999 a junio 2004), Jefe del área de investigación: “Desarrollo de las Matemáticas en las Ciencias Sociales” en la Universidad Autónoma Metropolitana Unidad Xochimilco (2003-2005), trabajó como ingeniero en electrónica en la Refinería 18 Marzo y en Dirección de Construcción y Obras de Petróleos Mexicanos (19841989), también ha sido profesor en la Escuela Superior de Ingeniería Mecánica y Eléctrica (ESIME) del Instituto Politécnico Nacional, en el Instituto Tecnológico de Monterrey División de Preparatoria Campus Ciudad de México y en la Universidad Latina Campus Sur.

VII

VIII

Estadística para Administración

Alberto Isaac Pierdant Rodríguez Profesor investigador del Departamento de Política y Cultura en la Universidad Autónoma Metropolitana Unidad Xochimilco (UAM-X) y socio director de Pierdant y Asociados, S.C. Estudió la carrera de Ingeniero Industrial en el Instituto Politécnico Nacional (IPN), tiene la maestría en ingeniería en la especialidad de Planeación de la División de Estudios de Posgrado de la Facultad de Ingeniería de la UNAM. Ha participado en diversos cursos de actualización, entre los que destacan: “Evaluación Económica de Proyectos de Exploración Regional de Hidrocarburos I” en la Universidad de los Andes-Banco Interamericano de Desarrollo, Bogotá, Colombia. “Evaluación Económica de Proyectos de Exploración Regional de Hidrocarburos II” en la Universidad de los Andes-Banco Interamericano de Desarrollo, Bogotá, Colombia. “Petroleum Energy” en The Institutte of Energy Economics, Japan, Septiembre-Noviembre 1989, Tokio, Japón. Tiene 30 años de experiencia docente impartiendo cursos de matemáticas e informática, cuenta con la acreditación de Profesor de Perfil Idóneo otorgado por la Secretaría de Educación Pública (SEP), es miembro del área de investigación: “Desarrollo de las Matemáticas en las ciencias Sociales” en la UAM-X. Ha publicado ocho libros de matemáticas, cuatro como autor y cuatro como coautor hasta ahora, también ha publicado más de 20 artículos científicos y de difusión enfocados a la pequeña y mediana empresa mexicana, ha presentado diferentes ponencias en ciclos de conferencias, encuentros y foros a nivel nacional e internacional. Fue fundador y es actualmente director del despacho de consultoría Pierdant y Asociados, S.C. (1979). Dentro de la consultoría ha elaborado trabajos para diversas empresas y organismos como SHCP, el ISSSTE, la comisión Federal de Electricidad, Petróleos Mexicanos, Coca-Cola FEMSA, el INBA, entre otros.

Acerca de los Autores

Elva Cristina Rodríguez Jiménez Profesora de matemáticas del Departamento de Política y Cultura en la Universidad Autónoma Metropolitana Unidad Xochimilco (UAM-X) y profesora definitiva de asignatura Estadística I y Estadística II en la Facultad de Contaduría y Administración de la Universidad Nacional Autónoma de México (UNAM). Estudió la licenciatura en Química Farmacobióloga con mención honorífica en la Facultad de Química de la Universidad Nacional Autónoma de México, los diplomados en “Matemáticas Aplicadas a la Economía” en la Facultad de Economía, el de “Formación Docente para las Disciplinas Financiero Administrativas” en la Facultad de Contaduría y Administración, ambos en la Universidad Nacional Autónoma de México. Tiene 14 años de experiencia docente impartiendo diferentes cursos de matemáticas, es miembro de la “Academia de Matemáticas” en la Facultad de Contaduría y Administración (UNAM). Es coautora del libro didáctico “Fundamentos de Matemáticas”, producto PAPIME Fomento Editorial FCA-UNAM, 2005. También ha participado en diferentes ponencias en ciclos de conferencias, encuentros y foros a nivel nacional. Participó en la investigación para el desarrollo de un método Fotocolorímetro, para la Organización de Estados Americanos (OEA) y la División de Estudios de Posgrado de la Facultad de Química de la UNAM (1984). Ocupó el cargo de Jefe y subjefe del laboratorio de Gases, también como química analista en el laboratorio Analítico, experimental y de gases en la Refinería 18 de Marzo (1985-1991).

IX

Estadística para Administración

Contenido PresentaciÓn . ................................................................................................................. XIII PrÓlogo ............................................................................................................................ XVI

capitulo 1. estadística descriptiva ............................................

1

¿Qué es la Estadística?.................................................................................................

2

En dónde se utiliza la Estadística............................................................................

7

Por qué se estudia Estadística..................................................................................

9

Variables............................................................................................................................

10

Escalas de medición......................................................................................................

14

Presentación y descripción de datos.....................................................................

19

Porcentajes, proporciones, razones, coeficientes e incrementos...........

28

Gráficas.............................................................................................................................

52

Otras representaciones gráficas...........................................................................

65

Problemas.........................................................................................................................

82

Respuestas........................................................................................................................

89

Capitulo 2. Estadística descriptiva. Parte 2............................... 99 Medidas descriptivas de los datos estadísticos muestrales....................... 100 Medidas de tendencia central y de posición....................................................... 101 Medidas de posición....................................................................................................... 126 Medidas de dispersión o de variabilidad................................................................ 133 Medidas de forma........................................................................................................... 150 Uso de las funciones estadísticas en Excel ....................................................... 156 El subprograma Estadística descriptiva de Excel............................................. 157 Problemas......................................................................................................................... 160 RESPUESTAS........................................................................................................................ 169

CAPÍTULO 3. Probabilidad............................................................... 177 Experimentos, reglas de conteo y asignación de probabilidades.............. 178 Asignación de probabilidades................................................................................... 187 Eventos y sus probabilidades................................................................................... 191 Leyes de la probabilidad.............................................................................................. 198 Teorema de Bayes........................................................................................................... 224 Problemas . ...................................................................................................................... 228 respuestas........................................................................................................................ 237

XI

XII

Contenido

CAPÍTULO 4. Variable aleatoria y distribuciones discretas de probabilidad............................................................................. 241 Variable aleatoria.......................................................................................................... 242 Distribución de probabilidades de una variable aleatoria discreta.......... 244 Distribución de probabilidad binomial................................................................... 251 Distribución de probabilidad hipergeométrica.................................................. 257 Distribución de probabilidad de Poisson.............................................................. 261 Distribuciones discretas de probabilidad en Excel.......................................... 268 Problemas......................................................................................................................... 269 Respuestas........................................................................................................................ 276

CAPÍTULO 5. Distribuciones continuas de probabilidad ............. 279 Distribuciones continuas de probabilidad.......................................................... 280 Problemas......................................................................................................................... 297 RESPUESTAS........................................................................................................................ 301

CAPÍTULO 6. Muestreo y distribuciones muestrales . ................. 305 Muestreo y tipos de muestreo.................................................................................. 306 Técnicas de muestreo no probabilísticas............................................................ 307 Muestras probabilísticas........................................................................................... 308 Distribución muestral de la media aritmética ( X )............................................. 314 Elementos para el diseño de cuestionarios........................................................ 330 Problemas......................................................................................................................... 332 Respuestas........................................................................................................................ 333

CAPÍTULO 7. Estadística inferencial.............................................. 335 Estadística inferencial ............................................................................................... 336 Inferencia estadística en una muestra pequeña................................................ 352 Inferencia estadística para muestras grandes.................................................. 364 Problemas......................................................................................................................... 375 Respuestas........................................................................................................................ 381

CAPÍTULO 8. Pruebas de hipótesis................................................ 385 Elementos para elaborar una prueba de hipótesis.......................................... 386 Errores tipo I y II............................................................................................................. 388 Pasos de una prueba de hipótesis............................................................................ 389 Empleo del valor p en las pruebas de hipótesis................................................ 401 Pruebas con dos muestras........................................................................................ 405 Problemas......................................................................................................................... 420 Respuestas........................................................................................................................ 424

APÉNDICE ........................................................................................ 427

Estadística para Administración

Presentación El libro Estadística para Administración está dirigido a personas interesadas en los temas de estadística y probabilidad básicos, ya que comprende desde el uso de la aritmética en estadística (porcentajes, proporciones, razones, coeficientes e incrementos), elaboración de cuadros estadísticos, hasta temas un poco más complejos como lo son las pruebas de hipótesis. Sus principales usuarios son los estudiantes, profesores y profesionales en administración de empresas, contabilidad, economía, finanzas, marketing, para el personal que labora en la administración pública, y que en una forma directa requieran del uso de la estadística y la probabilidad para analizar de manera sencilla, pero objetiva los problemas que se les presenten sobre la toma de decisiones bajo incertidumbre. Está estructurado en tal forma que cada capítulo de la obra, contiene una breve introducción del capítulo, el desarrollo teórico de los temas que lo forman, ejemplos, gráficas o cuadros estadísticos de análisis según sea el caso, ejemplos solucionados con EXCEL y otros con el paquete estadístico SPSS, así como, problemas a resolver, donde al final del libro se muestran sus respectivas respuestas. También podrán desarrollar las tablas de números aleatorios y las correspondientes a cada distribución probabilística con EXCEL. En el capítulo uno, se aborda el estudio de la estadística descriptiva, como es, el conocer y utilizar las técnicas estadísticas en una investigación, al igual que los elementos de las mismas. En estadística es importante la presentación y descripción de los datos, para lo cual se presentan los elementos básicos para la elaboración de cuadros estadísticos y de trabajo, como son: los cuadros de frecuencia para variables cualitativas y cuantitativas. En lo referente a la aritmética en estadística se estudia el cálculo y análisis de porcentajes, proporciones, razones, coeficientes e incrementos. El abordar el estudio y análisis de las escalas básicas de medición es una parte fundamental de este capítulo para construcción y análisis de los diferentes tipos de gráficas, en lo referente a la construcción se explica cuáles son los elementos básicos de una gráfica, por ejemplo, se analizan las gráficas de barras verticales, horizontales, de desviación, circulares, polígono e histograma de frecuencia, mapas estadísticos, pictóricas y otras. Se incluye también una guía rápida para elaborar gráficas en Excel. Los ejemplos que contiene el capítulo en algunos casos están elaborados en Excel. En el capítulo dos se estudian e interpretan con amplitud las diferentes medidas de resumen y análisis de los datos estadísticos descriptivos muestrales, como son las medidas de tendencia central y de posición (media aritmética, ponderada y geométrica, mediana, moda, cuartiles, deciles y percentiles), las medidas de variabilidad o variación (rango, desviación absoluta promedio, varianza, desviación estándar y coeficiente de variación), las medidas de forma o sesgo (distribución de frecuencia

XIII

XIV

Presentación

Normal, Teorema Chebyshev, coeficiente de asimetría y de variación, la distribución asimétrica, con asimetría positiva y negativa) y la medida de curtosis. En este capítulo también se resuelven algunos casos en Excel, pero es importante indicar que se explica y ejemplifica cómo utilizar el subprograma Estadística Descriptiva de Excel. En el capítulo tres se estudia la forma de determinar un espacio muestral a partir de las técnicas de conteo para experimentos de etapas múltiples, permutaciones y combinaciones, en lo referente a la probabilidad básica se tratan diferentes métodos para el calculo de probabilidades de acuerdo al trabajo que se este realizando, como son: la frecuencia relativa, probabilidad de un suceso, de sucesos mutuamente excluyentes y no excluyentes, la probabilidad conjunta, también se trata la probabilidad clásica y axiomática. En una segunda etapa se estudia y analiza la ley de la multiplicación (probabilidad incondicional y la condicional), la ley general de la multiplicación de probabilidades, y la ley especial de la multiplicación. En la última etapa se trata del estudio de la probabilidad total y de la probabilidad de causas o Teorema de Bayes. Los conceptos estudiados en el capítulo anterior de probabilidad se asocian con los conceptos a estudiar en el capítulo cuatro. Éste inicia con el estudio de la variable aleatoria discreta, posteriormente se analizar la distribución de probabilidad de una variable aleatoria discreta y su representación gráfica, también se ve la forma de calcular el valor esperado, varianza y desviación estándar de ésta variable. En la segunda parte del capítulo se ve la distribución Binomial, Hipergeométrica, de Poisson y se explica la forma de calcular la media, varianza y desviación estándar de cada una de ellas. En el capítulo cinco se muestran los conceptos de variable aleatoria continua y a partir de ésta, la determinación de los intervalos de definición y medición. También se muestra la forma de calcular y analiza la distribución de probabilidad de una variable aleatoria continua y su representación gráfica, en especial se tratan las distribuciones Uniforme, Exponencial y Normal y se explica la forma de calcular la media, varianza y desviación estándar de cada una de ellas. En el capítulo seis se analizan los elementos básicos de la teoría del muestreo (población, censo y muestra), para que a partir de ellos se estudie la forma de seleccionar una muestra utilizando las técnicas de muestreo no probabilístico (juicio, trozo, cuota y bola de nieve), probabilístico (aleatorio simple, sistemático, estratificado y de conglomerados). En un segunda parte de éste, se estudia la distribución muestral de la media aritmética (media o valor esperado, varianza, desviación estándar y su gráfica), también se ven las tres características de la distribución muestral a partir del Teorema Central de Límite y la distribución muestral de proporciones (seleccionar el tamaño de muestra para la estimación de medias de una proporción poblacional). En la última parte del capítulo se ven los elementos para el diseño de un cuestionario. El capítulo siete se inicia viendo lo relacionado con el estudio de la estimación puntual y por intervalos, las características de un buen estimador (insesgabilidad, eficiencia, consistencia, suficiencia), también la estimación del intervalo de confianza para

Presentación

la media aritmética cuando la desviación estándar de la población es conocida y desconocida. En la segunda parte del capítulo se estudia la inferencia estadística cuando se tiene una muestra pequeña (distribución t de student, inferencia para la media de una población, el tamaño de la muestra para estimar la media poblacional, estimación del intervalo mediante la diferencia entre dos medias). En la segunda parte se estudia la inferencia estadística para muestras grandes, iniciando con la estimación del intervalo de una proporción de la población, de la media de una población, de la diferencia entre dos medias y la del parámetro de una población binomial. En el capítulo ocho, último de esta primera parte, se estiman los valores de los parámetros como se plantearon en el capítulo anterior. Este capítulo inicia conociendo los elementos para elaborar una prueba de hipótesis (hipótesis nula y alternativa), los errores del tipo I y II, también se plantean los pasos a seguir en una prueba de hipótesis. Con el conocimiento de los elementos planteados anteriormente, se estudia la prueba de hipótesis de la media cuando se conoce la desviación estándar de la población (para muestras grandes y pequeñas) y la prueba de hipótesis para proporciones (para muestras grandes). Se explica la metodología para probar hipótesis (con dos muestras grandes, para diferencias entre medias con muestras pequeñas, para diferencias entre proporciones con muestras grandes). Por otro lado, observamos que en nuestro país es una realidad la gran influencia que los avances tecnológicos tienen en la sociedad, uno de ellos lo representa la computadora, su manejo y el uso cotidiano de sus programas de cálculo, como la hoja electrónica EXCEL o el paquete estadístico SPSS. El uso de estas tecnologías ha permitido a los analistas estadísticos obtener resultados de manera más rápida y certera, logrando un máximo beneficio que se refleja comúnmente en una toma de decisiones más adecuada. Por esta razón, nos hemos preocupado por incluir en cada capítulo de la obra, problemas estadísticos que muestren una solución más práctica mediante el uso de la hoja electrónica y el paquete estadístico SPSS. El contenido y estructura de cada capítulo está enfocado para que el lector alcance el proceso de comprensión-aprendizaje en forma simple, y para ello, lo reforzamos incluyendo en el libro un disco, él cual contiene los ejemplos realizados en Excel de los ocho capítulos de la obra. En él, el lector podrá ver cómo se solucionaron los ejemplos y problemas, ya que éste le permite trabajar directamente sobre la hoja electrónica y ver las funciones de Excel utilizadas (seleccionando la celda de resultado). Este disco cuenta además con tres secciones más, la primera incluye algunos de los ejercicios a resolver de los diferentes capítulos, el segundo es un resumen de funciones de Excel, y en el último se incluye el formulario de todos los capítulos. Esperamos que nuestros lectores comprendan la estadística y la probabilidad que se presentan en el texto, y que, con su aprendizaje, les posibilite solucionar los problemas que se les presenten en su campo laboral. Los autores

XV

XVI

Estadística para Administración

Prólogo La Estadística se ha vuelto esencial para prácticamente todas las ramas del saber humano. En Ingeniería, Física, Biología, Ciencias Sociales es una herramienta básica para sacar conclusiones de  datos experimentales o información recabada. Prácticamente todas las ramas de la Ciencias Sociales hacen uso de la Estadística. En Administración, Economía, Finanzas, Negocios, Mercadotecnia como herramienta para la toma fundamentada de decisiones y en Psicología y Sociología para la establecer la validez de estudios realizados en una población. Incluso en nuestra vida diaria la Estadística siempre está presente. A diario escuchamos o leemos sobre  encuestas, sobre todo respecto al apoyo a algún candidato en una campaña electoral o a algún proyecto gubernamental, que dicen tener un cierto grado de confiabilidad y con base en ellas se hacen afirmaciones. Pero siempre nos quedamos con la duda si los resultados de dichas encuestas son válidos, no sólo porque no tenemos la certeza de que esos datos sean reales, sino que de origen se hayan utilizado métodos estadísticos para la selección de las muestras y el análisis de los resultados. De aquí la importancia de la inclusión de la Estadística en la mayoría de los programas de las carreras a nivel Licenciatura, en particular, de las Ciencias Sociales. En este libro se tratan con la profundidad requerida los temas que normalmente se ven en la mayoría de los programas de Probabilidad y Estadística de las carreras de Ciencias Sociales a nivel licenciatura que generalmente se cubren en un año (dos semestres o tres trimestres según la institución educativa). En particular en la UAM Xochimilco cubre los programas de las materias. El orden de presentación de los temas y su cobertura permiten al estudiante apreciar con claridad la relación entre estas dos disciplinas y no ver a la Probabilidad como una materia aislada de la Estadística. La accesibilidad de las herramientas computacionales ha cambiado los métodos de enseñanza de muchas ciencias.  En particular en Estadística son de gran utilidad programas tales como Excel y su herramienta de análisis de datos y el paquete SPSS. Para su uso completo y adecuado es necesario haber comprendido satisfactoriamente los conceptos. En este libro hay un equilibrio adecuado entre la presentación teórica y práctica de conceptos y el uso de herramientas computacionales para facilitar y agilizar el análisis estadístico de información sobre todo en el caso de volúmenes grandes. Otro de las características de este libro es el gran número de ejercicios tanto resueltos como propuestos, la mayoría de los cuales están relacionados con información real de instituciones o empresas nacionales. Esto es importante porque antiguamente, los ejemplos en los que se hacía énfasis, los estudiantes relacionaban la teoría combinatoria y la probabilidad  con el lanzamiento de dados y combinaciones de cartas de baraja y la estadística con gráficas; de tal modo que perdían de vista la aplicación en el contexto de su carrera profesional. Por último, la exposición clara de los temas resultará útil no sólo para los estudiantes de las carreras de Ciencias Sociales, sino también para profesionales en activo que deseen repasar sus conocimentos de Probabilidad y Estadística e incluso para autodidactas.

M. en C. Alex Polo Velázquez UAM-Azcapotzalco

Capítulo 1

Estadística descriptiva



Estadística para Administración

Introducción En la actualidad, las matemáticas han adquirido gran importancia en las ciencias exactas y en las ciencias sociales, ya que estas últimas recurren a la estadística como una herramienta para medir y cuantificar fenómenos sociales. El gobierno federal como el estatal, la iniciativa privada (fábricas, PyMES, etc.), la Economía, la Administración, la Demografía, la Sociología, la Comunicación, la Química, la Psicología, la Medicina, la Ciencia Política y muchas otras ciencias y disciplinas emplean los métodos estadísticos.

¿Qué es la Estadística? La Estadística es una ciencia relativamente nueva cuyo objetivo es la colección e interpretación de datos. Estas actividades se remontan a la época del viejo testamento y de los registros de los babilonios y los romanos acerca de la población. Los estudios de la población aparecen a finales del siglo xviii y principios del xix. Godofredo Achewald (1719–1772) introduce por primera vez el nombre de Estadística a la asignatura universitaria encargada de la descripción de las cosas del Estado; y Adolph Quetelet (1796– 1874) fue quien aplicó, por primera vez, métodos modernos al estudio de un conjunto de datos. La palabra estadística surge a partir de la interpretación de tres vocablos: • Status (latín): situación, posición, estado. • Statera (griego): balanza, ya que la estadística mide o pesa hechos. • Staat (alemán): se refiere al Estado como expresión de unidad política superior. Se conoció a la Estadística como la aritmética estatal, ya que ésta permitía al gobernante contar el número de habitantes, con el objeto de recaudar impuestos, así como la riqueza, o presupuestar una campaña de prevención social. En la actualidad, esta ciencia moderna puede interpretarse como: El método que permite organizar, sintetizar, presentar, analizar, cuantificar e interpretar una gran cantidad de datos, de tal forma que se puedan tomar decisiones, realizar generalizaciones y obtener conclusiones válidas (dar información) sobre los fenómenos o líneas de investigación en estudio.

Este concepto ha permitido a los especialistas en Estadística llegar a un acuerdo para clasificar a esta materia en dos grandes ramas, las cuales se definen como: Estadística descriptiva y Estadística inferencial. Ambas desempeñan funciones distintas pero complementarias en el análisis estadístico.

C. Meza, A. Morales y R. Magaña, Introducción al método estadístico, México, UAM-X, 1980.

1

Capítulo 1  Estadística descriptiva

Estadística descriptiva Es aquella rama de la Estadística que se encarga mediante la aplicación de métodos y técnicas de obtener, organizar, presentar y describir los datos. Lo anterior se aplica exclusivamente a los datos que forman una muestra, la cual permitiría inferir o generalizar acerca de la totalidad de los elementos que constituyen la población de estudio, si esta muestra es representativa. El resumen de los datos puede realizarse en forma tabular, gráfica o numérica.

Ejemplos: • Un maestro de Estadística aplica un cuestionario a un grupo de estudiantes elegidos al azar, acerca de su edad, estatura, peso, talla y sexo. Estas estadísticas se pueden usar para analizar el promedio de edad, peso y talla de este grupo de estudiantes. Los resultados obtenidos pueden utilizarse para llegar a conclusiones válidas para este grupo y para realizar una inferencia en todos los grupos de la licenciatura, porque se sabe que la muestra es representativa de la población. • El jefe de personal de una empresa quiere conocer las aptitudes promedio de diez empleados. Para ello debe aplicar una prueba de aptitudes. El estadístico a utilizar es: la media aritmética, y el resultado obtenido es de 92 puntos, el cual sólo será válido para los diez cuestionarios aplicados. El jefe de personal no puede utilizar estos datos para una inferencia o generalización acerca de otros empleados de la empresa porque la muestra no es representativa, ello debido a que los empleados fueron elegidos a conveniencia del jefe de personal.

Estadística inferencial Es otra rama de la Estadística cuyos objetivos son generalizar o deducir a partir de estudios de muestras, el comportamiento de una población; con ello se pueden tomar decisiones útiles. La información que proporcionan las muestras se obtiene de la estadística descriptiva.

Ejemplos: • El ingeniero de control de calidad de una fábrica de hornos de microondas, al recibir un nuevo embarque de bases de vidrio, se pregunta si lo acepta o no, ya que el encargado del almacén le informa que en una caja de 50 bases, cuatro están defectuosas. • En el programa de prevención de incendios forestales se decide seleccionar dos técnicas diferentes de combate (“A” y “B”), para capacitar a campesinos en la quema de pastizales en forma segura. En el municipio se forman cuatro grupos de campesinos de características y habilidades semejantes; los dos primeros grupos emplean la técnica “A” y los dos últimos, la técnica “B”. Al terminar el curso de capacitación, se realiza un simulacro y los cuatro grupos participan. Se obtiene una calificación promedio con base en el desempeño y habilidades alcanzadas por cada grupo. El director del programa de capacitación se pregunta ¿puede evaluarse la efectividad relativa de las técnicas?





Estadística para Administración

Las preguntas de los ejemplos anteriores implican tomar una decisión o elegir una alternativa ante una incertidumbre. La Estadística inferencial también se conoce como el conjunto de técnicas a emplear para poder tomar decisiones en situaciones de incertidumbre. La inferencia estadística constituye la base teórica del muestreo, es decir, permite conocer el todo con cierta aproximación a partir del estudio de una parte.

Ejemplo: • Un investigador quiere conocer en promedio cuántos refrescos consumen los alumnos de las secundarias de una delegación en el Distrito Federal. Éste debe entrevistar a todos los alumnos de las 16 secundarias de la delegación del turno matutino como el vespertino; pero realizar un censo sería imposible, por el tiempo y por los recursos humanos y económicos. Por tanto, decide tomar una muestra representativa de la población en forma aleatoria y utilizar la estadística inferencial para determinar el consumo promedio de refrescos de los alumnos de las secundarias de la delegación. Los datos de la muestra se utilizan para inferir (deducir) o llegar a conclusiones acerca de la población de la cual se toma la muestra. Es importante mencionar que, la descripción de un todo o población con base en los principios de la Estadística inferencial no da una certeza completa en sus medidas sumarias, ya que éstas están sujetas a un posible error a causa de que las unidades seleccionadas (muestra), más o menos numerosas, no hayan sido seleccionadas de acuerdo con ciertos procedimientos y que la variabilidad de las características de estudio sea más o menos grande. En las anteriores definiciones se utilizó una serie de conceptos estadísticos muy comunes, por eso es conveniente especificarlos para que ello permita dar una mayor comprensión y entendimiento de los mismos. Recolección de datos. Es la etapa de mayor importancia en un trabajo de investigación, porque una buena recolección de éstos lleva a tener una gran confianza en los mismos. Una excelente recolección se logra cumpliendo con reglas estrictas para la obtención de los datos. Dato. Es un número, una medida o una característica que ha sido recopilada como resultado de una observación. Los datos pueden ser producto de un conteo o una medición, por ejemplo: número de casas en un municipio, número de alumnos reprobados en una asignatura, el número de Pymes en un país, el peso de una computadora portátil, la temperatura que se registra en un día, el sexo y nombre de una persona, etcétera. En ocasiones, ya existe la información requerida; por ejemplo, en los archivos internos de una compañía, en el Archivo General de la Nación, en los discos duros de las computadoras, etcétera. Los datos se representan por medio de números y numerales, y se dividen en dos tipos: en cualitativos y cuantitativos.

Capítulo 1  Estadística descriptiva

• Los datos cualitativos son aquellos que se asocian con atributos o características (se representan con numerales); por ejemplo, género, nacionalidad, nivel social, color de ojos, etcétera. • Los datos cuantitativos son los resultados que se obtienen de una observación; se representan por medio de números que se asocian con una unidad de medida; por ejemplo, el peso de los estudiantes en un determinado salón de clases expresado en kilogramos, el ingreso per cápita en pesos, la estatura de los estudiantes expresada en metros, etcétera. Número. Es un símbolo (1, 2, 3,...) que representa una cantidad. Las cantidades pueden sumarse, restarse, multiplicarse y dividirse. Numerales. Son símbolos como: X, 10, 3X, CASA; en otras palabras, no representan cantidades y se utilizan para identificar un evento de otro, o como simples etiquetas para diferenciar un elemento o evento de otro. Con ellos, sólo se emplean las operaciones lógicas de: ., ,, 5, #, y $. Variable. Para obtener estadísticas se utilizan conjuntos que poseen un determinado o indeterminado número de unidades, como son: los objetos, las personas, los fenómenos, etcétera. Cada una de las unidades de estudio tienen determinadas características; por ejemplo, para un ciudadano del estado de Hidalgo, se puede estudiar: la edad, el estado civil, la estatura, el estrato social, el género, el grado de escolaridad, el lugar de nacimiento, el nivel máximo de estudio, la religión, el peso, la talla, etcétera. Todas y cada una de estas características, que adquieren diferentes valores en cada persona, lugar o cosa y que son susceptibles de una medición, reciben el nombre de variables. De esta manera, el estudio de los habitantes de una población requeriría, tal vez, del uso de variables como género, edad, estatura, peso, estrato social, ingreso, religión, etcétera. Como puede observarse, la variable es una construcción que el investigador genera para analizar una realidad. Población. Es el conjunto formado por un número determinado o indeterminado de unidades (personas, objetos, fenómenos, etc.) que comparten características comunes a un objeto de estudio. a) Población finita. Es aquella que está formada por un número finito de elementos que pueden contarse (del primero al último, de ser necesario); por ejemplo, los departamentos de una unidad habitacional (Tlaltelolco); el número de trabajadores de una Secretaría de Estado o el número de productos terminados por una compañía manufacturera. Los ejemplos anteriores deben referirse con una fecha específica para que tengan significado real. • En un estudio de las preferencias de los votantes en una elección presidencial, la población estaría formada por todas las personas registradas en un padrón electoral. • El total de empresas productoras de bolsas y maletas de piel en el estado de Guanajuato.





Estadística para Administración

b) Población infinita. Ésta se forma por un número de elementos que no pueden listarse o enumerarse en su totalidad, ya que no se conoce nunca el último elemento que forma la población.

Ejemplos: • Los trabajadores de la industria de la construcción. • El número de plumas para escribir que se han vendido en la República Mexicana del año 2000 al 2007. Parámetro. Es la medida que cuantifica una característica que ha sido estudiada para una población. Este valor se considera verdadero, ya que su origen parte del estudio de cada uno de los datos que constituyen a la población. Por lo general, los parámetros se denotan con letras griegas; por ejemplo, la media de la población (µ), la varianza de la población (σ2), la desviación estándar de la población (σ). Un investigador de mercado, en ocasiones, quiere conocer el valor de un parámetro; por lo general, esto no es posible debido al tiempo y al dinero necesario para realizar un censo. Entonces el investigador debe tomar una muestra al azar de la población y calcular de la muestra un estadístico, lo que le permitirá inferir por estimación el valor del parámetro. Censo. Se conoce así al estudio de todos y cada uno de los elementos de una población; éste consiste en aplicar una encuesta a todos los elementos que integran una población; en otras palabras, es un estudio exhaustivo de esa población. Por ejemplo, los censos de población que se realizan cada 10 años en México. El censo es una buena opción cuando: • La población es pequeña. • Se requiere una exactitud completa. • El tamaño de la muestra es muy grande que se acerca al tamaño de la población. En la práctica, en ciertas ocasiones no es posible realizar un censo cuando: • La población es infinita. • Se requiere tener información rápidamente. • Hay escasez de recursos económicos o presupuestales, humanos y límites de tiempo. Encuesta. Es un instrumento organizado para conocer o encontrar hechos, es decir, proporciona datos que son necesarios para la investigación. Una encuesta no debe: • Ser larga, para que el entrevistado no pierda interés. • Omitir preguntas importantes. • Tener redacciones confusas. • Utilizar tecnicismos, sin haberse definido con anterioridad.

Capítulo 1  Estadística descriptiva

Muestra. Es cualquier subconjunto seleccionado de una población, que sigue ciertos criterios establecidos en la teoría del muestreo. La muestra es el elemento básico en el cual se fundamenta la posterior inferencia acerca de la población de donde procede. A los investigadores les resulta difícil levantar un censo para conocer los parámetros de una población, ya que se emplea demasiado tiempo y su costo es alto por la gran cantidad de datos a recolectar y presentar; por lo regular, es necesario contratar personal o equipo altamente capacitado. Al investigador le resulta más fácil tomar una muestra, pero para él es muy importante conocer el tamaño de la muestra (n), porque de ello depende la buena estimación de los parámetros de la población. La muestra al estar formada por una parte de los elementos de la población (N) en estudio debe cumplir ciertas condiciones como: tomarse de la población en estudio y ser la más pequeña (n), pero al mismo tiempo representativa de la población. – Calcular X para estimar Población parámetro m

Muestra – estimador X Seleccionar una muestra n en forma aleatoria Figura 1.1. Ciclo para estimar la media poblacional.

• Estadígrafo o estadístico. Es la medida que cuantifica una característica estudiada en una muestra. Se acostumbra denotarlas con letras romanas; por ejemplo, la media muestral (x), la varianza de la muestra (s2), la desviación estándar de la muestra (s). La diferencia entre parámetro y estadístico sólo es importante en la Estadística inferencial; por ejemplo, cuando un investigador de mercado toma una muestra al azar de una población y calcula un estadístico de la muestra (x).

Ejemplo: Tenemos una muestra que lista a 100 posibles clientes de un producto (chocolates en barra), y a éstos se les pregunta su opinión acerca del mismo. Si 60 de éstos lo prefieren, entonces tendremos, que la proporción muestral será 0.60, y ésta será, en consecuencia, un estadístico.

En dónde se utiliza la Estadística La Estadística, en la actualidad, tiene una infinidad de aplicaciones; por ejemplo, los diferentes gobiernos en el mundo la utilizan para generar las bases de datos de los nacimientos y de las defunciones. También, en economía (por medio del índice de precios al





Estadística para Administración

consumidor, y del índice de producción industrial), así como en el aspecto financiero (las tasas de interés o las fluctuaciones en la bolsa de valores). Obviamente pueden también conocerse las tendencias demográficas, o las operaciones futuras de cualquier empresa. En economía, el uso de la estadística se emplea como una herramienta de predicción y de toma de decisiones en la investigación de mercados, de recursos financieros a largo y corto plazo, en recursos humanos, etcétera. En las ciencias exactas, la estadística se ha usado para obtener datos y probar hipótesis utilizando un método científico; por ejemplo, en ingeniería, física, control de calidad, comunicaciones, estudio de los semiconductores, etcétera. En biología y medicina, para determinar los posibles efectos secundarios o la efectividad de las medicinas; en genética, para determinar las características genéticas de los seres vivos; en agricultura, para determinar los efectos de los insecticidas y fertilizantes en los campos; y en medicina preventiva, para controlar enfermedades contagiosas. La gran aceptación que ha tenido la estadística en las diferentes ciencias y disciplinas, por utilizar gran cantidad de información que permite deducir comportamientos o características en una población, la ha llevado a ser un curso obligatorio en la mayor parte de las escuelas y universidades, ya que conlleva al uso de calculadoras y de computadoras, las cuales constituyen en la actualidad una herramienta fundamental en el proceso de tomar decisiones.

Abusos de la estadística Al utilizar la Estadística es importante cuidar la obtención, cuantificación y presentación de los datos para no dar un mal uso de ellos, porque ello puede hacer que las personas interpreten mal la información y, por tanto, el trabajo pierde validez. Cuando los datos obtenidos son numéricamente insuficientes nos lleva a conclusiones equivocadas; por ejemplo, en una encuesta que se realizó con respecto a un nuevo programa de televisión se informó que la mayor parte de las personas entrevistadas coincidía que la conductora tenía problemas sexuales o le interesaba mucho el tema. Un estudio más a fondo indicó que sólo se habían transmitido diez programas de sexo y temas afines en forma consecutiva, de un total de doscientos programas grabados con temas diferentes al sexo. Es conveniente saber primero el número total de casos que intervienen en el estudio para evitar una interpretación equivocada. En ocasiones, las conclusiones se basan en datos obtenidos de una muestra que no es representativa de la población; esto se puede deber a que el método que se utilizó para obtener los datos no sea el adecuado y deje de responder a una proporción adecuada entre muestra y población. Por otro lado, en la presentación de gráficas de diversos estudios estadísticos es muy frecuente que la construcción de las mismas sea inadecuada, lo que lleva a tener una

Capítulo 1  Estadística descriptiva

interpretación equivocada. El principal error que se comete es cuando no se utilizan las escalas adecuadas para presentarlas, pues se obtienen gráficas muy anchas o demasiado altas. Otro error común es omitir el punto de origen de los ejes cartesianos, el cero, y comenzar con otro valor diferente. Los conceptos expresados anteriormente sólo muestran algunos casos en los cuales la estadística se utiliza a conveniencia del investigador, pues se obtienen como ya se indicó, resultados equivocados; es decir, se ha abusado de ella. Para evitar estos abusos, el investigador deberá aplicar por un lado, sus principios éticos y, por otro, las técnicas estadísticas adecuadas; esto se mostrará en los diversos capítulos de este libro.

Por qué se estudia Estadística Las definiciones anteriores nos proporcionan una idea general de lo que realiza la Estadística como rama de las Matemáticas aplicadas. Este conjunto de técnicas que tienen aplicación en las más diversas disciplinas, en ocasiones no siempre son aceptadas por las personas encargadas de aplicarlas. Esta última aseveración dependerá del conocimiento adecuado que tenga acerca de esta herramienta estadística la persona que la usa. Las personas que por sus trabajos requieren elaborar estadísticas se preguntan, en muchas ocasiones, por qué se estudian estas técnicas. Como indica F. Holguín: “La Estadística proporciona los elementos básicos para fundamentar una investigación. • Cómo planear la obtención de los datos para que de ellos se puedan extraer conclusiones confiables. • Cómo analizar estos datos. • Qué tipo de conclusiones pueden obtenerse con los datos disponibles. • Cuál es la confianza que nos merecen los datos”. La Estadística, por medio de sus dos ramas, permite realizar estudios de tipo descriptivo y explicativo prácticamente en todas las áreas del conocimiento humano.

¿Cómo aplicar estas técnicas en una investigación? La respuesta es simple: siguiendo un método. Hay muchos métodos sugeridos por diferentes autores; a continuación se presenta un resumen muy sencillo elaborado con varios de estos métodos. Elementos para realizar una investigación: • Formulación del problema. Consiste en identificar y especificar adecuadamente un problema de investigación. En esta etapa es muy importante establecer con precisión la o las hipótesis, el o los objetivos del estudio, su alcance y la población de datos asociada con el mismo.

2 Fernando Holguín Quiñones, Estadística descriptiva aplicada a las ciencias sociales, México, UNAM, 1981, pp. 22 y s.



10

Estadística para Administración

• Diseño del experimento. En esta segunda etapa, el investigador debe seleccionar la técnica de recolección de datos (observación directa, entrevista, encuesta, investigación documental) que le permita obtener información a un mínimo costo (dinero y tiempo) posible. También debe definir el tamaño de la muestra, la calidad requerida y el tipo de datos que le permitan resolver el problema planteado de la manera más eficiente. • Recolección de datos. Es la etapa de mayor importancia en la investigación, ya que la calidad de los datos obtenidos depende de una óptima recolección; la cual debe sujetarse a reglas estrictas que permitan obtener la información deseada. • Proceso de datos y su descripción. Consiste en elaborar cuadros estadísticos de trabajo, cuadros estadísticos de referencia, gráficas y cálculos de medidas estadísticas apropiadas al proceso descriptivo o inferencial seleccionado. Esto es, se exponen los datos muestrales mediante representaciones tabulares, gráficas y medidas estadísticas con el objeto de hacer una descripción de los resultados. • Inferencia estadística y conclusiones. Esta etapa proporciona una contribución muy importante, ya que en ella se define el nivel de confianza y significación del proceso inferencial, lo cual sirve como orientación a quien o quienes deben tomar una decisión acerca del tema objeto de estudio. Esto último permite al investigador establecer una conclusión acerca del problema y, en algunas ocasiones, elaborar sugerencias para la solución del mismo. En Estadística, un investigador debe contar con elementos que le permitan probar sus hipótesis; estos elementos son las variables de la investigación. Formulación del problema

Diseño del experimento

Recolección de datos

Nuevo problema

Nuevo conocimiento

Proceso de datos y descripción

Inferencia estadística y conclusiones Figura 1.2. Elementos para realizar una investigación.

Variables Como se observa en la figura 1.2, la primera etapa en el desarrollo de una investigación estadística es la formulación del problema, en la cual debe señalarse la hipótesis o las hipótesis de investigación y, por tanto, la variable o variables de estudio que permitan

Capítulo 1  Estadística descriptiva

comprobarlas. Independientemente del área de la ciencia y de la terminología que en ella se utilice para describir a las variables, éstas son susceptibles de clasificarse de acuerdo con la taxonomía establecida para su uso estadístico. Por tanto, no sólo es importante identificarlas y clasificarlas, sino también deben definirse adecuadamente a partir del criterio establecido por el investigador. En estadística, las variables se clasifican en dos grandes grupos, los cuales se definen como variables cuantitativas o métricas y variables cualitativas o no métricas. Las variables cuantitativas o métricas son aquellas cuya determinación está asociada con una unidad de medida (se necesita un instrumento de medición); por ejemplo, la altura de un edificio (en metros); el peso de una persona (en kilogramos); el número de habitantes de una población (en número); el ingreso mensual de los obreros de una fábrica (en pesos), etcétera. Estas variables se subclasifican, a su vez, en variables discretas y continuas. • Variables discretas o discontinuas. Son aquellas que cuantifican la característica por medio de valores enteros y nunca mediante fracciones de los mismos; por lo regular, el resultado se obtiene de contar. Como ejemplo, el número de clientes de un restaurante, el número de facturas expedidas en la semana por una papelería, el número de clientes potenciales en las ventas por internet, el número de puestos en una empresa, el número de habitantes en edad de votar en una población rural, el número de camiones de transporte colectivo en una ciudad, etcétera. • Variables continuas. Son aquellas que pueden tomar cualquier valor numérico, es decir, un valor entero o fraccionario en un intervalo previamente especificado; por lo regular, el resultado se obtiene de medir. Por ejemplo, la variable temperatura (grados centígrados), la variable tiempo en una investigación podría medirse en intervalos de horas, o en horas y minutos, o bien, en horas, minutos y segundos, según sea el requerimiento de la misma. La variable distancia en una investigación podría medirse en intervalos de kilómetros, o en metros y centímetros, o bien, en centímetros y milímetros de acuerdo con los requerimientos. Las variables cualitativas o no métricas especifican y miden cualidades en los individuos, lugares o cosas a partir de su descripción con palabras. Por ejemplo, la variable calidad de un servicio (muy bueno, bueno, regular, malo, muy malo), la variable estatus social (alto, medio, bajo); la variable idioma (francés, inglés, portugués, español); la variable género (hombre, mujer); la variable religión (católico, cristiano, protestante, etc.), entre otros. A su vez, las variables cualitativas se subclasifican en nominales y ordinales. • Variables nominales. Son variables no métricas, las cuales se usan para describir una característica que no puede cuantificarse numéricamente (no emplean instrumento de medición); por ejemplo, el idioma, identificar a los jugadores de un equipo, el género de las personas en un grupo indígena, el nombre de una persona, religión, profesión, etcétera. A estas variables, en ocasiones, se les asignan símbolos numéricos (numerales) de acuerdo con una regla específica. Estos números sólo se emplean para diferenciar a los distintos objetos o categorías. Así, la variable género

11

12

Estadística para Administración

se clasifica mediante dos categorías: 1, para las mujeres; y 2, para los hombres. De esta manera, en una investigación todos los individuos 1 serán mujeres y los 2 serán hombres. Con respecto a la variable calidad de un servicio, si éste se clasifica en cinco categorías, obtendríamos: 1 para muy bueno, 2 para bueno, 3 para regular, 4 para malo y 5 para muy malo. Esta forma de numeración en las variables nominales no permite realizar ninguna operación aritmética o algebraica; reiteramos, sólo sirve para identificar o nombrar. • Variables ordinales. Son variables no métricas que permiten describir la característica de un individuo, lugar u objeto, a partir de realizar una diferencia, en diversas categorías establecidas en orden de supremacía o de acuerdo con un criterio jerárquico. La diferencia que se establece entre las diferentes categorías ordinales no tiene un significado cuantitativo, sólo indican que una situación es mejor que otra, pero nunca cuantifican (la valuación es subjetiva). Por ejemplo, la evaluación que un viajero puede realizar acerca del servicio en un aeropuerto; si el servicio fue: malo, regular, bueno y muy bueno. La evaluación realizada por el cliente es subjetiva porque la variable mide diversas categorías que han sido establecidas de acuerdo con un criterio, pero entre ellas no puede establecerse una cuantificación numérica. En el momento operacional de una variable nominal, ordinal, de intervalos o de razón, en su representación gráfica puede utilizarse como una variable discreta o continua, y en el momento de su análisis puede ser dependiente o independiente.

Desde el punto de vista de la Estadística, la clasificación de las variables mencionadas no es única, ya que cada disciplina científica crea su propia clasificación de variables. Por ejemplo, en las ciencias sociales es común establecer relaciones entre variables experimentales, las cuales se clasifican, desde el punto de vista metodológico, en variables dependientes y variables independientes. La variable dependiente es aquella cuyos valores están condicionados por los valores que toma la variable o las variables independientes con las que tiene relación. Variable independiente

Variable dependiente

Figura 1.3. Relación entre variables.

La variable o las variables independientes son la causa iniciadora de una acción, es decir, de acuerdo con sus valores condicionan a los valores de la variable dependiente. Recordemos, una variable es cada una de estas características: cualidad, rasgo, atributo o propiedad, que toma diferentes valores en cada persona, lugar o cosa y que es susceptible de una medición.

Capítulo 1  Estadística descriptiva

Ejemplo: • Un problema cotidiano de tipo económico es el comportamiento del ahorro de una persona en una ciudad; el ahorro nos permitirá establecer una relación con las variables. El modelo económico que explica el ahorro es: Ahorro = ingreso – gasto

En el modelo del ahorro, la variable dependiente, presentará una situación específica de acuerdo con el comportamiento que tengan las variables independientes de la relación. En el cuadro 1.1 se muestran cuatro escenarios del ahorro con base en el comportamiento del ingreso y gasto. Cuadro 1.1. Comportamiento del ahorro con base en el ingreso y gasto Ahorro 5 ingreso 2 gasto Ahorro ($)

Ingreso ($)

Gasto ($)

Tipo de ahorro

Observaciones

1000

1500

500

Alto

Ideal

300

1500

1200

Bajo

Mínimo recomendado

0

1500

1500

No hay

No recomendable

2450

1500

1950

No hay

Hay déficit cubierto con crédito

En la última etapa de la definición de variables que se usarán en una investigación, y de acuerdo con Hernández, Fernández y Baptista, su definición se establece en dos niveles, los cuales se especifican como nivel conceptual y nivel operacional. Nivel conceptual. Define el término o variable con otros términos. Por ejemplo, el término poder puede definirse como “influir más en los demás que lo que éstos influyen en uno”. Este tipo de definición es necesaria pero insuficiente para definir una variable, debido a que no nos relaciona directamente con la realidad, ya que como puede observarse, siguen siendo conceptos. Nivel operacional. Lo constituye un conjunto de procedimientos que describen las actividades que un observador realiza para recibir las impresiones sensoriales que indican la existencia de un concepto teórico (conceptual) en mayor o menor grado, es decir, consiste en especificar las actividades u operaciones necesarias que deben realizarse para medir una variable.

3 Hernández R, Fernández C y Baptista P, Metodología de la Investigación, México, McGraw-Hill, 1991, pp. 99102.

13

14

Estadística para Administración

Ejemplos: Variable

Nivel conceptual

Nivel operacional

Ausentismo a clases

El grado en el cual un estudiante no se presentó a clases a la hora en la que estaban programadas

Revisión de las listas de asistencia de las diferentes asignaturas durante el último mes

Género

Condición orgánica que distingue a “la hembra del macho”

Asignación de la condición orgánica: mujer u hombre

Variable

Cuantitativa (métrica)

Discreta

Continua

Nivel conceptual

Cuantitativa (no métrica)

Nominales

Ordinales

Nivel operativo

Figura 1.4. Clasificación de las variables desde el punto de vista de la Estadística.

Con estas dos definiciones, el investigador o estudiante tendrá ahora la posibilidad de acotar adecuadamente las variables para un uso estadístico adecuado en la realización de un estudio o una investigación. En esta etapa, se recomienda al investigador o estudiante especificar las variables que habrá de utilizar en su investigación, no sólo por su tipo desde el punto de vista estadístico, sino principalmente por su definición conceptual y operacional de tal manera que éstas queden perfectamente detalladas en la investigación que se está realizando. Con esto último ya definido, el investigador puede pasar a la etapa de recolección de datos, lo que le permitirá posteriormente llegar al procesamiento de datos y su descripción.

Escalas de medición Una vez que se han especificado y descrito a nivel conceptual las variables que se utilizarán en una investigación, es muy conveniente también establecer, en conjunto con el nivel operacional, la escala de medición, ya que ésta permite definir con gran precisión la forma en que el investigador medirá en la práctica sus variables. La escala es una sucesión ordenada de elementos distintos, pero de la misma especie. Otra forma de entender lo que es una escala es considerar un factor de proporcionalidad

Capítulo 1  Estadística descriptiva

entre una cantidad representada y el segmento que la representa. Y la medición es el resultado numérico de comparar una unidad de medida con respecto a cualquier objeto o evento, siguiendo un conjunto de reglas diferentes, que previamente fueron establecidas; por ejemplo, medir el largo del salón de clases con un metro, medir la temperatura del agua de una alberca. Los niveles de medición o escalas de medición están definidos mediante cuatro tipos generales de escalas: la escala nominal, la escala ordinal, la escala de intervalos y la escala de razón.

Escala nominal Es el tipo más limitado (más débil) de medición que puede tener una variable. Se utiliza para hacer referencia a los datos (representados por numerales) que sólo pueden clasificarse en categorías, es decir, se aplica a aquellas variables que no pueden medirse mediante escalas numéricas (sano o enfermo), sino únicamente por medio de contar cada una de las características (se realiza un conteo de datos). Lo anterior indica que en este nivel de medición no hay un orden particular para organizar a los distintos grupos que forman los valores de la variable. Estas categorías o grupos son mutuamente excluyentes, es decir, que un dato al clasificarse sólo puede pertenecer a un grupo de la clasificación. Por ejemplo, al preguntarle a un alumno de la universidad la carrera que está cursando, éste sólo puede responder Economía (u otra carrera), pero no puede respondernos que cursa las carreras de Economía y Derecho. En el caso de clasificar a un automóvil por marca, no puede ser al mismo tiempo Toyota y Mazda; se le clasifica sólo en una. En este tipo de escalas, los grupos o categorías deben ser exhaustivos, lo cual significa que todos los datos de la población o muestra a clasificar pueden incluirse en su grupo o categoría respectiva.

Ejemplos: • Número de instituciones de educación superior públicas y privadas en México, las categorías es por tipo de institución. Se muestra en el cuadro 1.2. Cuadro 1.2. México: número de instituciones de educación superior (por tipo de institución, 2003) Tipo Centros Colegios Escuelas Institutos Universidades Total

Públicas 112 21 255 333 324 1045

Privadas 383 57 229 441 429 1539

Fuente: Elaborado por el Centro de Investigación en Ciencias y Humanidades, UNAM (2003), con datos de ANUIES.

15

16

Estadística para Administración

• Los alumnos de la Facultad de Contaduría y Administración de la UNAM, deben de clasificarse para las carreras de Administración, Contaduría e Informática, como se muestra en el cuadro estadístico 1.3. Cuadro 1.3. Facultad de Contaduría y Administración de la UNAM, alumnos por carrera Carrera

Alumnos

Administración

4 250

Contaduría

3 750

Informática

970

Total

8 970

Fuente: Datos hipotéticos.

Escala ordinal La escala ordinal se caracteriza por presentar diferentes niveles de medida entre sus categorías, una mayor que otra; de tal manera que todas ellas tienen diferente valor subjetivo. Esta medida diferente tiene dos características importantes: 1. Consiste en que el valor que toma la variable es un valor subjetivo. 2. Es que obliga a clasificarla en las categorías establecidas, en un orden específico (o en orden jerárquico). La escala ordinal de medición presenta, del mismo modo que la escala nominal, las mismas características; es decir, sus categorías o grupos de clasificación son mutuamente excluyentes y exhaustivas.

Ejemplos: 1. Las personas pueden clasificarse por su nivel socioeconómico como: a) Bajo. b) Medio. c) Alto. 2. La inteligencia puede medirse por: a) Encima del promedio. b) En el promedio.

c) Debajo del promedio.

3. Un investigador desea medir la calidad del servicio que presta el transporte público “Metrobús” de la Ciudad de México, y para ello entrevista a una muestra de usuarios: ¿cómo considera usted la calidad del servicio del Metrobús de la Ciudad de México? b) Malo. c) Regular. d) Bueno. e) Muy Bueno. a) Muy malo. La clasificación de las respuestas sigue un orden de acuerdo con el valor que cada individuo le asigna en la muestra; así, un investigador podría mostrar sus resultados a la pregunta realizada (cuadros 1.4 y 1.5).

Capítulo 1  Estadística descriptiva

Cuadro 1.4. Calidad del servicio

Cuadro 1.5.

Respuestas

Muy bueno

50

Bueno

150

Regular Malo Muy malo Total Fuente: Datos hipotéticos.

Calidad del servicio Respuestas Muy malo

7

Malo

15

35

Regular

35

15

Bueno

150

7 257

Muy Bueno Total

50 257

Fuente: Datos hipotéticos.

Esta escala se utiliza cuando se desea diferenciar en orden jerárquico los objetos o características que forman la variable. Por otro lado, si se utilizan números, éstos sólo sirven para diferenciar una posición en un orden de acuerdo con el criterio jerárquico establecido con anticipación, por ejemplo: • 1º (primer) lugar de una carrera de maratón. • 5º (quinto) lugar en ser ocupado en una empresa de nueva creación.

Escala de intervalo En esta escala de medición, es posible establecer valores numéricos constantes en las diversas categorías, y por ello establecer medidas o cuantificaciones entre unas y otras. También puede conocerse la magnitud que hay entre dos medidas cualesquiera y es posible ordenar las mediciones. Para construir una escala de intervalos se debe conocer: la distancia unitaria y el punto de origen o de partida, el cual recibe el nombre de cero móvil o arbitrario.

Ejemplo: • La escala de temperatura es la medición de la temperatura ambiente. La temperatura normal para un determinado municipio de la costa del estado de Nayarit es de 29º centígrados a las 12 horas y cuando amanece (6 a.m.), la temperatura es entre 15º y 18ºC. Cuando se conoce la diferencia entre dos medidas se forma un intervalo entre 15ºC y 18ºC, entonces el incremento de temperatura es de tres grados. También puede considerarse el mismo incremento a las 10 a.m., pero ahora esta temperatura está entre 23ºC y 26ºC. Obsérvese que el cero (0ºC) en este tipo de escala es arbitrario, ya que 0º en el ambiente no significa que no haya temperatura sino sólo un determinado estado de frío. • La escala de intervalo que se muestra en el cuadro 1.6, califica la habilidad de los operarios para el armado de automóviles en una empresa de Ciudad Sahagún.

17

18

Estadística para Administración

Cuadro 1.6. Calificación de habilidad Puntuaciones

Obreros

101 – 110

75

91 – 100

45

81 – 90

26

71 – 80

17

60 – 70

9

Menos de 60 Total

3 175

Fuente: Datos hipotéticos.

En este ejemplo, un operario puede tener una habilidad de 71, otro de 75 y otro de 79. La diferencia de habilidad entre los operarios es cuantificable en cuatro unidades. Como puede observarse en el cuadro 1.6, el valor cero no tiene significado, ya que finalmente todos los operarios tienen algún grado de habilidad. Como se mostró en los ejemplos anteriores, la escala de intervalos es de tipo cuantitativa, esto permite ordenar las mediciones, realizar operaciones aritméticas así como operaciones lógicas.

Escala de razón Ésta es la de más alto nivel de medición y tiene las mismas características que la escala de intervalo, es decir, tiene una unidad de medida. Las categorías se especifican con números, el tamaño de éstas es conocido y constante; también son mutuamente excluyentes y exhaustivas. La diferencia de la escala de intervalo con respecto a la de razón es: el punto cero o punto de origen, el cual es fijo y es significativo; la razón o cociente entre dos números de la escala, también, es significativa. Para construir la escala de razón se debe conocer la unidad de medida, así como determinar la igualdad de las razones y fijar el punto cero; por ejemplo, se pueden medir las siguientes variables: peso, estatura, longitud, ingresos monetarios, gasto en transporte, etcétera. Ahora bien, si seleccionamos la variable gasto diario en transporte de un obrero a su centro de trabajo. Cuadro 1.7. Gasto diario en transporte Gasto ($)

Obrero

0 – 12

25

13 – 24

32

25 – 36

8

37 – 48

4

Capítulo 1  Estadística descriptiva

El obrero puede tener un gasto de $ 11.50 al día, pero también podría suceder que tenga un gasto de $ 0.00, lo que significa que camina diariamente a su centro de trabajo. En este caso, el cero tiene significado y la unidad de medida es el peso ($). Considere ahora un obrero que gasta $ 15.00 diarios en transporte y otro sólo $ 5.00. El primer obrero gasta el triple de lo que el segundo; es decir, el cociente entre ambas cantidades tiene un significado al realizar un análisis.

Presentación y descripción de datos Cuando el investigador ha diseñado el experimento, procede a determinar el tamaño de su muestra, y mediante un instrumento de recolección de datos (cuestionario, entrevista, observación, etc.) habrá realizado las mediciones de todas las unidades contenidas en la muestra. De esta manera se ha concluido la obtención de datos originales (datos en bruto), los cuales no son significativos. La etapa de agrupación de datos (tabulación) tiene como objetivo condensarlos en una primera fase antes de obtener las medidas estadísticas que los condensa aún más. La agrupación de datos, que en estadística se define como presentación tabular, consiste en agruparlos mediante la elaboración de cuadros estadísticos o tablas estadísticas. En la actualidad se cuenta con dos formas de tabulación: la manual y la de proceso electrónico. Independientemente de cuál alternativa se tome para agrupar los datos, se deberán realizar los pasos siguientes: • Primero se definen cuáles y cuántas clases o grupos se tienen en cada variable de la investigación (utilizar la definición operacional de variable). • Después, se procede al conteo y clasificación de cada dato en los grupos o clases determinados previamente. Por ejemplo: Característica Género

Estado civil

Categoría Mujer Hombre Soltero Casado Unión libre Viudo

Conteo

La característica género se establece en dos categorías o clases, las cuales se definen como hombre y mujer. Para la característica estado civil se establecen cuatro categorías soltero, casado, unión libre y viudo; una vez hecho esto, se deberá contar y clasificar a cada hombre o mujer; soltero o casado o en unión libre o viudo para cada persona entrevistada en el estudio.

Tabulación manual Se realiza el recuento mediante el uso exclusivo de papel y lápiz. Se elaboran hojas tabulares en donde se registrará el dato en la categoría correspondiente conforme éste se

19

20

Estadística para Administración

va tomando de la fuente (cuestionario, entrevista, observación, etc.). Se pueden utilizar dos sistemas: el de diagonales o rayas y el de cuadrados.

Diagonales (rayas)



Cuadros

|||| ||||

9 unidades



9 unidades

El sistema más recomendado de acuerdo con la experiencia es el de cuadros, porque presenta un menor número de errores en el conteo, ya que es más fácil percibir cuando se han completado cinco unidades; mientras que el sistema de diagonales da lugar a cometer un mayor número de errores, al registrar un mayor o un menor número de unidades en lugar de las cinco. En el cuadro 1.8. se muestra un ejemplo de esta tabulación a partir de la clasificación por género de 23 personas y por el estado civil de 14 hombres: Cuadro 1.8. Característica

Categoría

9

Hombre



14

Soltero



5



4

Mujer

Género

Casado

Estado civil (hombres)

Frecuencia

Conteo

Unión libre

4



Viudo

1



La tabulación manual, también, puede efectuarse mediante el traslado de los datos a hojas o cuadros de concentración. Estos cuadros permiten al investigador tener los datos a la vista, concentrados, en lugar de tenerlos dispersos en los cuestionarios, tarjetas, etcétera, y también facilitan realizar el conteo. La forma de registro en los cuadros de concentración se realiza mediante símbolos elementales como los siguientes: (•, 5, 3) y los totales se registran al pie de las columnas (cuadro 1.9). Cuadro 1.9. Género Cuestionario

1 2 3 4 5

H

M

Nacionalidad Mexicano

• • • •

• • •

Estado civil

Extranjero

Soltero





Casado

¿Trabaja?

Unión libre

Viudo



• •





• •



• •

A

A

A

A

A

Total

14

9

20

3

A 9

No



A

A

A

A

A

7

4

3

5

15

Fuente: Datos tomados de un grupo del semestre 2007-2 de la Maestría en Administración de Hospitales, FCAUNAM.

Capítulo 1  Estadística descriptiva

La tabulación manual es recomendable cuando el número de cuestionarios o datos recolectados no sea muy grande y las categorías o clases especificadas no sean numerosas. En estas condiciones, la tabulación manual es más ventajosa que la tabulación mediante el proceso electrónico.

Proceso electrónico de datos Este proceso es recomendado cuando las investigaciones a realizar requieran operaciones a gran escala, que sean complicadas o con un alto grado de repetición. El proceso electrónico es preferido con respecto al manual porque la computadora procesa los datos a gran velocidad y eficiencia, a pesar de estas ventajas, se requiere un trabajo preliminar en la elaboración del programa de computadora, así como en la captura de los datos para su proceso. El investigador, en el siglo xxi, cuenta con una gran variedad de programas de computadora (paquetes) que le permiten procesar los datos en forma rápida y eficientemente, algunos de los paquetes que pueden utilizarse son SPSS (Statistical Package for Social Science), SAS (Statistical Analysis System), Minitab, Excel, etcétera. Cuadro 1.10. ¿Trabaja actualmente en el turno vespertino?

Valid

Sí No Total

Frequency

Percent

Valid percent

4 1 5

80.0 20.0 100.0

80.0 20.0 100.0

Cumulative percent 80.0 100.0

Este cuadro es un ejemplo elaborado con el paquete SPSS. Cuadros estadísticos. En éstos se presentan los resultados del proceso de condensación o tabulación de datos. En estadística, esta presentación de la información recibe el nombre de cuadros estadísticos, también conocidos con el nombre incorrecto producto de la traducción inglesa, de tablas estadísticas. Los cuadros estadísticos tienen como objetivo ser el lugar donde se depositan los datos, o bien, el lugar que contiene datos ya procesados; es decir, la información que el investigador utiliza como una herramienta en sus análisis. Los cuadros estadísticos tienen como principales ventajas: • Presentar una gran cantidad de información. • La posibilidad de leer valores exactos. • La sencillez en su elaboración. El cuadro estadístico se clasifica en dos tipos: cuadros de trabajo y cuadros de referencia, con base en el uso que el investigador o el estudiante le dé.

21

22

Estadística para Administración

Cuadros de trabajo. Son aquellos que contienen datos como producto de una tabulación. En otras palabras, son cuadros depositarios de datos. Éstos son utilizados por el investigador para obtener, a partir de ellos, las medidas estadísticas requeridas. Un ejemplo de este tipo se muestra en el cuadro 1.11. Cuadro 1.11. Producción para exportación del primer semestre de 2006, México. México fue el primer país que más automóviles produjo a nivel mundial Año

Chrysler

Ford

GM

Honda

Nissan

VW

Total

2000

371 516

234 751

325 422

7 277

153 978

340 054

1 432 998

2005

340 265

107 083

333 225

14 587

155 190

242 496

1 192 846

2006

174 566

159 445

199 638

8 545

91 295

148 225

781 714

Fuente: Asociación Mexicana de la Industria Automotriz.

En este cuadro se observa simplemente la presentación de los datos de la producción de automóviles para exportación en el año 2000, 2005 y 2006 (al mes de junio), como resultado de un conteo de la producción nacional de estos automóviles sin incluir en él ningún tipo de cálculo. Cuadros de referencia. Son aquellos que tienen como objetivo ayudar al investigador o al estudioso en el análisis formal de las interrelaciones que tienen las variables en estudio, es decir, contienen la información ya procesada de los cuadros de trabajo (proporciones, porcentajes, tasas, coeficientes, etc.). El cuadro 1.12 es un ejemplo del cuadro de referencia. Las instituciones bancarias “han realizado cuantiosas inversiones materiales y humanas para poner a disposición del público una amplia infraestructura de pagos y servicios que faciliten la vida diaria de las personas y las empresas, en un creciente número de poblaciones en todo el país”; en la actualidad se ha revolucionado el sistema de pagos, lo cual “ha implicado una migración de los medios basados en papel, como el efectivo, el cheque y el giro, a los medios electrónicos, como transferencias, domiciliaciones, cajeros automáticos y transferencias electrónicas con diversas repercusiones tanto para los usuarios como para los bancos”. Cuadro 1.12. Sistema de pago bajo valor en México (2005) Sistema

Volumen promedio diario (miles de operaciones)

Cheques TEF

2 310 764

Domiciliación

Porcentaje operaciones (%) 32.35 10.70

Importe promedio diario (millones de pesos)

Porcentaje importe (%)

39 577 55 817

39.75 56.06 0.20

146

2.04

204

Tarjetas en ATM

2 930

41.04

3 357

3.37

Tarjetas en TPV Totales

990 7 140

13.87 100

621 99 576

0.62 100

Fuente: Revista Ejecutivos de Finanzas, septiembre, año XXXV, No. 45, 2006, pp. 48.

Capítulo 1  Estadística descriptiva

El cuadro de referencia es un cuadro analítico en el cual se han transformado los datos absolutos (cuadro 1.12) a un cálculo de porcentaje, que permite comparar y analizar las variables de un estudio. Otro ejemplo para elaborar cuadros de referencia es el de la producción de oro y plata en México (cuadros 1.13 y 1.14). Cuadro 1.13. Producción de oro y plata en México



Año

Oro (toneladas)

Plata (toneladas)

2002

8.5

2 351.60

2003

8.9

2 223.60

2004

10.4

2 317.40

2005

11.1

2 415.80

2006

14.4

2 325.40

Fuente: Datos hipotéticos propuestos por los autores.

El cuadro 1.13 solamente presenta los datos de producción de oro y plata de 2002 a 2006 como resultado de un conteo de la producción nacional de estos metales, por tanto no incluye ningún cálculo. Cuadro 1.14. Producción de oro y plata en México Año 2002



Oro (toneladas) 8.5

Variación anual %

Plata (toneladas)

Variación anual %

20.8

2 351.60

2.0

2003

8.9

4.6

2 223.60

25.4

2004

10.4

16.5

2 317.40

4.2

2005

11.1

6.8

2 415.80

4.2

2006

14.4

29.4

2 325.40

23.7

Fuente: Datos hipotéticos.

El cuadro 1.14 es de referencia o cuadro analítico; en éste se han transformado los datos absolutos de variación anual, columnas 2 y 4 (cuadro 1.13), en sus respectivos porcentajes de crecimiento, los cuales se muestran en las columnas 3 y 5 del cuadro.

Elementos para elaborar cuadros estadísticos La construcción de cuadros estadísticos de trabajo o de cuadros de referencia requiere prácticamente de los mismos elementos para su elaboración, ya que ambos presentan las mismas características estructurales, por lo que los elementos que a continuación se describen deberán utilizarse en la conformación de éstos indistintamente. 4 El cálculo de la variación anual se explica detalladamente en el tema  “Incrementos”. 5 El contenido de este subtema se ha tomado, con modificaciones, del propuesto por F. Holguín Quiñones, op. cit., pp. 44-46.

23

24

Estadística para Administración

1. Número del cuadro. Es el primer elemento de todo cuadro estadístico. Tiene como objeto permitir una fácil y rápida referencia al mismo. 2. Título. Es el segundo elemento del cuadro estadístico. En él se indica el contenido del cuadro, su circunscripción espacial, el periodo o espacio temporal y las unidades en que están expresados los datos. 3. Nota en el título (encabezado). Elemento complementario del título. Se emplea sólo en aquellos cuadros en que se requiere proporcionar información adicional; incluso como un todo o relativa a la parte principal del mismo. 4. Casillas cabecera. Contienen la denominación de cada característica o variable que se clasifica. Por ejemplo, para los cuadros 1.13 y 1.14, las casillas de cabecera están formadas por oro, plata y variación anual en porcentaje. 5. Columnas. Son las subdivisiones verticales de las casillas cabeceras. Se incluyen tantas columnas en una casilla cabecera como categorías le correspondan a la variable. Por ejemplo, al clasificar la variable género en un cuadro estadístico, se tendría una columna para hombres y otra para mujeres. 6. Renglones. Son las divisiones horizontales que corresponden a cada criterio en que es clasificada una variable. Por ejemplo, en los cuadros 1.13 y 1.14, la producción de oro y plata es clasificada para cada año del periodo 2002 a 2006. 7. Espacio entre los renglones. Tienen por objeto hacer más clara la presentación de los datos, lo que facilita su lectura. Un ejemplo de esto se muestra en el cuadro 1.14. 8. Líneas de cabecera. Son las líneas que se trazan para dividir las casillas de cabecera de los renglones. 9. Cabeza del cuadro. Está formada por el conjunto de casillas cabeceras y encabezados de columnas. 10. Casillas. Es la intersección que forma cada columna con cada renglón en el cuadro. Las casillas contienen datos, o bien, los resultados de cálculos efectuados con ellos. 11. Cuerpo del cuadro. Está formado por todos los datos sin considerar la cabeza del cuadro y los renglones de totales. 12. Renglón de totales. Es un elemento opcional en los cuadros estadísticos. Se agrega el renglón de totales sólo en aquellos cuadros donde es posible sumar el contenido de las columnas. Esta característica del cuadro, también, es válida para las filas; es decir, es posible tener una columna de totales. 13. Línea final de cuadro. Es la línea que se traza al final del cuerpo del cuadro y, en su caso, al final del renglón de totales. Esta línea divide los datos y cálculos de la nota de cabecera, las notas al pie del cuadro y la fuente. 14. Notas al pie del cuadro. Se usan para calificar o explicar un elemento particular en el cuadro que presente una característica distinta de la clasificación. Por ejemplo, si en el cuadro 1.14, la producción de oro de 2006 fue obtenida durante el primer semestre del año, esto se deberá indicar en una nota al pie del cuadro. 15. Fuente. Es el último elemento en un cuadro estadístico. Tiene por objeto indicar el origen de los datos.

Capítulo 1  Estadística descriptiva

Para mostrar cada uno de los elementos que constituyen un cuadro estadístico se han elaborado, mediante una hoja electrónica de cálculo, tres ejemplos: un cuadro de trabajo del gasto federal en educación durante tres generaciones (figura 1.5); otro cuadro de trabajo (1.15) acerca del el número de empresas por tamaño y su participación en el total de establecimientos, empleos y del PIB (Producto Interno Bruto); y un cuadro de referencia (figura 1.6), en relación con el cuadro 1.15, acerca del gasto federal en educación durante tres generaciones en México. Para complementar la elaboración de cuadros estadísticos, el lector podrá consultar la siguiente dirección electrónica: http://www.geocities.com/aipierdant/cuadros/

Figura 1.5. Gasto federal en educación durante tres generaciones. Cuadro 1.15. Universo empresarial mexicano, número de empresas por tamaño y su participación en el total de establecimientos, empleos y del PIB Estrato Mipyme Micro Pequeñas Medianas Grandes Total

Número de empresas 3 400 000 1 3 276 473 2 132 866 2 30 661 2 6 814 2 3 406 814 2

Del total de empresas

Del total de empleos

99.8% 1 95.0% 1 3.9% 1 0.9% 1 0.2% 1 100%

70.0% 1 nd nd nd 30.0% 2 100.0%

Del total del PIB 50.0%1 nd nd nd 50.0% 2 100.0%

Notas: 1 Cifras publicadas. 2 Cifras estimadas con base en la información publicada. Fuente: Secretaría de Economía, elaborado y publicado en el Financiero (20 de julio 2006, p. 8), republicado por la revista Emprendedores, Núm. 102, p. 36. 6

Las hojas electrónicas de cálculo tienen su origen a la vez que las microcomputadoras, y no son más que programas diseñados para elaborar cuadros y gráficas, así como para realizar cálculos numéricos de diversos tipos (aritméticos, algebraicos, estadísticos, financieros, etcétera.).

25

26

Estadística para Administración

Figura 1.6. Gasto federal en educación durante tres generaciones.

Cuadros estadísticos en Excel  Las hojas electrónicas como Excel permiten la elaboración rápida de cuadros y gráficas estadísticas. En esta sección se describirá brevemente el procedimiento de construcción de cuadros estadísticos. Este proceso es similar al de cuadros de trabajo o de referencia. Los elementos considerados deberán utilizarse como una guía en la construcción de cualquier tipo de cuadro. Como ejemplo de construcción utilizaremos el cuadro de trabajo de la figura 1.5. • Seleccionar, en la hoja electrónica, el área de construcción del cuadro (columnas y renglones a utilizar). • Determinar el número de columnas y renglones requeridos. Considere que cada columna en el cuadro corresponde a una columna en la hoja, y así, respectivamente, para los renglones del mismo. • Ubicar el número de cuadro, título, subtítulo y unidades de medida en las celdas de la primera columna en su renglón correspondiente, como se indica en la figura 1.7. • Capturar en las columnas correspondientes, las casillas de cabecera (figura 1.7). • Agregar, en el renglón respectivo, las fórmulas o cálculos necesarios en el cuadro estadístico, tal como se indica en la figura 1.7. • Capturar en su caso las notas al pie y la fuente, dejando entre ambas una línea de separación (figura 1.7).

7 A. Pierdant, J. Rodríguez, Elementos de estadística para ciencias sociales, UAM-X, México 2007, pp. 35 y 36.

Capítulo 1  Estadística descriptiva

• Dar formato final al cuadro, e iniciar con la alineación de columnas del número de cuadro, título, subtítulo y unidades, y seleccionar el tipo de letra y tamaño. Posteriormente, dar formato (alineación, tipo de letra, tamaño de letra, etc.) a las casillas de cabecera y trazar las líneas respectivas. Como tercer paso en este punto, dar formato a los renglones de cuadro, así como al fondo de cada una de las filas. Finalmente, trazar la línea final de cuadro y dar formato a las notas al pie y a la fuente (figura 1.8). Si usted no tiene experiencia en el uso de la hoja electrónica de Excel le sugerimos revisar la amplia bibliografía elaborada acerca del tema.

Figura 1.7

Figura 1.8

27

28

Estadística para Administración

Porcentajes, proporciones, razones, coeficientes e incrementos La elaboración de cuadros estadísticos, y estadísticas en general, implica el uso de ciertos conocimientos aritméticos que permiten obtener medidas de comparación de los datos que han sido condensados. Estas herramientas que analizan las características de las variables clasificadas de un problema particular son los porcentajes, las proporciones, los coeficientes y las razones.

Porcentajes Un porcentaje es la relación que se establece entre un subconjunto “n” de un conjunto “N”, multiplicando esta relación por cien. El porcentaje se representa con el símbolo % (porcentaje o tanto por ciento). Por tanto, ese todo o total representa el 100 por ciento, y cada una de las relaciones obtenidas al dividir la parte entre el total y multiplicarla por cien representa un tanto de cien. Esto último se define como tanto por ciento. Entonces, para realizar el cálculo del porcentaje o tanto por ciento de un subconjunto “n” de “N”, se deberá cumplir que éste (subconjunto “n”) tendrá que ser mutuamente excluyente en relación con otros subconjuntos. El porcentaje se expresa matemáticamente de la siguiente forma:

 Número de elementos del subconjunto n  % del subconjunto n =   (100 )  Total de elementos del conjunto universal N  Por lo tanto, la suma del porcentaje de todos los subconjuntos mutuamente excluyentes (o exclusivos) que forman un universo será siempre igual a 100%.

Ejemplo: Una pequeña población de la sierra de Oaxaca está formada por 48 hombres y 72 mujeres. ¿Cuál es el porcentaje de hombres y de mujeres? Género

Habitantes

Mujeres Hombres Total

72 48 120

El cociente que resulta de dividir el número de mujeres en relación con el total de habitantes y multiplicado por cien, indica el número de mujeres por cada 100 habitantes que hay en esa población.  72  Porcentaje de mujeres 5  (100 ) 5 0.6 3100 5 60%  120   48  Porcentaje de hombres 5  (100 ) 5 0.4 3100 5 40%  120 

Capítulo 1  Estadística descriptiva

La interpretación de los datos obtenidos en este ejemplo es la siguiente: si la población hubiese estado formada por 100 habitantes, 60 serían mujeres y 40 hombres. En estadística, la principal utilidad del porcentaje es la comparación de los diferentes subconjuntos numéricos. Cuando se utilizan las cifras absolutas es muy difícil en ocasiones realizar comparaciones de una manera fácil y comprensible, en virtud de que se oscurecen (o enmascaran) las relaciones. Es posible poderlas comparar porque los números absolutos se reducen a una escala que es fácil de trabajar al realizar la multiplicación y división, y éstas transforman al conjunto que forma el número base (total de elementos del universo) en la cifra 100 que es fácilmente divisible y multiplicable por otros números, permitiendo la determinación de su magnitud relativa. Los porcentajes son útiles cuando se comparan dos o más conjuntos numéricos. Por ejemplo, en la figura 1.6, es posible comparar el gasto en educación por generación; obsérvese que sólo la educación superior ha incrementado sus recursos económicos en las últimas tres generaciones, al pasar de 13.1% en la generación 1977-1992 a 15.8% en la generación 1979-1994, a pesar de que el tamaño de matrícula ha disminuido de 6.9 a 6.5%, respectivamente. En estadística se acostumbra presentar los porcentajes en forma entera; en casos contados, podrán presentarse con un decimal y, muy pocas veces, con dos o más decimales. Es un error querer manipular los porcentajes como si fueran números absolutos, es decir, no pueden sumarse, promediarse o combinarse cuando se han obtenido de bases diferentes.

Ejemplo: Se quiere calcular el porcentaje del gasto promedio de la educación superior de las tres generaciones, con los datos de la figura 1.6. Sin embargo, si se quiere encontrar el porcentaje del gasto promedio en educación superior de las tres generaciones a partir de la figura 1.6, se estaría cometiendo un error, ya que este promedio representaría: 13.1% 1 14.5% 1 15.8% 5 14.46% 3 Cuando en realidad el gasto promedio en las tres generaciones es de:  20 930 1 23 224 1 25 350   159 253 1 160 029 1 160 274  (100 ) 5 14.49% Recordemos que sólo pueden sumarse, promediarse, etcétera, los números absolutos (no los porcentajes), por esta razón el resultado verdadero del porcentaje del gasto promedio de la educación superior de las tres generaciones es 14.49%.

29

30

Estadística para Administración

Cálculo de porcentajes en cuadros estadísticos Al elaborar cuadros estadísticos se busca generalmente establecer un tipo de relación entre dos o tres características objeto de una investigación; por ejemplo, comparar la afiliación a partido político y nivel de ingresos; delincuencia y zona de la ciudad; carrera universitaria y género; votación y género; trabajo y género, etcétera. En todos estos ejemplos se quiere saber si existe algún tipo de relación entre estas variables, o bien, establecer si no la hay. El investigador o el estudioso deben establecer, en primer término, independientemente de la relación objeto de estudio, el sentido en que se calcularán los porcentajes en el cuadro estadístico, y para ello deberá tomar en cuenta la siguiente regla: Los porcentajes deben calcularse en el sentido del factor que se considera como la causa.

Ejemplo: Si consideramos que el tipo de escuela (pública o privada) es la causa que da origen a la elección de un determinado tipo de institución de educación superior, entonces se calculan los porcentajes en el sentido del factor tipo de escuela (cuadro 1.16). Cuadro 1.16. Número de instituciones de educación superior por tipo de escuela, 2003, México Instituciones Centros Colegios Escuelas Institutos Universidades Total

Públicas 112 21 255 333 324 1 045

Privadas 383 57 229 441 429 1 539

Total 495 78 484 774 753 2 584

Fuente: Elaboración del Centro de Investigaciones Interdisciplinarias en Ciencias y Humanidades, UNAM (2003), con datos de ANUIES.

Los resultados del cálculo se muestran en el cuadro 1.17. Cuadro 1.17. Número de instituciones de educación superior por tipo de escuela, 2003, México. (%) Instituciones Centros Colegios Escuelas Institutos Universidades Total

Públicas 10.7 2.0 24.4 31.9 31.0 100

Privadas 24.9 3.7 14.9 28.6 27.9 100

Total 19.2 3.0 18.7 30.0 29.1 100

Fuente: Elaboración del Centro de Investigaciones Interdisciplinarias en Ciencias y Humanidades, UNAM (2003), con datos de ANUIES.

Get in touch

Social

© Copyright 2013 - 2025 MYDOKUMENT.COM - All rights reserved.