Story Transcript
CURSO DE MÉTODOS CUANTITATIVOS I TEMA VI: INTRODUCCIÓN AL MUESTREO
Ing. Francis Ortega, MGC
Concepto de Población y Muestra POBLACIÓN (N)
Es el conjunto de todos los elementos de interés en un estudio determinado. Hay dos tipos de poblaciones: finitas e infinitivas, según tengan un número limitado o ilimitado de elementos.
MUESTRA (n)
Es un subconjunto de la población, empleda para el estudio estadístico y cuyos resultados son usados como base para describir, estimar o predecir el comportamiento de una población.
Concepto de Población y Muestra CENSO
ENCUESTA MUESTRAL
Proceso de estudio para recolectar datos de toda una población.
Proceso de efectuar un estudio para recolectar datos de una muestra.
PARÁMETRO
ESTADÍSTICO O ESTADÍGRAFO
Valor obtenido para describir de una forma sumaria las características de una población. Por ejemplo, µ = media poblacional, π = proporción poblacional
Valor obtenido para describir las características de una muestra. Por ejemplo, X = media muestral, p = proporción muestral
¿Por qué se toman muestras?
Escasez de recursos (dinero, tiempo, personas, medios tecnológicos, etc.)
Pruebas destructivas
Datos limitados
Estimación Los resultados muestrales solo proporcionan una estimación de los valores de las características de la población. Por ejemplo, Utilizamos Utilizamos
Error en una encuesta
Errores no muestrales Errores de medición (por ejemplo en los cuestionarios), errores del entrevistador, errores en la selección de la muestra (los cuales producen sesgo), errores de procesamiento. Es posible minimizar estos errores a través de una planeación cuidadosa, una capacitación adecuada de los entrevistadores, un buen diseño del cuestionario y un buen procesamiento de la información.
Error de Muestreo Es la diferencia entre parámetro poblacional y el estadístico de la muestra para estimar el parámetro.
En la práctica no es posible determinar el error muestral (porque no es posible conocer la media poblacional), pero sí es posible dar una estimación probabilística acerca del tamaño del error muestral.
Error de Muestreo El error de muestreo es un valor arbitrario, generalmente establecido por los investigadores o encargados del estudio. Para variables cualitativas, por ejemplo estudios en los cuales se desea conocer la opinión de personas sobre determinados asuntos, suele utilizarse un valor para E de 5% (0.05). Un error mayor a 5% se considera que no es bueno. Para variables cuantitativas, el error dependerá del orden de magnitud de los datos y de la criticidad del trabajo. Deberá expresarse en la misma unidad de medida de la variable objeto de estudio.
Sesgo en una muestra
Error de sesgo o de selección Se produce si alguno de los miembros de la población tiene más probabilidad que otros de ser seleccionados. Por ejemplo, si en una encuesta política nacional se escogen más personas de una localidad en la que se conoce que hay una marcada preferencia por un determinado partido. Una forma de evitar este tipo de error es tomar la muestra de manera que todos sus elementos tengan la misma probabilidad de ser seleccionados (Representativa).
Sesgo en una muestra
Error o sesgo por no respuesta Es posible que algunos elementos de la población no quieran o no puedan responder a determinadas cuestiones. O también puede ocurrir, cuando tenemos cuestionarios de tipo personal, que algunos miembros de la población no contesten sinceramente. Estos errores son, en general, difíciles de evitar, pero en el caso de la sinceridad, se suelen incorporar cuestiones (preguntas filtro o preguntas control) para detectar si se está contestando sinceramente.
Técnicas de Muestreo Hay cuestiones que debemos especificar a la hora de elegir una muestra:
El método de selección de los individuos de la población (tipo de muestreo que se va a utilizar). El tamaño de la muestra. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una estimación del error que vamos a cometer (en términos de probabilidad).
Proceso de Muestreo 1. Determinar y delimitar la población a estudiar. 2. Determinar el tipo de población y de variable objeto del estudio. 3. Determinar el tipo de muestreo a utilizar. 4. Establecer el error de muestreo a utilizar y los demás componentes del diseño muestral. 5. Determinar el tamaño de la muestra. 6. Seleccionar las unidades muestrales.
Tipos de Muestreo
Muestreos Probabilísticos Permiten calcular la probabilidad de obtener cada una de las posibles muestras. Se utiliza cuando el investigador desea calcular la precisión de las estimaciones.
Muestreos No Probabilísticos Mediante estos métodos de muestreo no es posible determinar la precisión de las estimaciones.
Muestreos Probabilísticos
Muestreo Aleatorio Simple En general, en el muestreo aleatorio simple cada elemento de la población tiene la misma probabilidad de ser seleccionado en la muestra. Por lo regular, en poblaciones finitas se utilizan números aleatorios para elegir las unidades muestrales, mientras que en las infinitas es necesario diseñar un procedimiento para cada situación que garantice: 1.
Que cada uno de los elementos seleccionados proviene de la población.
2.
Que cada elemento de la muestra se seleccione de independientemente.
Muestreos Probabilísticos
Muestreo Aleatorio Estratificado En este tipo de muestreo los elementos de la muestra se dividen primero en grupos, a los que se les llama estratos, de manera que cada elemento aparezca en uno y solo un estrato. La determinación de los estratos está a discreción de la persona que diseña la muestra. Por lo general, se obtienen mejores resultados cuando los elementos que forman un estrato son lo más parecido posible. Ejemplo de estratos, puede ser el sexo de los consultados, la edad, el tipo de industria, la carrera que estudia, etc.
Muestreos Probabilísticos
Muestreo Sistemático Se utiliza para poblaciones grandes, en las que se hace difícil hacer un muestreo aleatorio simple. Consiste en seleccionar aleatoriamente el primer elemento de la muestra y los demás se escogerán de acuerdo a la siguiente razón, a partir del primer elemento elegido: K = N/n Se requiere de un listado de los elementos de la población para utilizar este tipo de muestreo. Se sugiere un orden aleatorio para los elementos listados.
Muestreos Probabilísticos
Muestreo por Conglomerados En este tipo de muestreo los elementos de la muestra se dividen primero en grupos separados, llamados conglomerados. Cada elemento de la población pertenece a uno y solo un conglomerado. Se toma una muestra aleatoria simple de los conglomerados. Este muestreo tiende a arrojar mejores resultados cuando los elementos en cada conglomerado no son semejantes, es decir, cuando el conglomerado se comporta como la población. Por ejemplo: muestreo por áreas (ciudades, manzanas), muestreo de estudiantes por grupo de asignatura, etc.
Muestreos No Probabilísticos
Muestreo por Conveniencia En este tipo de muestreo las unidades se toman en la muestra por su accesibilidad o porque es la única alternativa práctica. Con este muestreo es imposible estimar la bondad de los estadísticos muestrales. Ej. Muestrear un cargamento de naranjas.
Muestreo Subjetivo En esta técnica, una persona con conocimientos en la materia de estudio, selecciona las unidades muestrales que considera más representativas. Ej. Un profesor elije varios estudiantes a su criterio para representar un curso.
Delimitación de la Población La población objetivo es la población acerca de la cual se desea hacer inferencias, mientras que la población muestreada es de la que realmente se toma la muestra. Estas dos poblaciones no tienen porque ser las mismas. Las conclusiones de la población muestreada se podrán ampliar a la población objetivo solo si existe suficiente semejanza respecto a la característica de interés, es decir, las conclusiones obtenidas a partir de una muestra serán válidas si la población muestreada es representativa de la población objetiva.
Tipo de población y de variable POBLACIÓN
Finita
VARIABLE
Poblaciones cuyo tamaño es conocido y se pueden obtener listados de los elementos.
Cuantitativa Se estudian variables para las cuales es posible calcular medidas como la media, la desviación estándar, etc.
Infinita Procesos continuos en el que es imposible contar o enumerar los elementos de la población: clientes que entran a las tiendas, partes fabricadas en una línea de producción, etc.
Cualitativa Se estudian las variables a través de proporciones o de porcentajes, por ejemplo, niveles de satisfacción, preferencia de marca, etc.
Tamaño de la Muestra Población Finita y Variable Cualitativa
Población Infinita y Variable Cualitativa
Población Finita y Variable Cuantitativa
Población Infinita y Variable Cuantitativa
En las fórmulas se puede utilizar “p” en caso de
y “S” en lugar de
Consideraciones de la muestra
En las fórmulas, E es el error de muestreo, es decir, la diferencia en valor absoluto entre el parámetro y el estadístico. En variables cualitativas generalmente se usa un 5%. En las fórmulas, Z es el coeficiente de confiabilidad y representa la probabilidad de que el error de muestreo no sobrepase el valor previamente fijado. Por tanto, este coeficiente determina el grado de fiabilidad de las conclusiones. Por lo general, suele utilizarse una confiabilidad de 95%, por lo que Z = 1.96.
Consideraciones de la muestra
Teóricamente, si los parámetros considerados en las desconocidos, para determinar el tamaño muestral hacer antes una premuestra o muestra piloto razonable (n ≥ 30) para estimar a (en el caso cuantitativas) y a (variables cualitativas).
fórmulas son es necesario de tamaño de variables
No obstante, en el caso de las variables cualitativas se puede asumir un valor de 0.5 (50%) para la proporción, lo que garantizará un tamaño de muestra máximo, aunque no necesariamente óptimo. En el caso de las variables cualitativas, es necesario realizar la premuestra.
Ejemplos 1. Un fabricante de reproductores de discos compactos desea estimar el tamaño promedio de la pieza con una confiabilidad de 95%. Una muestra piloto ha revelado una desviación estándar de 6 mm. ¿Cuál debería ser el tamaño de la muestra, si el fabricante tolera un error de 2 mm? Solución: La población es infinita (proceso continuo) y la variable cuantitativa (tamaño de un pieza en mm). S = 6 mm, Z = 1.96 (porque la confiabilidad es de 95%), E = 2 mm.
Ejemplos 2. Francis Ortega se está postulando para senador de Santiago. El desea estimar el porcentaje de personas que votaran por él, con un error de un 1% y un 95% de confianza en sus hallazgos. ¿Cuántas personas debería encuestar? Solución: La población es infinita y la variable cualitativa (porcentaje de votantes a favor). Z = 1.96 (porque la confiabilidad es de 95%), E = 1%, p = 50% o 0.5 (recordar que asumimos el 50% para evitar hacer una muestra piloto. El tamaño resultante es máximo.)
Nota: este es el valor correcto.
Ejemplos 3. Un estudiante de la PUCMM desea hacer un estudio sobre el rendimiento académico de los estudiantes de Ingeniería de Sistemas. Considerando que la cantidad de estudiantes de dicha carrera es de 296, ¿Cuál es el tamaño de la muestra que debería utilizar si desea tener un nivel de confianza de 95% en sus conclusiones y en un error de muestreo de un 5%? Solución: La población es finita (296 estudiantes), la variable cualitativa (rendimiento académico de los estudiantes). Z = 1.96 (porque la confiabilidad es de 95%), E = 5%, p = 50% o 0.5 (recordar que asumimos el 50% para evitar hacer una muestra piloto. El tamaño resultante es máximo.)
Ejemplos Continuación de la Solución:
Se deben encuestar 167 estudiantes.
Sample Size Calculator en Internet
http://www.surveysystem.com/sscalc.htm
Tamaño de Muestra Vs. Error de Muestreo Existe una relación inversa entre el tamaño de la muestra y el error de muestreo, por lo que, al aumentar el error de muestreo disminuye el tamaño de la muestra y viceversa. En otras palabras, a menor error, mayor tamaño de muestra. Estudio sobre Calidad del Servicio Gráfico Tamaño de Muestra vs. Margen de Error Estudiantes Campus Santiago N = 9,064 400 Tamaño de Muestra (# de estudiantes)
369
300
259 192
200
148
100
117
95
0 5%
6%
7%
8%
9%
10% Margen de Error
Tamaño de Muestra Vs. Confiabilidad Existe una relación proporcional entre el tamaño de la muestra y el nivel de confianza (que viene dado por Z), por lo que, al aumentar la confiabilidad aumentará el tamaño de la muestra y viceversa. En otras palabras, a mayor fiabilidad mayor tamaño de muestra. Estudio sobre Calidad del Servicio Gráfico Tamaño de Muestra vs. Nivel de Confianza Estudiantes Campus Santiago 800 Tamaño de Muestra (# de estudiantes)
600 400
448 263
279
317
369
619 N = 9,064
200 0 90%
91%
93%
95%
97%
99%
Nivel de Confianza
Tamaño de Población Vs. Tamaño de Muestra
Cuando las poblaciones son pequeñas, el tamaño de muestra tiende a ser alto, por ejemplo, para una población de 100 (con E = 5% y Z = 1.96), el tamaño muestral es de 80. Cuando las poblaciones son grandes, el tamaño de muestra tiende a estabilizarse en un valor determinado, por ejemplo para una población de 10,000 personas (con E = 5% y Z = 1.96) la muestra es de 370, mientras que para una población de 10,000,000 el tamaño muestral es de 384.
Ejemplo de la Estratificación Proporcional Para el ejemplo 3 presentado anteriormente, estratifique la muestra por sexo, considerando que de los 296 estudiantes, 195 son hombres y el resto son mujeres. Solución: Es necesario calcular los porcentajes en que los estratos están representados en la población: Proporción de hombres = 195/296 = 0.6588 Proporción de mujeres = (296-195)/296 = 0.3412 Muestra total = 192 Hombres = 0.6588*192 ≈ 110
Mujeres = 0.3412*192 ≈ 57
Ejemplo de una Muestra Estratificada de forma Proporcional