DISEÑO DE ENCUESTAS, MUESTREO Y SESGO

DISEÑO DE ENCUESTAS, MUESTREO Y SESGO 4.1.1 – 4.1.3 En muchas situaciones, es necesario que los datos de las muestras estimen características (parám

0 downloads 99 Views 241KB Size

Recommend Stories


ENCUESTAS Y RESULTADOS ELECTORALES
Este País 29 Agosto 1993 ENCUESTAS Y RESULTADOS ELECTORALES La crisis por la que atraviesa el sistema electoral mexicano podría resumirse en una exp

DATA Encuestas y Estudios
ENCUESTA ELECTORAL (1) DATA Encuestas y Estudios www.dataencuestas.com FICHA TECNICA FICHA TECNICA del ESTUDIO UNIVERSO (MARCO MUESTRAL) DATA E

Muestreo y estimación
Muestreo y estimación B ENITO J. G ONZÁLEZ RODRÍGUEZ ([email protected]) D OMINGO H ERNÁNDEZ A BREU ([email protected]) M ATEO M. J IMÉNEZ PAIZ (mjimenez@ull

Story Transcript

DISEÑO DE ENCUESTAS, MUESTREO Y SESGO

4.1.1 – 4.1.3

En muchas situaciones, es necesario que los datos de las muestras estimen características (parámetros) de grandes poblaciones. Esto puede deberse a que la población es demasiado grande para permitir que se recolecten datos de cada sujeto. Una encuesta de opinión nacional sobre un tema político es un ejemplo en el que se requerirían datos de muestras. A veces, el acto de recabar los datos destruye el objeto de estudio, como en el caso de las pruebas de choque de automóviles. Comprensiblemente, para obtener resultados confiables, es menester minimizar las fuentes de sesgo. La selección aleatoria de sujetos se utiliza para reducir el sesgo en estudios estadísticos. El problema 4-3 explica los tipos de sesgos que se encuentran dentro de las preguntas de encuestas. Para obtener información adicional, consulta el recuadro de Apuntes de matemáticas de la Lección 4.1.1.

Ejemplos Determina si cada situación describe una muestra o un censo. Si la situación describe una muestra, discute la técnica de muestreo y las fuentes potenciales de sesgo. a.

El Jefe de Policía llama a sus cinco oficiales más nuevos para obtener su opinión sobre los nuevos requisitos de ascenso en todo el departamento. Respuesta: El Jefe está utilizando una muestra, que probablemente no es representativa de la población afectada por los nuevos requisitos. Los oficiales más nuevos probablemente deseen complacer al Jefe y lo secundarían en su apoyo o rechazo de los nuevos requisitos.

b.

Un gerente compara los totales de ventas anuales de 12 tiendas para clasificar sus rendimientos. Respuesta: Esto es un censo. El gerente tiene información de las 12 tiendas que desea comparar.

c.

Se invita a los compradores a llenar un cuestionario en la caja registradora sobre su experiencia de compras. La gerente de la tienda usa los resultados en un informe que presenta a las oficinas centrales corporativas para demostrar el nivel de satisfacción de los clientes en su tienda. Respuesta: La gerente está usando una muestra de respuesta voluntaria (o “muestra por conveniencia”) que no representaría muy bien a todos los clientes. Una muestra como esta tiende a sobre-representar a aquellos con las opiniones más fuertes.

d.

El consejo estudiantil está intentando determinar cuánto espacio se necesitará para el baile de graduación. Carmine, la Presidenta de Tercer Año de Secundaria, recorre su escuela durante la hora del almuerzo con una carpeta sujetapapeles preguntando: “¿Planeas ir al mejor baile de graduación de toda la historia?”. Respuesta: Carmine no está tomando una muestra aleatoria. Es más probable que le hable a los alumnos que conoce, y ellos, como grupo, probablemente estén sesgados con respecto al baile. También puede haber un fuerte deseo de complacer a la entrevistadora en esta situación. La redacción de la pregunta misma está sesgada, dado que usa la frase “el mejor baile de graduación de toda la historia” para describir la fiesta.

© 2015 CPM Educational Program. All rights reserved.

Core Connections en español, Matemática Integrada III

Capítulo 4

Problemas Determina si cada situación describe una muestra o un censo. Si es una muestra, analiza la técnica de muestreo y las potenciales fuentes de sesgo. 1.

Un maestro de matemáticas desea determinar si tocar música clásica durante las examinaciones beneficia a los alumnos de matemáticas de la escuela secundaria. Toca música clásica en la mitad de sus clases mientras toma la prueba, y luego compara los puntajes con los de la otra mitad de las clases, que realizaron la prueba sin música.

2.

Un reportero de noticias deportivas quiere conocer la cantidad de victorias y derrotas del equipo de lacrosse femenino de la escuela secundaria local, de modo que consulta el sitio web de la liga y observa que han ganado 8 veces y han perdido 5.

3.

Un fabricante de baterías quiere monitorear la durabilidad y la tensión pico de sus productos. Se programa una máquina para que seleccione cada 1000º batería de la línea de producción y la someta a una serie de pruebas.

4.

Scott está preparando un informe sobre los factores de riesgo que favorecen al cáncer. Les hace las siguientes preguntas a todos los alumnos de su clase de educación física: “¿Tienes antecedentes familiares de cáncer?” “¿Comes cinco porciones de frutas y verduras por día?”.

Respuestas 1.

Dado que el maestro de matemáticas está usando sus datos para realizar un enunciado sobre todos los alumnos de matemáticas de la escuela secundaria (la población), sus clases representan una muestra de esos alumnos. Sus alumnos tendrían muchas cosas en común, como el lugar de residencia y la educación que reciben, que otros alumnos de matemáticas de escuelas secundarias no tienen. Estos alumnos constituirían una pobre representación de la población. El maestro puede también estar sesgado al momento de puntuar los exámenes para obtener los resultados que desea.

2.

Esto es un censo. El reportero tiene acceso a los resultados de todos los partidos del equipo que está investigando y no está usando la información para sacar conclusiones sobre otros equipos o sobre el lacrosse en general.

3.

Las baterías sometidas a prueba representan una muestra de todas las que se fabrican. Pueden constituir una representación razonable de la población de baterías. Sin embargo, si la batería 1000º se fabrica generalmente a la misma hora todos los días, o si se determina esta condición sobre la base de alguna otra variable como el mantenimiento periódico de la máquina, la muestra puede estar sujeta a sesgos.

4.

La clase de educación física de Scott representa una muestra de personas o alumnos. Sin embargo, esta es una muestra por conveniencia y no puede considerarse una representación confiable de la población de personas o alumnos. El orden de la pregunta puede generar sesgos en los resultados dado que las personas a las que se les menciona una enfermedad como el cáncer probablemente deseen parecer suficientemente interesadas en tener una dieta saludable con muchas frutas y vegetales. Además, los miembros de una clase de educación física pueden estar más inclinados a pensar en aspectos de su salud, como por ejemplo en una dieta.

Guía para padres con práctica adicionales

© 2015 CPM Educational Program. All rights reserved.

CÓMO PROBAR LA CAUSA Y EL EFECTO CON EXPERIMENTOS Y CONCLUSIONES A PARTIR DE ESTUDIOS OBSERVACIONALES 4.2.1 y 4.2.2 Dos formas de recabar información para estudios estadísticos son los estudios observacionales y los experimentos. El objetivo de los estudios observacionales consiste en recolectar datos sobre sujetos sin cambiarlos, mientras que los experimentos imponen tratamientos (variables de interés) a los sujetos. Los estudios observacionales son generalmente más fáciles de llevar a cabo pero no pueden demostrar relaciones de causa y efecto porque no es posible separar los muchos efectos de las variables latentes (aquellas que no son parte de lo que se está observando directamente). Para obtener información adicional, consulta el recuadro de Apuntes de matemáticas de la Lección 4.2.1.

Ejemplos Realiza las siguientes consignas para cada una de las siguientes preguntas:

a.



¿Tiene más sentido en esta situación un censo o una muestra?



¿Debería realizarse un estudio observacional o experimento para responder la pregunta?



Si resulta apropiado un estudio observacional y se necesita realizar una asociación entre variables, analiza los efectos de posibles variables latentes.



Si resulta apropiado un experimento, esboza un diseño experimental. ¿El consumo de té verde está relacionado con la longevidad? Respuesta: Dado que sería imposible hallar a cada consumidor de té verde, este estudio tendría que realizarse mediante un muestreo. El té verde no sería un tratamiento difícil de administrar en un experimento pero dado que se están midiendo los años de vida, sería poco práctico realizar un experimento. Un estudio observacional podría determinar una relación entre estas dos variables pero no podría establecer la causa y el efecto debido a las muchas posibles variables latentes. Quizá las personas que eligen beber té verde también eligen ser más conscientes sobre su salud de otras maneras, como por ejemplo fumando menos que la población en general. También puede que tiendan a tener ingresos más altos y mejor atención médica. Por ello, las causas de su longevidad podrían en realidad relacionarse con el hecho de fumar menos y de tener una mejor atención médica, y no con el hábito de beber té verde.

b.

¿Cuál es el puntaje promedio de expresión oral del examen SAT en el estado de Colorado para un año determinado? Respuesta: Esta información se puede encontrar fácilmente mediante un censo.

© 2015 CPM Educational Program. All rights reserved.

Core Connections en español, Matemática Integrada III

Capítulo 4

c.

¿Qué porcentaje de almejas navaja muestra signos de estrés causado por la acidificación del océano? Respuesta: No sería posible hallar todas las almejas navaja para estudiarlas y evaluar su estrés podría dañarlas, de modo que lo apropiado sería usar una muestra. Sería importante recolectar almejas navaja en diferentes lugares dado que las condiciones ambientales podrían variar considerablemente.

d.

¿Una iluminación más fuerte de los salones de clase incrementaría los puntajes de las pruebas? Respuesta: Esto requeriría usar una muestra de alumnos en un experimento controlado. Se podrían tomar alumnos voluntarios y darles la misma instrucción sobre un tema, para luego asignarles aleatoriamente salones de clase con diferentes grados de iluminación para la misma prueba. Luego, podrían compararse los puntajes promedio de las pruebas de cada grupo.

Problemas Realiza las siguientes consignas para cada una de las siguientes preguntas: •

¿Tiene más sentido en esta situación un censo o una muestra?



¿Debería realizarse un estudio observacional o experimento para responder la pregunta?



Si resulta apropiado un estudio observacional y se necesita realizar una asociación entre variables, analiza los efectos de posibles variables latentes.



Si resulta apropiado un experimento, esboza un diseño experimental.

1.

¿Existe una relación entre la temperatura del agua y su resistencia eléctrica?

2.

¿Cuál es la distancia media que viajan los alumnos en tu país para ir a la escuela?

3.

¿Qué porcentaje de choques automovilísticos que provocaron lesiones a personas ocurrieron cuando al menos uno de los conductores había consumido drogas o alcohol?

4.

¿Existe una asociación entre la calvicie y el daltonismo?

Guía para padres con práctica adicionales

© 2015 CPM Educational Program. All rights reserved.

Respuestas 1.

En este caso habría que trabajar con muestras de agua. Esta pregunta podría responderse mejor como un experimento. Comienza con agua de la misma fuente de modo que sus otras variables, tales como las impurezas, se mantengan constantes, y distribúyela en varios contenedores similares. Asigna aleatoriamente diferentes temperaturas a los contenedores de agua y mide la resistencia eléctrica entre dos cables insertados a una distancia igual en cada contenedor, y luego compara los resultados.

2.

En la mayoría de los condados, encuestar a cada alumno sobre las distancias de viaje no es posible, de modo que podría usarse una muestra aleatoria de alumnos para representar la población. Esto es claramente un estudio observacional porque la pregunta busca determinar cómo viajan los alumnos sin imponerles cambios de ningún tipo.

3.

Este tipo de información se recoge rutinariamente porque la ley así lo establece, de modo que probablemente haya datos de censo disponibles.

4.

Este estudio requeriría muestras de la población. Un estudio observacional es la única alternativa razonable porque un experimento requeriría imponerles la calvicie o el daltonismo a los sujetos. Una variable latente aquí es el género. Los hombres a menudo tienden a padecer más el daltonismo y la calvicie que las mujeres; de modo que si el estudio incluyera ambos géneros, probablemente se establecería una asociación.

© 2015 CPM Educational Program. All rights reserved.

Core Connections en español, Matemática Integrada III

Capítulo 4

HISTOGRAMAS DE FRECUENCIA RELATIVA

4.3.1

Cuando las frecuencias (números o valores) listados en una tabla de frecuencia se dividen por el número total de puntos de datos, las frecuencias se convierten en razones, y la tabla de frecuencia se convierte en una tabla de frecuencia relativa. Los histogramas muestran la información de las tablas de frecuencia y los histogramas de frecuencia relativa exhiben información obtenida de tablas de frecuencia relativa. Nota: para muchas de estas lecciones se requiere el uso de una calculadora gráfica. Pueden encontrarse las instrucciones para usar una calculadora TI-83+/TI-84+ en cpm.org.

Ejemplo 1 Se entrevistaron cuarenta postulantes para un puesto de asistente administrativo. A cada postulante se le dio una prueba de mecanografía y cada uno obtuvo una puntuación según las palabras por minuto (ppm) tipeadas. Sus resultados se muestran en la siguiente tabla. 48 49 64 75 64

57 69 71 76 53

65 73 68 63 65

71 45 60 65 69

53 53 85 57 56

67 42 61 39 69

68 53 58 53 41

49 51 54 63 69

a.

Crea una tabla de frecuencia, un histograma, una tabla de frecuencia relativa, y un histograma de frecuencia relativa.

b.

¿Qué porcentaje de postulantes tipeó de 40 a 49 ppm?

c.

¿Qué porcentaje de postulantes tipeó al menos 60 ppm?

d.

Si 50 ppm es el requisito mínimo para el trabajo, ¿qué porcentaje de postulantes no pasó la prueba?

Respuestas: ppm

frecuencia

frecuencia relativa

a.

30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 a 89 total

1 6 11 16 5 1 40

1/40 = 0.025 6/40 = 0.15 11/40 = 0.275 16/40 = 0.40 5/40 = 0.125 1/40 = 0.025 1.00

Frecuencia 16

Histograma

12

0.3

8

0.2

4

0.1

0 30 40 50 60 70 80 90 Puntaje de tipeo (ppm)

b.

15% (del histograma o la tabla de frecuencia relativa)

c.

0.40 + 0.125 + 0.025 = 0.55 = 55%

d.

0.025 + 0.15 = 0.175 = 17.5%

Guía para padres con práctica adicionales

Frecuencia Histograma de relativa frecuencia relativa 0.4

0 30 40 50 60 70 80 90 Puntaje de tipeo (ppm)

© 2015 CPM Educational Program. All rights reserved.

Ejemplo 2 Se tomó una muestra aleatoria de 35 automóviles de una agencia de alquiler de automóviles, y se midió la distancia recorrida en carreteras por cada auto en millas por galón (mpg). 33 42 29 39 37

37 36 41 41 38

40 36 35 32 37

40 35 40 33 37

36 40 26 28 25

37 27 37 36 38

34 43 41 37 41 Total: 1264

a.

Usa una calculadora y determina la media y la desviación estándar de esta muestra de automóviles.

b.

Crea una tabla de frecuencia relativa y un histograma de frecuencia relativa para los datos. Comienza tu tabla en 24 mpg y usa intervalos de 3 mpg.

c.

La agencia de alquiler de automóviles publicita que su flota de automóviles compactos alcanza al menos las 30 mpg. ¿Qué porcentaje de la muestra no cumple con este estándar?

d.

¿Qué intervalo contendría al automóvil mediano?

e.

El Estado otorga una calificación “estrella de oro” a los automóviles que obtienen un mínimo de 39 mpg. ¿Qué porcentaje de automóviles en la muestra lograron esta calificación?

Respuestas:

frecuencia

frecuencia relativa

b.

media ≈ 36.11 mpg, desviación estándar de la muestra ≈ 4.626 mpg millas recorridas en carreteras (mpg)

a.

24 hasta 27 27 hasta 30 30 hasta 33 33 hasta 36 36 hasta 39 39 hasta 42 39 hasta 45 total

2 3 1 5 13 9 2 35

2/35 = 0.0571 3/35 = 0.0857 1/35 = 0.0286 5/35 = 0.1429 13/35 = 0.3714 9/35 = 0.2571 2/35 = 0.0571 1.00

frecuencia relativa 0.4

Histograma de frecuencia relativa

0.3 0.2 0.1 0

24 27 30 33 36 39 42 45 Millas recorridas en carreteras (mpg)

c.

0.0571 + 0.0857 = 0.1428 = 14.28%

d.

Contando los automóviles desde cualquiera de los extremos de la distribución de millas recorridas, hallarías que el automóvil 18º estaría en el medio. El automóvil 18º también estaría en el grupo de 36 hasta 39 mpg.

e.

0.2571 + 0.0571 = 0.3142 = 31.42%

© 2015 CPM Educational Program. All rights reserved.

Core Connections en español, Matemática Integrada III

Capítulo 4

FUNCIÓN DE DENSIDAD DE PROBABILIDAD NORMAL Y PERCENTILES

4.3.2 y 4.3.3

Existen muchas situaciones en las que un histograma de frecuencia relativa se parecerá mucho a una curva con forma de campana. A veces, una ecuación llamada función de densidad de probabilidad normal se ajusta al histograma de frecuencia relativa con forma de campana. Esta función se denomina comúnmente distribución normal y puede utilizarse para determinar porcentajes y probabilidades asociadas con lo que se está midiendo. La función de densidad de probabilidad normal también se usa para calcular percentiles. Los percentiles identifican la medición debajo de la cual se encuentra un porcentaje especificado de puntos de datos. Por ejemplo, si el percentil 90 de la altura de los hombres fuera de 72 pulgadas, el 90% de los hombres mediría menos de 72 pulgadas. Para obtener información adicional, consulta el recuadro de Apuntes de matemáticas de la Lección 4.3.3.

Ejemplo 1 En una planta de embotellamiento, se llenan con bebida cola botellas de refresco de medio litro. El equipo utilizado para llenar las botellas no es capaz de colocar exactamente 500 ml en cada botella, de modo que se lo ajusta para que la cantidad de cola colocada en las botellas siga una distribución normal con una media de 502 ml y una desviación estándar de 1.8 ml. a.

¿Qué proporción de botellas contendrá más de 502 ml de bebida cola?

b.

¿Qué proporción de botellas contendrá entre 500 y 502 ml?

c.

¿Qué proporción de botellas tendrá menos contenido (menos de 500 ml)?

d.

¿A qué percentil corresponden 503 ml?

e.

¿A qué percentil corresponden 505 ml?

Respuestas: a.

normalcdf(502, 10^99, 502, 1.8) = 0.500 Se puede reconocer que 502 ml es la media y que la mitad (0.500) de la probabilidad en una distribución normal siempre está por encima y por debajo de la media.

b.

normalcdf(500, 502, 502, 1.8) ≈ 0.367

c.

normalcdf(–10^99, 500, 502, 1.8) ≈ 0.133

d.

normalcdf(–10^99, 503, 502, 1.8) ≈ 0.711 o el percentil 71.

e.

normalcdf(–10^99, 505, 502, 1.8) 0.952 o el percentil 95.

Guía para padres con práctica adicionales

© 2015 CPM Educational Program. All rights reserved.

Ejemplo 2 Los cerezos comerciales producen fruta según una distribución normal con un promedio de 90 kg de cerezas por árbol y una desviación estándar de 11 kg por árbol. a.

¿Cuál es la probabilidad de que un cerezo produzca al menos 95 kg de cerezas?

b.

¿Cuál es la probabilidad de que un cerezo produzca entre 85 y 105 kg de cerezas?

c.

¿En qué percentil se encontraría la cosecha de 80 kg de un único cerezo?

Respuestas: a.

normalcdf(95, 10^99, 90, 11) ≈ 0.325

b.

normalcdf(85, 105, 90, 11) ≈ 0.589

c.

normalcdf(–10^99, 80, 90, 11) ≈ 0.182 o el percentil 18.

Problemas 1.

Se carga concreto en camiones para un gran proyecto de construcción según una distribución normal. La cantidad media que se carga es de 230 pies cúbicos con una desviación estándar de 7 pies cúbicos. Los camiones de concreto se califican sobre la base del número de yardas cúbicas que pueden transportar, y 9 yardas cúbicas es una carga máxima común. De ahí surgió la expresión en inglés “the whole nine yards” (“las nueve yardas completas” o “toda la carga”). a.

¿Qué proporción de camiones se cargará con entre 220 y 240 pies cúbicos?

b.

¿Qué proporción de camiones se cargará con más concreto que el máximo de 9 yardas cúbicas? (3 pies = 1 yarda)

c.

¿Qué percentil de carga representan 235 pies cúbicos?

d.

Si un trabajo en particular requiere al menos 220 yardas cúbicas de concreto, ¿cuál es la probabilidad de que no sea suficiente la carga de concreto de un solo camión?

© 2015 CPM Educational Program. All rights reserved.

Core Connections en español, Matemática Integrada III

Capítulo 4

2.

Supón que la nieve caída anualmente en el pueblo de Thalhammer sigue una distribución normal con una media de 185 cm y una desviación estándar de 36 cm. a.

En Thalhammer, si caen menos de 100 cm de nieve en un año se considera que las condiciones son de sequía. ¿Cuál es la probabilidad de que un año en particular haya sequía?

b.

Rivera Valley se encuentra cuesta abajo de Thalhammer. A los habitantes de Rivera Valley se les da un alerta de inundación por derretimiento de nieve durante la primavera si la caída de nieve anual en Thalhammer supera los 250 cm. ¿Cuál es la probabilidad de que los habitantes de Rivera Valley reciban un alerta de inundaciones esta primavera?

c.

¿A qué percentil corresponde una caída de nieve anual de 160 cm en Thalhammer?

Respuestas 1.

2.

a.

normalcdf(220, 240, 230, 7) ≈ 0.847

b.

(3 pies)(3 pies)(3 pies) = 27 pies3, o sea, 27 pies cúbicos por yarda cúbica. (9)(27) = 243 pies cúbicos normalcdf(243, 10^99, 230, 7) ≈ 0.032

c.

normalcdf(–10^99, 235, 230, 7) ≈ 0.762 o el percentil 76.

d.

normalcdf(–10^99, 220, 230, 7) ≈ 0.077

a.

normalcdf(–10^99, 100, 185, 36) ≈ 0.0091

b.

normalcdf(250, 10^99, 185, 36) ≈ 0.035

c.

normalcdf(–10^99, 160, 185, 36) ≈ 0.244 o el percentil 24.

Guía para padres con práctica adicionales

© 2015 CPM Educational Program. All rights reserved.

PRÁCTICA PARA LOS EXÁMENES SAT 1.

a. 2.

14

b.

15

c.

20

d.

l

D

En el rectángulo ABCD de la derecha, el área de la región sombreada está dada por π6lw . Si el área de la región sombreada 7π, ¿cuál es el área total, redondeada al número entero más cercano, de las regiones no sombreadas del rectángulo ABCD?

C w l

A

22

B

e.

25

a = p3 – 0.61 b = p2 – 0.61 c = (p – 0.61)2

Considera las siguientes ecuaciones:

Si p es un entero negativo, ¿cuál es el orden de a, b, y c de menor a mayor? a. 3.

5.

b.

a

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.