Muestreo y Distribuciones muestrales. 51 SOLUCIONES

Muestreo y Distribuciones muestrales. 51 Universidad Polit´ ecnica de Cartagena Dpto. Matem´ atica Aplicada y Estad´ıstica M´ etodos estad´ısticos d

1 downloads 121 Views 141KB Size

Recommend Stories


DISTRIBUCIONES MUESTRALES
Distribuciones muestrales DISTRIBUCIONES MUESTRALES Autores: Ángel A. Juan ([email protected]), Máximo Sedano ([email protected]), Alicia Vila (avilag@

PARTE II: MUESTREO CONCEPTOS BÁSICOS MÉTODOS DE MUESTREO NÚMERO DE MUESTRAS DISTRIBUCIONES MUESTRALES
    Contenidos: PARTE I: DISTRIBUCIONES DE PROBABILIDAD .................................................

Tema 6: Distribuciones Muestrales
Tema 6: Distribuciones Muestrales •El objetivo es efectuar una generalización de los resultados de la muestra a la población. Inferir o adivinar el co

ESPACIOS MUESTRALES Y EVENTOS
Probabilidad y Estadística 1 ESPACIOS MUESTRALES Y EVENTOS Definiciones 1. Un experimento aleatorio es aquel que proporciona diferentes resultados

Story Transcript

Muestreo y Distribuciones muestrales.

51

Universidad Polit´ ecnica de Cartagena Dpto. Matem´ atica Aplicada y Estad´ıstica M´ etodos estad´ısticos de la ingenier´ıa Soluciones de la hoja de problemas 5. Muestreo y Distribuciones muestrales.

SOLUCIONES

1. Si llamamos X a la variable contenido en ml de una botella de gaseosa, X sigue una distribuci´on normal de media µ = 298 y desviaci´on t´ıpica σ = 3. a)Nos piden: 295 − 298 295 − 298 X − 298 < ) = P (Z < )= 3 3 3 = φ(−1) = 1 − φ(1) = 0.16 P (X < 295) = P (

P b)Si llamamos X 6 = ( 6i=1 Xi )/6 a la variable contenido promedio de 6 botellas, por las propiedades de la distribuci´on normal, X√ 6 sigue un √ distribuci´on normal de media µX 6 = 298 y desviaci´on t´ıpica σX 6 = σ/ 6 = 3/ 6. Y la probabilidad requerida se calcula a partir de dicha distribuci´on de la siguiente forma: X 6 − 298 295 − 298 295 − 298 √ √ √ < ) = P (Z < )= 3/ 6 3/ 6 3/ 6 = φ(−2.45) = 1 − φ(2.45) = 0.007 P (X 6 < 295) = P (

2. a) Usando las propiedades de la distribuci´on normal, el peso promedio de los tres pesos realizados en el laboratorio, x, suponiendo que se realizan de forma independiente, tendr´a una distribuci´on normal con desviaci´on t´ıpica: √ √ σx = σ/ n = 10/ 3 = 5.77 b)Usando la anterior igualdad: √ √ σx = σ/ n = 10/ n = 5 de donde se deduce n = 4. Hay que repetir la medici´on 4 veces. 3. a)Si el tama˜ no de la muestra n es grande, usando el Teorema Central del Limite, la proporci´on muestral pˆ, seguir´a una distribuci´on aproximadamente normal de

52

Muestreo y Distribuciones muestrales. media p = 0.59 y desviaci´on t´ıpica piden:

√ p(1 − p)/n = 0.4918/ n = 0.028. Nos

p

P (|ˆ p − 0.59| < 0.03) = P (0.59 − 0.03 < pˆ < 0.59 + 0.03) = P (−0.03/0.028 < (ˆ p − 0.59)/0.028 < 0.03/0.028) = 2φ(1.056) − 1 = 0.71 b) Hemos de repetir los calculos del apartado a) sustituyendo el tama˜ no de la muestra n: p √ • Para n = 600 la desviaci´on t´ıpica ser´a p(1 − p)/n = 0.4918/ n = 0.0201, y P (|ˆ p − 0.59| < 0.03) = P (0.59 − 0.03 < pˆ < 0.59 + 0.03) = P (−0.03/0.0201 < (ˆ p − 0.59)/0.0201 < 0.03/0.0201) = 2φ(1.49) − 1 = 0.86 • Para n = 1200 la desviaci´on t´ıpica ser´a y

√ p(1 − p)/n = 0.4918/ n = 0.0142,

p

P (|ˆ p − 0.59| < 0.03) = P (0.59 − 0.03 < pˆ < 0.59 + 0.03) = P (−0.03/0.0142 < (ˆ p − 0.59)/0.0142 < 0.03/0.0142) = 2φ(2.11) − 1 = 0.97 Al aumentar el tama˜ no muestral la varianza de la distribuci´on de la proporci´on muestral disminuye y los valores obtenidos se encuentran m´as concentrados en torno a la media de la poblaci´on con lo que la extrapolaci´on de los resultados a la poblaci´on entera es m´as fiable (la probabilidad de que esten muy cerca ambos valores es mayor). 4. a) Si llamamos X a la variable resultado de la medici´on, X sigue una distribuci´on normal con desviaci´on t´ıpica σ = 0.1 y media µ desconocida. Nos piden:

P (|X − µ| > 0.1) = 1 − P (|X − µ| ≤ 0.1) = 1 − P (−0.1 < X − µ < 0.1) = = 1 − P (−0.1 + µ < X < 0.1 + µ) = 1 − P (−0.1/0.1 < (X − µ)/0.1 < 0.1/0.1) = = 1 − P (−1 < Z < 1) = 1 − (2φ(1) − 1) = 2(1 − φ(1)) = 0.079 Si repetimos la medici´on n = 5 veces, la variable media muestral de las cinco mediseguir´a una distribuci´on ciones, X 5 , por las propiedades de la distribuci´on normal √ normal de media µ y desviaci´on t´ıpica σX 5 = 0.1/ n = 0.045: P (|X 5 − µ| > 0.1) = 1 − P (|X 5 − µ| ≤ 0.1) = 1 − P (−0.1 < X 5 − µ < 0.1) = = 1 − P (−0.1 + µ < X 5 < 0.1 + µ) = 1 − P (−0.1/0.045 < (X 5 − µ)/0.045 < 0.1/0.045) = = 1 − P (−2.24 < Z < 2.24) = 1 − (2φ(2.24) − 1) = 2(1 − φ(2.24)) = 0.025

Muestreo y Distribuciones muestrales.

53

5. Si suponemos que las condiciones son normales y la maquina esta bien ajustada, la proporci´on de piezas defectuosas producidas por la maquina ser´a de p = 0.01. Consideremos el experimento de escoger 100 piezas de la producci´on y sea N el n´ umero de piezas defectuosas en la muestra escogida. Queremos calcular P(N > 2). N sigue una distribuci´on Binomial de par´ametros n = 100 y p = 0.01 si la m´aquina est´a bien ajustada. Por lo tanto P(N > 2) = 1 − (P(N = 0) + P(N = 1) + P(N = 2)) ' 0.08. Si en un dia tres piezas resultan defectuosas, podr´ıamos concluir que la m´aquina no est´a bien ajustada porque en caso de estarlo la probabilidad de obtener m´as de un 2% de piezas defectuosas es muy baja y en ese caso se ha obtenido un 3%. 6. Podemos tomar la l´ınea central µ = 23 y los limites de control para esta gr´afica µ± 3σx = 23 ± 3(0.5)/2 = 23 ± 0.75 suponiendo que la distribuci´on de la temperatura es aproximadamente normal. normal (si n es grande) con media 7. Como x sigue una distribuci´on aproximadamente √ µx = µ y desviaci´on t´ıpica σx = σ/ n, entonces: √ √ P (x > µ + cσ/ n) = 1 − P (x − µ/σ/ n < c) = = 1 − φ(c) = 0.001 de donde se deduce φ(c) = 0.999 y c es el percentil 0.999 de la distribuci´on normal estandar, c = 3.08. Asimismo, haciendo uso de las propiedades de simetr´ıa de la distribuci´on normal: √ √ P (x < µ + cσ/ n) = P (x > µ + cσ/ n) = 0.001

54

Muestreo y Distribuciones muestrales.

Introducci´on a la teor´ıa de la estimaci´on

55

Universidad Polit´ ecnica de Cartagena Dpto. Matem´ atica Aplicada y Estad´ıstica M´ etodos estad´ısticos de la ingenier´ıa Soluciones de la hoja de problemas 6. Introducci´ on a la teor´ıa de la estimaci´ on

h i 1. El intervalo de confianza para la media poblacional es x¯ − z1−α/2 √σn ; x¯ + z1−α/2 √σn . Tenemos x¯ = 166, y α = 0.02, luego necesitamos z0.99 que encontramos en la tabla: z0.99 ' 2.33. Finalmente el intervalo pedido es 164. 06 ≤ µ ≤ 167. 94 o de forma equivalente : µ = 166 ± 1.94.

2. Su respuesta es incorrecta: la afirmaci´on del art´ıculo s´olo concierne el centro, m´as concretamente la media, de la distribuci´on de las alturas en la poblaci´on espa˜ nola mayor de 18 a˜ nos. El nivel de confianza de 95% se refiere a la confianza que tenemos en el m´etodo que hemos utilizado para proporcionar un intervalo para estimar la media. En este caso, el m´etodo que consiste en dos pasos (1) extraer una (2) calcular el intervalo para esa i h muestra al azar de n individuos, σ σ muestra x¯ − z1−α/2 √n ; x¯ + z1−α/2 √n , roporciona un resultado correcto ( es decir un intervalo que efectivamente contiene la media poblacional) en el 95 % de las veces.

3. a) Introducimos la variable X = ”valor medido”. La media poblacional de X representa el centro de los valores proporcionados por el aparato. En particular si el aparato es exacto, la media poblacional de X debe ser igual a 10 gramos. Si el aparato fuera perfecto, todos los valores medidos ser´ıan iguales a 10 y en particular la media de X valdr´ıa 10. b)Empezamos por la construcci´on detallada del intervalo para la media poblacional para un α dado. Sean X1 , X2 , . . . X5 , las variables ”valor obtenido en la 1o medici´on”, etc hasta ”valor obtenido en la 5o medici´on”. Consideramos la media ¯ = X1 +X2 +···+X5 . Puesto que estamos en el caso en que la variable X muestral X 5 ¯ X−µ √ ∼ N (0, 1). sigue una distribuci´on normal, tenemos que Z = σ/ n

56

Introducci´on a la teor´ıa de la estimaci´on

Tenemos P (−z1−α/2 ≤ Z ≤ z1−α/2 ) = 1 − α. Lo que es equivalente a P (−z1−α/2 ≤ ¯ X−µ ¯ − z1−α/2 √σ ≤ µ ≤ X ¯ + √ ≤ z1−α/2 ) = 1 − α. Despejando obtenemos P (X σ/ n n z1−α/2 √σn ) = 1 − α. Deducimos que un intervalo de confianza al 100(1 − α)% de ¯ − z1−α/2 √σ ≤ µ ≤ X ¯ + z1−α/2 √σ . confianza para la media poblacional es X n n En nuestro caso particular, nos fijamos α = 0.02, necesitamos z0.99 , que seg´ un la tabla es igual a 2.33. Sustituyendo obtenemos por lo tanto 10. 0020 ≤ µ ≤ 10.0025. c)El margen de error es z1−α/2 √σn , queremos que sea menor de 0.0001 : σ z1−α/2 √ ≤ 0.0001 n 2 √ σ σ , y elevando al cuadrado, n ≥ z1−α/2 0.0001 , Despejamos para obtener n ≥ z1−α/2 0.0001 sustituimos para obtener n ≥ 21. 7, por lo tanto, 22 mediciones son necesarias. 4. a) La variable X representa la cantidad de maiz de la nueva variedad cosechada en una parcela seleccionada al azar. La poblaci´on de inter´es ser´ıa en este caso el conjunto de todas las cosechas recogidas con esa variedad de ma´ız. Por los resultados vistos en teoria, el intervalo de confianza a nivel 1 − α = 0.9 pedido es:

donde z0.95

σ 10 [X ± z1−(α/2) √ ] = [X ± z0.95 √ ] 5 15 es el percentil 0.95 de la distribuci´on normal estandar:

(1)

φ(z0.95 ) = 0.95 ↔ z0.95 = 1.64 con lo que sustituyendo el anterior valor en la expresi´on 1 el intervalo que contiene la cosecha promedio con una confianza del 90% es: [119.57, 128.03]

Introducci´on a la teor´ıa de la estimaci´on

57

b)Razonando de la misma forma que en a) tenemos: • A nivel 1 − α = 0.95 pedido es:

donde z0.975

10 [X ± z0.975 √ ] 15 es el percentil 0.975 de la distribuci´on normal estandar: φ(z0.975 ) = 0.975 ↔ z0.975 = 1.96

y sustituyendo: [118.74, 128.87] • A nivel 1 − α = 0.99 pedido es:

donde z0.995

10 [X ± z0.995 √ ] 15 es el percentil 0.995 de la distribuci´on normal estandar: φ(z0.995 ) = 0.995 ↔ z0.995 = 2.56

y sustituyendo: [117.19, 130.41] Podemos comprobar que a medida que exigimos un mayor nivel de confianza el intervalo obtenido es de mayor amplitud. El exigir un nivel de confianza mayor equivale a exigir una mayor seguridad de capturar el verdadero valor del par´ametro mediante el intervalo construido a partir de la muestra (cuanto m´as ancho sea m´as valores posibles para µ considera y por tanto m´as f´acil es que este valor sea ’capturado’ por el intervalo). c) Los intervalos anteriores se construyen basandose en la hip´otesis de que la distribuci´on de la variable (y por tanto tambi´en la de la media muestral) sigue una distribuci´on normal. Si no conocemos la distribuci´on de la variable no tenemos la hip´otesis de normalidad, sin embargo el teorema Central del Limite nos permite afirmar que la distribuci´on de la media muestral es aproximadamente normal cuando n es suficientemente grande con lo que podemos utilizar el mismo intervalo (siempre que asumamos que n = 15 es ’suficientemente grande’). d)El margen de error (E) cometido suponiendo un intervalo de confianza al 90% usando la expresi´on (1) ser´a igual a: 10 [Xn ± E] = [Xn ± 1.64 √ ] n 10 E = 1.64 √ , n

58

Introducci´on a la teor´ıa de la estimaci´on como queremos que sea inferior a 4 debemos exigir: 10 4 > E = z0.95 √ n ↔ n > (1.64 ∗ 10/4)2 ↔ n > 16.81 con lo que debemos plantar al menos 17 parcelas. 5. a) Si llamamos R al verdadero valor de la resistencia, y X al valor obtenido al azar al realizar una medici´on, X =R+e (2) donde e es el error que se comete en la medici´on. Como e sigue una distribuci´on normal de media 0 y desviaci´on t´ıpica σ = 3, y X est´a relacionada con la variable e mediante la expresi´on (2), por las propiedades de la distribuci´on normal podemos concluir que X seguir´a una distribuci´on normal de media: E(X) = E(R + e) = R + E(e) = R + 0 = R y varianza: V ar(X) = V ar(e) = 32 El aparato de medici´on es exacto en el sentido de que el valor esperado promedio de las mediciones es el valor correcto y desconocido R. En cuanto a la precisi´on sabemos que el 99.7% de las mediciones estar´an comprendidas entre (R ± 3σ) = (R ± 9). La desviaci´on t´ıpica es de 3 unidades de medici´on lo cual es elevado y concluiriamos que no es muy preciso. b) Como R = µX , y dado que X sigue una distribuci´on normal, por los resultados vistos en teoria, el intervalo de confianza a nivel 1 − α = 0.9 pedido es:

donde z0.95

σ 3 [X ± z1−(α/2) √ ] = [X ± z0.95 √ ] 5 5 es el percentil 0.95 de la distribuci´on normal estandar:

(3)

φ(z0.95 ) = 0.95 ↔ z0.95 = 1.64 con lo que sustituyendo el anterior valor en la expresi´on (3) y dado que X5 = 497.4: 3 [497.4 ± 1.64 √ ] = [497.4 ± E] 5

Introducci´on a la teor´ıa de la estimaci´on

59

c) Si suponemos una confianza del 95% y dejamos n sin determinar el intervalo de confianza queda de la forma: 3 [497.4 ± 1.96 √ ] = [497.4 ± E] n ya que z0.975 = 1.96 es el percentil 1 − α/2 para 1 − α = 0.95. El error E es en este caso: 3 E = 1.96 √ n de forma que como queremos que E no sea superior a 2 debemos exigir: 3 2 ≥ E = z0.975 √ n ↔ n ≥ (1.96 ∗ 3/2)2 ↔ n ≥ 8.64 con lo que debemos plantar al menos 4 mediciones m´as hasta llegar a n = 9. 6. Un estimador puntual de un par´ametro es cualquier estad´ıstico ( funci´on de las observaciones) dise˜ nado para aproximar el par´ametro que nos interesa. Se trata de una variable aleatoria y su valor depende de la muestra escogida. Dos propiedades deseables para un estimador puntual es a) Su media es igual al valor del par´ametro poblacional, en este caso hablamos de un estimador insesgado. b) Si el estimador es insesgado, una buena propiedad adicional es que sea m´as preciso a medida que aumente el n´ umero de observaciones. Concretamente, es deseable que su varianza tienda a cero cuando n tiende hacia infinito. Un estimador insesgado con esta propiedad se llama consistente. 7. a) El intervalo pedido con un nivel de confianza 1 − α = 0.95 tiene la forma: σ 3 [X ± z1−(α/2) √ ] = [X ± z0.975 √ ] 5 5

(4)

donde z0.975 es el percentil 0.975 de la distribuci´on normal estandar: φ(z0.975 ) = 0.795 ↔ z0.975 = 1.96 con lo que sustituyendo el anterior valor en la expresi´on (4) y dado que X5 = 555.5: [550.179, 559.821]

(5)

60

Introducci´on a la teor´ıa de la estimaci´on b) Puesto que la relaci´on entre las variables viene dada por: Y = (9/5)X + 32 la relaci´on que liga ambos valores esperados ser´a: µY = E(Y ) = (9/2)E(X) + 32 = (9/2)µX + 32 usando esta relaci´on, y dado que tenemos un intervalo de confianza para µX (expresi´on 5), podemos obtener el intervalo para µY transformando los extremos del intervalo:

LI = (9/5)550.179 + 32 = 1022.322 LS = (9/5)559.821 + 32 = 1039.678 con lo que el intervalo queda: [1022.322, 1039.678] nota: alternativamente se podr´ıa haber calculado directamente el intervalo para µY sabiendo que: Y σY

= (9/5)X + 32 = (9/5)σX

8. a) El valor de 47% que se ha obtenido es relativo a la muestra escogida, no podemos por lo tanto afirmar sin m´as que, en la poblaci´on entera de mujeres espa˜ nolas, la proporci´on que nos interesa sigue siendo ´esta. La afirmaci´on se realiza con un nivel de confianza del 95% en el sentido de que si repitiesemos el proceso para todos los valores posibles que puede tomar la proporci´on muestral si extraemos al azar muestras de tama˜ no 1025, el 95% de los intervalos calculados captar´ıan la verdadera proporci´on y el 5% restante no captaria el verdadero valor de la proporci´on de esta caracter´ıstica en la poblaci´on de mujeres. b) El margen de error es mayor porque ´este depende de n y para el caso de los hombres se han observado menos valores.

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.