1. Distribución Normal estándar

Distribuci´ on Normal est´ andar y cuadrados m´ınimos Universidad de Puerto Rico ESTA 3041 Prof. H´ector D. Torres Aponte 1. Distribuci´ on Normal e
Author:  Pedro Moya Correa

52 downloads 149 Views 1MB Size

Story Transcript

Distribuci´ on Normal est´ andar y cuadrados m´ınimos Universidad de Puerto Rico ESTA 3041 Prof. H´ector D. Torres Aponte

1.

Distribuci´ on Normal est´ andar

En efecto, todas las distribuciones Normales son lo mismo si usamos las unidades de medida σ alrededor de su media µ que es el centro. El proceso para cambiar nuestra distribuci´on a estas variables se le conoce como estandarizaci´on. Definici´ on 1.1. Si x es una observaci´on de una distribuci´on con media µ y desviaci´on est´andar σ, el valor estandar de x lo es z=

x−µ σ

Este valor est´andar tambi´en se le conoce como valor-z. El valor-z nos indica cuantas desviaciones est´andares est´a la observaci´on original de si media y en que direcci´on. Las observaciones mayores que su media toman valores pos´ıtivos cuando se estandarizan mientras los valores que son menores a su media toman valores negativos. Ejemplo 1.1. El peso de una bolsa de “papitas” cuya etiqueta indica que es de 9oz es aproximadamente Normal con µ = 9.12oz y σ = 0.15oz. El peso est´andar es z=

weight − 9.12 0.15

Por ejemplo una bolsa que pese 9.3oz, su peso estandarizado lo es z=

9.3 − 9.12 = 1.2 0.15

o simplemente 1.2 desviaciones est´andar por encima de la media. Similarmente una bolsa que pese 8.7oz tiene un peso estandarizado de z=

8.7 − 9.12 = −2.8 0.15

o 2.8 desviaciones por debajo de la media. Si las variables originales (antes de aplicar el proceso de estandarizaci´on) ten´ıan una distribuci´on normal, el proceso de estandarizaci´on no brinda una nueva escala (com´ un) y esta distribuci´on sigue siendo una Normal conocida como distribuci´on Normal est´andar. 1

Definici´ on 1.2. La distribuci´on Normal est´andar es la distribuci´on Normal N (0, 1) que tiene media 0 y desviaci´on est´andar 1. Si una variable x tiene una distribuci´on Normal N (µ, σ) entonces la variable est´andar lo es z=

x−µ σ

y tiene una distribuci´on Normal. Ejemplo 1.2. ¿Cual es la proporci´on de todas las bolsas de “papitas” (cuya etiqueta indica que su peso es de 9oz) que pesan menos de 9.3oz? Utilizando los datos del Ejemplo 1, podemos decir que esta proporci´on es el ´area bajo curva N (9.12, 0.15) a la izquierda del punto 9.3. Como el peso est´andar correspondiente a 9.3 onzas lo es 9.3 − 9.12 x−µ = = 1.2 σ 0.15 el ´area es la misma que el ´area bajo la curva de la distribuci´on Normal est´andar a la izquierda del punto z = 1.2. z=

Table entry = 0.8849

z = 1.2

Figura 1: El a´rea bajo la curva Normal est´andar a la izquierda del punto z = 1.2 . Para encontrar este resultado de forma matem´atica necesitamos c´alculo diferencial. Pero, como no tenemos esa herramienta podemos utilizar unas tablas de valores llamada probabilidades normales est´andares. Definici´ on 1.3 (Proceso para utilizar la tabla Normal est´andar). en t´erminos de la variable observada x.

1. Escriba el problema

2. Estandarizamos a x para re-escribir el problemas en t´erminos de variables Normales est´andares z. Dibujamos un diagrama para mostrar el ´area bajo la curva que queremos encontrar. 3. En contramos el a´rea bajo la curva requerida utilizando la tabla Normal est´andar que se encuentra en la contraportada del libro. Note que el ´area total de esta curva siempre es 1. 2

Ejemplo 1.3. La tasa de rendimiento anual de ciertas acciones se distribuye aproximadamente Normal. Desde el 1945, la bolsa de valores Standard & Poor’s 500 tiene un rendimiento anual promedio de 12 % con una desviaci´on est´andar de 16.5 %. Se toma esta distribuci´ on Normal para el rendimiento anual por largos periodos. ¿En que proporci´on de a˜ nos el mercado baja? 1. Establecer el problema: Sea x la tasa de rendimiento anual de Standard & Poor’s 500. La variable x tiene una distribuci´on Normal N (12, 16.5). Queremos saber la proporci´ on cuando x < 0. 2. Estandarizamos: Restando la media de x y dividiendo por la desviaci´on est´andar, obtenemos: x < 0 x − 12 < 0 16.5 z < −0.73 3. Usamos la tabla: Utilizando la tabla para la distribuci´on Normal est´andar podemos ver que el ´area es 0.2327. El mercado va bajar anualmente un 23.27 % del tiempo. Note que el ´area a la derecha de −0.73 es 1 − 0.2327 = 0.7673. Lo que nos indica que la bolsa va a estar por encima un 76.73 % del tiempo (Ver Figura 2).

Table entry = 0.2327 Area = 0.7673

z = – 0.73

´ Figura 2: Area bajo la curva en una curva Normal estandar Ejemplo 1.4. ¿Que porciento de a˜ nos tendr´ıa un rendimiento anual entre un 12 % y 50 %? 1. Queremos la proporci´on de los a˜ nos entre 12 ≤ x ≤ 50. 2. Estandarizamos 12 ≤ 12 − 12 ≤ 16.5 0≤

x x−12 16.5

z 3

≤ 50 50 − 12 ≤ 16.5 ≤ 2.30

3. Usando la tabla, el ´area entre 0 y 2.30 es el ´area por dejabo de 2.30 menos el ´area por debajo de 0 Ver Figura 3. De la tabla de distribuci´on obtenemos: a ´rea entre 0 y 2.30 = ´ area debajo de 2.30 − ´ area debajo de 0.00 = 0.9893 − 0.5000 = 0.4893 Alrededor de 40 % de los a˜ nos tienen un rendimiento anual entre 12 % y 50 %.

Area = 0.5

Area = 0.4893 z=0

z = 2.3

Area = 0.9893

´ Figura 3: Area bajo la curva Normal est´andar para el ejemplo 1.4

4

2.

Regresi´ on lineal y cuadrados m´ınimos

Average amount of gas consumed per day in hundreds of cubic feet

Definici´ on 2.1. Una linea de regresi´on es una linea recta que describe como la variable respuesta y cambia respecto a la variable explicativa x. Usamos la linea de regresi´on para predecir los valores de y dado un valor x.

12 11 10 9 8 7 6 5 4 3 2 1 0 0

5 10 15 20 25 30 35 40 45 50 Average number of heating degree-days per day

55

Figura 4: Regresi´on lineal para el consumo de gas natural de cierta familia. La f´ıgura 4 es un diagrama de disperci´on para el consumo de gas natural. Vemos que los datos tienen una relaci´on lineal muy fuerte entre la temperatura y la cantidad promedio de gas consumido. La correlaci´on es r = 0.9953, vemos que esta es muy cercano a r = 1. La linea de regresi´on dibujada en la Figura 4 representa muy bien los datos obtenidos en el diagrama de dispersi´on. Si queremos prenosticar cuanto gas podemos consumir cuando la temperatora est´a en 20 grados por d´ıa entonces tenemos que localizar cuando x = 20, luego nos movemos hac´ıa la linea y vemos el valor de y el cual es aproximadamente 4.9 miles de pi´es c´ ubicos de gas en ese mes. Obviamente como es una predicci´on, probablemente tenemos un error. Supongamos que en el mes que se hizo la predicci´on realmente consumieron 5.1 miles de pi´es c´ ubicos de gas natural, entonces nuestro error de predicci´on fue: error = observaci´ on y − predicci´ on y = 5.1 − 4.9 = 0.2 Es por eso que queremos saber cual es la distancia m´ınima entre los puntos observados y la linea. La Figura 5 ilustra esta idea. Definici´ on 2.2. La linea de regresi´on lineal de cuadrados m´ınimos de y respecto a x es la linea que representa la suma de los cuadrados de las distancias verticales de los puntos de la data hasta la linea haciendolos lo mas peque˜ no posible.

5

Average amount of gas consumed per day in hundreds of cubic feet

7.0 6.5 predicted yˆ

6.0

distance y – yˆ 5.5

observed y

5.0 4.5 20 22 24 26 28 30 Average number of heating degree-days per day

32

Definici´ on 2.3. Suponga que tenemos data sobre una variable explicativa x y una variable respuesta y para n individuos. De esta data calculamos la media x¯ y y¯ y las desviaciones est´andares sx y sy de las dos variables y su correlaci´on r. La regresion lineal (cuadrados m´ınimos) es la linea definida por: yˆ = b0 + b1 x con pendiente b1 = r

sy sx

e intercepto b0 = y¯ − b1 x¯ Ejemplo 2.1. La linea de la Figura 4 es en efecto una regresi´on linear de cuadrados m´ınimos. Esta linea tiene una ecuaci´on definida como: yˆ = 1.0892 + 0.1890x La pendiente de la regresi´on lineal es siempre importante para interpretar la data. La pendiente es la tasa de cambio de la cantidad de cambio en yˆ cuando x incrementa por 1. En este ejemplo b1 = 0.1890 lo que implica a que grado de temperatura adicional aumenta el consumo por 0.19 miles de pi´es c´ ubicos de gas natural. El intercepto de la regresi´on lineal es el valor yˆ cuando x = 0. Para la predicci´ on es bastante sencillo. Si queremos predecir para 20 grados en el d´ıa, sustituimos x = 20: yˆ = 1.0892 + (0.1890) (20) = 1.0892 + 3.78 = 4.869

6

Datos sobre la regresi´ on lineal 1. La identificaci´on de la variable explicativa y la variable respuesta es algo escencial al momento de establecer nuestra regresi´on. 2. Existe una relaci´on entre la correlaci´on y la pendiente de la regresi´on. La pendiente es b1 = r

sy sx

. Esta ecuaci´on nos indica el cambio a travez de la linea de regresi´on, hay un cambio de una desviaci´on in x respecto a r desviaciones est´andares en y. 3. La linea de regresi´on siempre pasa por el punto (¯ x, y¯).

7

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.