ANÁLISIS ESTADÍSTICO, 2 REGRESIÓN HANS SIGRIST UAC
8 infinitus
cbna 2011 Esta obra está publicada bajo una Atribución 2.0 Chile de Creative Commons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/2.0/cl/. Este documento se distribuye con la esperanza de que sea útil, pero sin ninguna garantía; incluso sin la garantía implícita de comerciabilidad o aptitud para un propósito particular. Se distribuye gratuitamente a todos los individuos, y su uso, descarga o copia, debe llevarse a cabo con el permiso del autor.
Cuidemos el planeta. Salva por página 200 ml de H2 O, 2 g de CO2 y 2 g de madera: Imprime sólo si es necesario.
. 1
R EGRESIÓN LINEAL The real voyage of discovery consists not in
cbna 2011
8
[email protected]
/
Téc. Administración Bancaria y Financiera UAC
seeking new landscapes, but in having new eyes. M ARCEL P ROUST
Objetivos de aprendizaje Al finalizar este capítulo, el alumno estará en condiciones de: Utilizar el concepto de regresión en el análisis de relaciones bivariadas. Predecir eventos futuros mediante el análisis de regresión simple. Utilizar el procedimiento de los mínimos cuadrados.
Índice 1.1.
Introducción
1
1.2.
Determinación de un modelo de regresión lineal simple
3
1.3.
Mínimos cuadrados ordinarios: la recta de mejor ajuste
5
1.4.
Escenario
7
1.5.
Problemas
8
1.6.
Soluciones
10
1.1 Introducción La regresión1 y la correlación son las dos herramientas estadísticas más poderosas y versátiles que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que se puede identificar y cuantificar alguna relación funcional entre dos o más variables. Se dice que una variable depende de la otra. Se puede decir que Y depende de X en donde Y y X son dos variables cualquiera. Esto se puede escribir así Y es función de X
Y “ f pX q
(1)
Debido a que Y depende de X , Y es la variable dependiente y X es la variable independiente. Es importante identificar cuál es la variable dependiente y cuál es la variable independiente en el modelo de regresión. Esto depende de la lógica y de lo que el estadístico intente medir. Nuestro director docente desea analizar la relación entre las notas de los estudiantes y el tiempo que pasan estudiando. Se recolectaron datos sobre ambas 1El primero en desarrollar el análisis de regresión fue el científico inglés Sir Francis Galton (1822-1911). 1
1 REGRESIÓN LINEAL
1.1 Introducción
variables. Es lógico presumir que las notas dependen de la cantidad y calidad de tiempo que los estudiantes pasan con sus libros. Por tanto, “notas” es la variable dependiente y “tiempo” es la variable independiente. Definición 1 (Variable dependiente). Es la variable que se desea explicar o predecir; también se le denomina regresando o variable de respuesta. La variable independiente X se utiliza para explicar Y . Definición 2 (Variable independiente). Es la variable independiente, también se le denomina variable explicativa o regresor. Se dice que “Y está regresando por X ”. Se debe diferenciar entre la regresión simple y la regresión múltiple. En la regresión simple, se establece que Y es una función de sólo una variable independiente. Con frecuencia se le denomina regresión bivariada regresión
porque sólo hay dos variables, una dependiente y una independiente, y la regresión simple se representa con
bivariada
la Ec. (1). En un modelo de regresión múltiple, Y es una función de dos o más variables independientes.
1,0
0,9
0,9
0,8
0,8
Y
Y
1,0
0,7
0,7
Esta línea ajusta bien los datos
0,6
0,5
0,5 0
10
20
30
40 X
50
60
70
F IGURA 1. Una relación lineal positiva.
0
80
Y
Y
0,9 0,8
La curva es mejor ajuste que la recta.
0,7 0,6 0
no lineal
50
100 X
150
200
10
20
30
40 X
50
60
70
80
F IGURA 2. Una relación lineal negativa.
1,0
regresión
Esta línea con pendiente negativa proporciona buen ajuste
0,6
75 74 73 72 71 70 69 68 67 66 65 64 63 62 61 63 64 65 66 67 68 69 70 71 72 73 74 X
F IGURA 3. Relación no lineal, la
F IGURA 4. En este diagrama de
recta es un mal ajuste.
dispersión vemos que no existe ninguna relación entre X e Y .
También es necesario hacer una distinción entre la regresión lineal y la regresión curvilineal (no lineal) En modelo de regresión lineal, la relación entre X y Y puede representarse por medio de una línea recta. Sostiene que a medida que X cambia, Y cambia en una cantidad constante. La regresión no lineal utiliza una curva para expresar la relación entre X y Y . Sostiene que a medida que X cambia, Y cambia en una cantidad diferente cada vez. 2 c 2011 HANS SIGRIST
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
Análisis Estadístico, 2 Regresión
1 REGRESIÓN LINEAL
1.2 Determinación de un modelo de regresión lineal simple
Algunas de estas relaciones aparecen en las gráficas de Figura 1, Figura 2, Figura 3 y Figura 4 y muestran diagramas de dispersión que representan las observaciones por pares para X y Y . Es habitual colocar la variable independiente en el eje horizontal. La Figura 1 sugiere una relación positiva y lineal entre X y Y . Es positiva porque X e Y parecen moverse en la misma dirección. A medida que X aumenta (disminuye), Y aumenta (disminuye). Es lineal porque la relación puede identificarse mediante una línea recta que se dibuja entre los puntos. La Figura 2 muestra una relación lineal y negativa entre X e Y , porque las dos variables parecen moverse en direcciones opuestas. La Figura 3 indica una relación no lineal. El patrón de los puntos de dispersión no se describe bien con la línea recta, pero se define de manera más exacta con la curva que proporciona un mejor ajuste. Finalmente, es difícil observar alguna relación entre X e Y en la Figura 4. La ausencia de todo patrón detectable sugiere que no existe ninguna relación entre X e Y . Definición 3 (Relaciones lineales y no lineales). Si X e Y se relacionan en forma lineal, entonces a medida que X cambia, Y cambia en una cantidad constante. Si existe una relación no lineal, Y cambiará en una cantidad diferente a medida que X cambia.
1.2 Determinación de un modelo de regresión lineal simple Según el V Postulado de Euclides, sólo son necesarios dos puntos para dibujar la línea recta que representa esta relación lineal. La ecuación de una recta puede expresarse como
Ecuación de la recta
Y “ b0 ` b1 X
(2)
en donde b 0 es el intercepto y b 1 es la pendiente de la recta. Ejemplo 1. Supongamos que Y “ 5 ` 2X , entonces la recta intersecta al eje Y en el 5 y tiene pendiente
b 1 “ pendiente “
variación vertical 2 “ “2 variación horizontal 1
Por cada cambio de una unidad en X , Y cambia en dos unidades.
Y 14 12 b b
10
cambio vertical b b
cambio horizontal
8 6
b
Vale la pena destacar que a medida que X incrementa de 2 a 3 (un incremento de una unidad), Y incrementa de 9 a 11 (un
Y “ 2X ` 5
incremento de dos unidades).
4 2
1
X
b
b
2
3
4
F IGURA 5. Línea recta con pendiente positiva.
Ejemplo 2. Supongamos ahora que b 1 ă 0, por ejemplo Y “ 10 ´ 3X . Esta función revela que existe una relación negativa entre X e Y que por cada incremento (reducción) de una unidad en X , Y reducirá (aumentará) en 3 unidades. Análisis Estadístico, 2 Regresión
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
3 c 2011 HANS SIGRIST
1 REGRESIÓN LINEAL
1.2 Determinación de un modelo de regresión lineal simple
Y
10 9 8 7 6 5
A medida que X aumenta 1 unidad y pasa de 2 a 3, Y baja 3 unidades de 4 a 1. b
4 b
3 2 1
b
b
b
b
0.5
1.0
1.5
2.0
b
2.5
3.0
Y “ ´3X ` 10 X 3.5
4.0
F IGURA 6. Línea recta con pendiente negativa.
Ejemplo 3. Ahora bien, si hacemos b 1 “ 0, por ejemplo Y “ 7 ` 0X , entonces un cambio de X no tiene relación con un cambio en Y . Por lo tanto, X no puede utilizarse como variable explicativa de Y .
9
Y
8
Y “ 7 ` 0X 7 b
b
6 5 4
No existe ninguna relación entre X y Y . A
3
medida que X cambia, Y sigue igual.
2 1
X 5
10
15
20
F IGURA 7. Recta constante: ninguna relación entre X e Y .
determinísticas
Las relaciones entre variables son o determinísticas o estocásticas (aleatorias). Una relación determinística
estocásticas
puede expresarse mediante la fórmula que convierte la velocidad expresada en millas por hora (mp{h) a kilómetros por hora (kp{h). Ya que 1 milla es aproximadamente igual a 1. 6 kilómetros, este modelo es 1mp{h “ 1. 6kp{h. Por tanto, una velocidad de 5mp{h “ 5 ¨ 1. 6kp{h “ 8. 0kp{h. Este es un modelo determinístico porque la relación es exacta y no hay error (salvo la aproximación). Infortunadamente, muy pocas relaciones en el mundo de los negocios son así de exactas. Con frecuencia se encuentra que al utilizar una variable para explicar otra, existe alguna variación en la relación. Por ejemplo, se supone que la gerencia de Vita + Plus y Cia., distribuidores de productos para la salud, desea desarrollar un modelo de regresión en el cual se utiliza la publicidad para explicar los ingresos por concepto de ventas. Probablemente encontrarán que cuando hacen publicidad y ésta se fija en cierta cantidad X i , las ventas tendrán algún valor Yi . Sin embargo, la próxima vez que se fije la publicidad en la misma cantidad, las ventas pueden producir otro valor. La variable dependiente (ventas, en este caso) presenta algún grado de aleatoreidad. Por tanto, habrá algún error en el intento por explicar o predecir las ventas. Se dice que un modelo de esta naturaleza es estocástico, por la presencia de la variación aleatoria y puede expresarse como 4 T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC c 2011 HANS SIGRIST
Análisis Estadístico, 2 Regresión
1 REGRESIÓN LINEAL
1.3 Mínimos cuadrados ordinarios: la recta de mejor ajuste
Y “ β0 ` β1 X ` ϵ
Un modelo lineal
(3)
La ec. (3) es la relación poblacional (o verdadera) según la cual se hace regresión de Y sobre X . Además, β0 ` β1 X es la porción determinística de la relación, mientras que ϵ (la letra griega epsilon) representa el carácter aleatorio que muestra la variable dependiente y por tanto denota el término del error en la expresión. Los
error
parámetros β0 y β1 , lo mismo que la mayoría de los parámetros, permanecerán desconocidos y se pueden estimar sólo con los datos muestrales. Esto se expresa así: Y “ b0 ` b1 X ` ϵ
Un modelo lineal con base en datos muestrales
(4)
en donde los valores b 0 y b 1 son estimaciones de β0 y β1 , respectivamente, y ϵ es el término aleatorio. Habitualmente se le denomina residual cuando se utilizan datos muestrales, ϵ reconoce que no todas las observaciones
residual
caen exactamente en una línea recta. Si se supiera el valor exacto de ϵ, se podría calcular de manera precisa Y . Sin embargo, debido a que ϵ es aleatoria, Y sólo puede estimarse. El modelo de regresión por ende toma la forma de: El modelo de regresión estimado
Yˆ “ b 0 ` b 1 X
(5)
en donde Yˆ (lea “Y sombrero”) es el valor estimado de Y , y b 0 y b 1 son el intercepto y la pendiente de la recta de regresión estimada. En otras palabras, Yˆ es simplemente el valor estimado para las ventas con base en el
estimado
modelo de regresión. 1.3 Mínimos cuadrados ordinarios: la recta de mejor ajuste El propósito del análisis de regresión es determinar una recta que se ajuste a los datos muestrales mejor que cualquier otra recta que pueda dibujarse. Para ilustrarlo, se asume que Vita + Plus y Cia., recolecta datos sobre los gastos publicitarios y los ingresos por ventas de 5 meses, como se muestra en el Cuadro 1. Mes
Ventas (Y US$1000)
Publicidad (X US$100)
1
US$450
US$50
2
380
40
3
540
65
4
500
55
5
420
45
C UADRO 1. Datos de ventas para Vita + Plus y Cia.
Aunque una muestra de sólo 5 datos probablemente sería insuficiente, servirá por el momento para los propósitos de la sección. Estos cinco datos y la recta que mejor les ajusta aparecen en la Figura 8. Esta recta está deter-
550
minada mediante la estimación de b 0 y b 1 . Un procedimiento matemático utilizado para esti-
Ventas
500
450
mar esos valores se denomina mínimos cuadrados ordinarios (MCO). MCO producirá una rec-
mínimos
ta que se extiende por el centro del diagrama de
cuadrados
dispersión aproximándose a todos los puntos de datos más que cualquier otra recta. Regresando
400
a la Figura 8, para los 5 datos Y en el diagrama 35
40
45
50 55 Publicidad
60
65
70
de dispersión son los valores de los datos observados reales para Y en el Cuadro 1. Los valores Yˆ se obtienen mediante la recta de regresión y representan el estimado de las ventas. La dife-
F IGURA 8. Ajuste lineal para Vita + Plus, y Cia. Análisis Estadístico, 2 Regresión
rencia entre lo que Y era realmente Yi , y lo que se estima que es Yˆi , es el error.
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
5 c 2011 HANS SIGRIST
1 REGRESIÓN LINEAL
1.3 Mínimos cuadrados ordinarios: la recta de mejor ajuste
Error “ pYi ´ Yˆi q
(6)
Si el valor real de Y , Yi , es mayor que el estimado, entonces pYi ´ Yˆi q ą 0 y en consecuencia el error es positivo. Este es el caso en la Figura 8, en donde la publicidad es 55. Por el contrario, si se sobrestiman las ventas, entonces pYi ´ Yˆi q ă 0, luego el error es negativo. Esto ocurre cuando la publicidad es 50. debido a que algunos errores son negativos y algunos son positivos, MCO producirá una recta tal que la suma de esos errores sea cero.
ÿ pYi ´ Yˆi q “ 0
(7)
MCO también asegurará que se minimice la suma de estos errores al cuadrado. Es decir, si se toman cinco diferencias, todas verticales, entre los valores reales de Y y la recta de regresión (Yi ´ Yˆi ), se elevan al cuadrado estas diferencias verticales y se suman, el número resultante será menor que el que se obtendría con cualquier otra recta. Es decir, MCO minimizará la suma de los errores al cuadrado. Es por esto que se denomina mínimos cuadrados ordinarios; produce una recta tal que la suma de los errores al cuadrado es menor de lo que sería con cualquier otra recta. Ver Ec. (8).
ÿ pYi ´ Yˆi q2 “ mi n
(8)
en donde Yi ´ Yˆi es el error de cada dato y mi n es el valor mínimo. Para determinar esta recta de mejor ajuste, MCO requiere que se calcule la suma de cuadrados y productos cruzados. Es decir, se debe calcular la suma de los valores de X al cuadrado (SC x), la suma de los valores de Y al cuadrado (SC y) y la suma de X multiplicado por Y (SC x y). Esto se muestra en las siguientes ecuaciones.
Suma de los cuadrados de X
SC x
ÿ
p X i ´ X q2 ř ÿ p X q2 2 “ X ´
“
(9)
n
Suma de los cuadrados de Y
SC y
ÿ
pYi ´ Y q2 ř ÿ p Y q2 2 “ Y ´ “
(10)
n
y
Suma de los productos cruzados de X e Y
SC x y
ÿ
p X i ´ X qpYi ´ Y q ř ř ÿ p X qp Y q “ XY ´ “
n
(11)
Cabe destacar que las primeras porciones de cada una de estas ecuaciones:
aprender
SC x SC y SC x y
ÿ p X i ´ X q2 ÿ “ pY i ´ Y q2 ÿ “ p X i ´ X qpYi ´ Y q “
ilustran cómo la recta MCO realmente se basa en las desviaciones de las observaciones a partir de su media. Debido a lo tedioso del cálculo de las ecuaciones anteriores, preferiremos éstas últimas, que nos ofrecen una versión más simplificada. Dadas las sumas de cuadrados y los productos cruzados, es un asunto sencillo calcular la pendiente de la coeficiente
recta de regresión, llamada el coeficiente de regresión y el intercepto, así:
de regresión
Pendiente de la recta de regresión
b1 “
SC x y SC x
(12)
y Intercepto de la recta de regresión
b0 “ Y ´ b1 X
en donde Y y X son las medias de los valores Y y los valores X . 6 T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC c 2011 HANS SIGRIST
(13)
Análisis Estadístico, 2 Regresión
1 REGRESIÓN LINEAL
1.4 Escenario
1.4 Escenario La gerencia de Sigrist Airlines, “la aerolínea transportadora más pequeña del mundo”, considera que existe una relación directa entre los gastos publicitarios y el número de pasajeros que escogen viajar por Sigrist Airlines. Para determinar si esta relación existe, y si es así cuál podría ser la naturaleza exacta, los estadísticos empleados por Sigrist Airlines decidieron utilizar los procedimientos MCO para determinar el modelo de regresión. Se recolectaron los valores mensuales por gastos de publicidad y número de pasajeros para los n “ 15 meses más recientes. Los datos aparecen en el Cuadro 2, junto con otros cálculos necesarios para hallar el modelo de regresión. Se observará que los pasajeros están representados con la variable Y , ya que se asume que depende de la publicidad. Observación
Publicidad
Pasajeros
(mes)
(en US$1. 000)
(en US$1. 000)
pX q
pY q
XY
X2
Y2
1
10
15
150
100
225
2 3
12 8
17 13
204 104
144 64
289 169
4
17
23
391
289
529
5
10
16
160
100
256
6
15
21
315
225
441
7
10
14
140
100
196
8 9
14 19
20 24
280 456
196 361
400 576
10
10
17
170
100
289
11
11
16
176
121
256
12
13
18
234
169
324
13
16
23
368
256
529
14 15
10 12
15 16
150 192
100 144
225 256
+187
+268
+3. 490
+2. 469
+4. 960
C UADRO 2. Datos de regresión para Sigrist Airlines Con este simple conjunto de datos, y los cálculos subsiguientes para X Y , X 2 , e Y 2 es tarea fácil determinar el modelo de regresión mediante el cálculo de los valores de la constante de regresión y el coeficiente de regresión de la recta de regresión Yˆ “ b 0 ` b 1 X . Las sumas de los cuadrados y de los productos cruzados son:
SC x
“ “ “
SC y
“ “ “
SC x y
“ “ “
Análisis Estadístico, 2 Regresión
ÿ
X2´
p
ř
X q2
n 1872 2. 469 ´ 15 137. 73
ÿ
2
Y ´
ř p Y q2
n 2682 4. 960 ´ 15 171. 73
ÿ
XY ´
ř ř p X qp Y q
n 187 ¨ 268 3. 490 ´ 15 148. 93
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
7 c 2011 HANS SIGRIST
1 REGRESIÓN LINEAL
1.5 Problemas
Utilizando la Ec. (12) se puede establecer el coeficiente de regresión así: b1
SC x y SC x 148. 3
“ “
137. 3
“ 1. 0813166 „ 1. 08 Además
ř Y “
Y 268 “ “ 17. 86 n 15
y
ř
X 187 “ “ 12. 46 n 15 Finalmente, la Ec. (13) revela que el intercepto es: X“
b0
“ Y ´ b1 X “ 17. 86 ´ 1. 08p12. 46q “ 4. 3865 „ 4. 40
De esta forma, el modelo de regresión es: Yˆ “ 4. 40 ` 1. 08X i en donde Yˆi es el valor individual pronostico para los pasajeros. Así, si X i “ 10, tendremos: Yˆi “ 4. 40 ` 1. 08p10q “ 15. 2 Debido a que tanto X como Y están expresadas en miles, esto significa que si se gastan US$10. 000 en publicidad, el modelo predice que 15. 200 personas valientes decidirán volar en Sigrist Airlines. El coeficiente de 1. 08 significa que por cada incremento de una unidad en X , Y aumentará en 1. 08 unidades. Por tanto, si se incrementan los gastos publicitarios en US$1. 000, entonces 1. 080 pasajeros más abordarán aviones de Sigrist Airlines.
26
A medida que la publicidad aumenta de a 1 unidad, los pasajeros aumentan en 1.08 unidades.
24
Ventas
22 20 18 16 14 12 6
8
10
12 14 Publicidad
16
18
20
F IGURA 9. Recta de regresión para Sigrist Airlines
1.5 Problemas Ejercicio 1. La bolsa de trabajo de un Universidad desea determinar si los promedios puntuales en notas de los estudiantes puede explicar el número de ofertas laborales que ellos reciben después de graduarse. Los datos siguientes corresponden a los 10 recién graduados. Estudiante
1
2
3
4
5
6
7
8
9
10
Promedio
3. 25
2. 35
1. 02
0. 36
3. 69
2. 65
2. 15
1. 25
3. 88
3. 37
3
3
1
0
5
4
2
2
6
2
Ofertas 8 c 2011 HANS SIGRIST
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
Análisis Estadístico, 2 Regresión
1 REGRESIÓN LINEAL
1.5 Problemas
a) Haga un diagrama de dispersión para los datos. b) Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre los promedios y las ofertas de trabajo? c) Si Mario tiene un promedio de 3. 22, ¿Cuántas ofertas laborales pronostica usted que él recibirá? Ejercicio 2. Un economista del Departamento de Recursos Humanos de la Municipalidad de San Felipe está preparando un estudio sobre el comportamiento del consumidor. Él recolectó los datos que aparecen en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo. Determine cuál es la variable dependiente. Consumidor Ingreso Consumo
1
2
3
4
5
6
7
8
9
10
11
12
24. 3 16. 2
12. 5 8. 5
31. 2 15
28. 0 17
35. 1 24. 2
10. 5 11. 2
23. 2 15
10. 0 7. 1
8. 5 3. 5
15. 9 11. 5
14. 7 10. 7
15 9. 2
a) Haga un diagrama de dispersión para los datos. b) Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre el consumo y el ingreso? ¿Qué proporción de cada dólar adicional que se gana se invierte en consumo? c) ¿Qué consumo pronosticaría el modelo para alguien que gana US$27. 500? Ejercicio 3. Un banco en San Felipe que se especializa en créditos para vivienda intenta analizar el mercado hipotecario, midiendo el poder explicativo que las tasas de interés tienen sobre el número de casas vendidas en el área. Se compilaron los datos para un período de 10 meses, así: Mes
1
2
3
4
5
Interés
12. 3
10. 5
Casas
196
285
15. 6
9. 5
10. 5
125
225
248
6
7
8
9
10
9. 3
8. 7
14. 2
15. 2
12
303
265
102
105
114
a) Haga un diagrama de dispersión para los datos. b) Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre las tasas de interés y las ventas de vivienda? c) Si la tasa de interés es del 9. 5 %, ¿Cuántas casas se venderían de acuerdo con el modelo? Ejercicio 4. Neumatón produce partes para camión que se utilizan en los semirremolques. El jefe de contabilidad desea desarrollar un modelo de regresión que pueda utilizarse para predecir los costos. Él selecciona unidades de producción fabricadas como una variable de predicción y recolecta los datos que se observan aquí. Los costos están en miles de dólares y las unidades en cientos. Unidades Costo
12. 3 6. 2
8. 3 5. 3
6. 5 4. 1
4. 8 4. 4
14. 6 5. 2
14. 6 4. 8
14. 6 5. 9
6. 5 4. 2
a) Haga un diagrama de dispersión para los datos. b) Calcule e interprete el modelo de regresión. ¿Qué le dice el contador sobre la relación entre producción y costos? c) Según el modelo, ¿Cuánto costaría producir 750 unidades? Ejercicio 5. El profesor Sigrist (el profesor menos conocido de la historia) ha notado que muchos de sus estudiantes se han ausentado de clase este semestre. Considera que puede explicar esta falta de asistencia por las distancias a las que sus estudiantes viven del campus. Se practica una encuesta a once estudiantes sobre cuántos kilómetros deben viajar para asistir a clase y el número de clases a las que han faltado. Kilómetros
5
6
2
0
9
12
16
5
7
0
8
Ausencias
2
2
4
5
4
2
5
2
3
1
4
a) Haga un diagrama de dispersión para los datos. b) Compare e interprete el modelo de regresión. ¿Qué determina el profesor? c) ¿A cuántas clases faltaría usted si viviera a 3. 2 kilómetros del campus, según el modelo? Análisis Estadístico, 2 Regresión
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
9 c 2011 HANS SIGRIST
1 REGRESIÓN LINEAL
1.6 Soluciones b) Cˆ “ 1. 777 ` 0. 558I
2
c) US$15346. 77 b) Cˆ “ 3. 72 ` 0. 1295U
4
c) US$4. 664 R EFERENCIAS [1] G. R. Douglas Montgomery. Probabilidad y Estadística Aplicadas a la Ingeniería. ISBN 970-101-017-5. McGraw-Hill Publications, 1996. [2] F. J. Ayres. Matrices. ISBN 968-422-918-6. Serie Schaum, 1992. [3] L. H. Edwards. Cálculo. ISBN 970-105-710-4. McGraw-Hill Publications, 8th edition, 2005. [4] J. O. Paul Urban. Mathematics For The International Student (IBO). Haese Harris Publications, 2004. [5] T. M. Rod Hill. The economics anti-textbook. Fernwood Publishing, 1st edition, 2010. [6] M. Rosser. Basic Mathematics for Economists. Routledge, second edition, 2003. [7] J. Stewart. Calculus Concepts and Contexts. Brooks-Cole, second edition, 2002. [8] K. Sydsæter. Essential Mathematics for Economic Analysis. FT Prentice Hall, 2008. [9] M. J. Panik. Advanced Statistics from an Elementary Point of View. Elsevier Academic Press, 2005. [10] D. Bowers. Medical Statistics from Scratch. John Wiley & Sons Ltd, 2008. [11] P. I. Good. Introduction To Statistics Through Resampling Methods And Microsoft Office Excel. John Wiley & Sons, Inc., 2005. [12] D. Dunn. Statistics and Data Analysis for Behavioral Sciences. McGraw-Hill Higher Education, 1st edition, 2001. [13] S. M. Ross. Introduction To Probability And Statistics For Engineers And Scientists. Elsevier Academic Press, 2004. [14] W. Navidi. Estadística para Ingenieros y Científicos. ISBN 970-10-5629-9. McGraw-Hill Publications, 2006. [15] J. C. A. J. Susan Milton. Probabilidad y Estadística con Aplicaciones para Ingeniería y Ciencias Computacionales. ISBN 970-10-4308-1. McGraw-Hill Publications, 4th edition, 2004. [16] A. L. Webster. Estadística Aplicada a los Negocios y la Economía. ISBN 958-410-072-6. McGraw-Hill Publications, 3th edition, 2000.
10 c 2011 HANS SIGRIST
T ÉC . A DMINISTRACIÓN B ANCARIA Y F INANCIERA UAC
Análisis Estadístico, 2 Regresión