REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Dr. Alí Javier Suárez-Brito 1 Estadística REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓ

10 downloads 111 Views 555KB Size

Recommend Stories


REGRESION LINEAL SIMPLE
REGRESION LINEAL SIMPLE Jorge Galbiati Riesco Se dispone de una mustra de observaciones formadas por pares de variables: (x1, y1) (x2, y2) .. (xn, yn

Regresión lineal simple
Regresión lineal simple _______________________________________________________ 1.-Introducción 2.- Regresión simple. Gráficos 3.- Ecuación de regres

Regresión lineal simple
1 Índice Regresión lineal simple José Gabriel Palomo Sánchez [email protected] E.U.A.T. U.P.M. Julio de 2011 Índice Índice I 1 El problem

Ejercicios resueltos y exámenes
Principios de Econometría y Econometría Empresarial I Ejercicios resueltos y exámenes Recopilados por Ezequiel Uriel 1 I EJERCICIOS RESUELTOS II

Ejercicios Resueltos
Ejercicios Resueltos ANGULOS 1. Si el complemento de ángulo x es 2x, ¿Cuál es el valor de x en grados? Solución: 2x + x = 90° 3x = 90° x = 90° / 3 x

Ejercicios resueltos
Ejercicios resueltos Bolet´ın 3 Movimiento arm´onico simple Ejercicio 2 Una part´ıcula que vibra a lo largo de un segmento de 10 cm de longitud tiene

Story Transcript

Dr. Alí Javier Suárez-Brito 1 Estadística

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓN DE DRAKUL DE LA REPÚBLICA DE NECROLANDIA, LAS AUTORIDADES ECONÓMICAS HAN REALIZADO UNA REVISIÓN DEL COMPORTAMIENTO DEL CONSUMO REGIONAL Y LA RECAUDACIÓN IMPOSITIVA CON LA FINALIDAD DE LLEVAR A CABO UN ESTUDIO QUE CONTRIBUYA A ESTABLECER UNA SERIE DE POLÍTICAS DE ESTÍMULO AL CONSUMO A TRAVÉS DE LOS IMPUESTOS. SEGUIDAMENTE, SE PRESENTA LA INFORMACIÓN PARA LOS ÚLTIMOS OCHO AÑOS: AÑO 2006 2007 2008 2009 2010 2011 2012 2013

CONSUMO REGIONAL (En millones de corpses) 13,00 12,80 12,65 13,10 13,07 12,70 12,75 13.15

RECAUDACIÓN IMPOSITIVA (En millones de corpses) 22,00 23,20 23,74 21,07 21,01 23,28 23,30 20,90

MODELO DE REGRESIÓN LINEAL SIMPLE En este caso, comenzaremos por definir la regresión lineal simple como un método matemático que modela la relación entre una variable dependiente (Y) y una variable dependiente (X). Fórmulas: * Parámetro beta su uno (𝜷𝟏 ): representa la pendiente de la recta de regresión. Nos indica en cuanto variará la variable dependiente (Y) cuando varía en una unidad la variable independiente (X). Si su valor es negativo, indica que la relación entre ambas variables es inversa y, por tanto, la recta de regresión tendría pendiente negativa; mientras que, si es positivo, indicaría una relación directa y, como es de esperarse, la recta de regresión tendría pendiente positiva. 𝜷𝟏 =

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) 𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2

* Parámetro beta su cero (𝜷𝟎 ): representa la intersección de la recta de regresión. Nos indica el valor mínimo que asumiría la variable dependiente (Y) cuando la variable independiente (X) es cero. Además de esto, indica el origen que tendría la recta de regresión en el eje Y. ̂ − 𝜷𝟏 (𝑿 ̂) 𝜷𝟎 = 𝒀

UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 2 Estadística

Cabe destacar que: 𝑌̂ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑌 𝑋̂ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑋 Para plantear el modelo de regresión lineal simple correspondiente, procederemos a emplear una tabla que permitirá la obtención de cada uno de los elementos de las fórmulas. En este caso:

AÑO

CONSUMO REGIONAL

RECAUDACIÓN IMPOSITIVA

(X.Y)

𝑿𝟐

𝒀𝟐

2006 2007 2008 2009 2010 2011 2012 2013

(Y) 13,00 12,80 12,65 13,10 13,07 12,70 12,75 13,15

(X) 22,00 23,20 23,74 21,07 21,01 23,28 23,30 20,90

286,00 296,96 300,31 276,02 274,60 295,66 297,08 274,84

484,00 538,24 563,59 443,94 441,42 541,96 542,89 436,81

169,00 163,84 160,02 171,61 170,82 161,29 162,56 172,92

Totales

∑ 𝒀= 103,22

∑ 𝑿= 178,50

∑(𝑿. 𝒀)= 2301,45

∑ 𝑿𝟐 = 3992,85

∑ 𝒀𝟐 =1332,07

* Adicionalmente, se evidencia que el número de observaciones es ocho (08), de modo que: n = 08 * De igual manera, para las medias de cada una de las variables son las siguientes: Para Y: 𝑌̂ =

∑𝑌 𝑛

=

103,22 8

= 𝟏𝟐, 𝟗𝟎𝟐𝟓

Para X: ̂= 𝑿

∑𝑋 𝑛

=

170,50 8

= 𝟐𝟐, 𝟑𝟏𝟐𝟓

Con toda la información, procederemos a la obtención de los parámetros del modelo de regresión lineal simple: * Parámetro beta su uno (𝜷𝟏 ): Sea 𝜷𝟏 =

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) 𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2

UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 3 Estadística

Tenemos que: 𝜷𝟏 =

8(2301,45) − (178,50)(103,22) 8(3992,85) − (178,50)2

Así: 𝜷𝟏 =

18.411,70 − 18.424,80 31.942,80 − 31.862,30 𝜷𝟏 =

−13,10 80,50

De esta manera, el valor de 𝛽1 es: 𝜷𝟏 = −𝟎, 𝟏𝟔𝟐𝟕𝟑𝟑 Partiendo de este cálculo, se puede obtener el parámetro 𝛽0

* Parámetro beta su cero (𝜷𝟎 ): Sea: 𝜷𝟎 = 𝑌̂ − 𝛽1 (𝑋̂) Tendríamos: 𝜷𝟎 = 12,9025 − (−0,162733)(22,3125) 𝜷𝟎 = 12,9025 − (−3,63098) Así, tendríamos que el parámetro 𝛽0 sería: 𝜷𝟎 = 𝟏𝟔, 𝟓𝟑𝟑𝟓 Realizados estos cálculos, podemos plantear el modelo de regresión de la siguiente manera: 𝒀 = 𝟏𝟔, 𝟓𝟑𝟑𝟓 − 𝟎, 𝟏𝟔𝟐𝟕𝟑𝟑(𝑿) Este modelo, permitiría estimar un posible valor del consumo regional (Y) si, por ejemplo, para el año 2014 cambia la recaudación impositiva (X). De este modo, supongamos que para el 2014 el valor de la recaudación impositiva es de 25 millones de pesos: 𝑌2014 = 16,5335 − 0,162733(25) El valor esperado del consumo, sería: 𝑌2014 = 16,5335 − 4,068325 𝒀𝟐𝟎𝟏𝟒 = 𝟏𝟐, 𝟒𝟔𝟓𝟏𝟕𝟓 UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 4 Estadística

Cabe destacar que, la escogencia de la variable dependiente (Y) e independiente (X) depende, en gran medida, del conocimiento del experto. En este ejemplo, resulta sencillo determinar que el consumo regional (Y) depende de la recaudación impositiva (X), por cuanto, los impuestos determinan la tendencia del consumo: * A mayores impuestos, menor consumo; y * A menores impuestos, mayor consumo Ahora bien, luego de los cálculos anteriores, resulta imperativo obtener el coeficiente de determinación, ya que, el mismo nos permitirá determinar el “ajuste” del modelo. Esto es, mediante el coeficiente de determinación se verifica la calidad del modelo para replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el mismo.

COEFICIENTE DE DETERMINACIÓN (𝒓𝟐 ) El coeficiente de determinación se encuentra entre cero y uno: 𝟎 ≤ 𝒓𝟐 ≤ 𝟏 En cuyo caso, un coeficiente de determinación igual a 1, implica un modelo perfecto, en el cual, las variaciones pueden explicarse totalmente por el modelo. Sin embargo, un coeficiente de determinación igual a 0, significa un modelo que no explica el comportamiento de la variable. De manera que, cuanto mayor sea el 𝒓𝟐 mayor será la calidad del modelo para explicar el comportamiento de la variable. La fórmula del coeficiente de determinación es: 𝒓𝟐 =

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) √[𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝒏(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

Ahora bien, siguiendo con el ejercicio considerado, procedamos a sustituir los valores en la fórmula: 𝒓𝟐 =

8(2301,45) − (178,50)(103,22) √[8(3992,85) − (178,50)2 ][8(∑ 1332,07) − (∑ 103,22)2 ]

Continuamos: 𝒓𝟐 =

18.411,70 − 18.424,80 √(31.942,80 − 31.862,30)(10.656,56 − 10.654,37) 𝒓𝟐 =

−13,10 √(80,50)(2,19)

UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 5 Estadística

𝒓𝟐 =

−13,10 √176,295

𝒓𝟐 =

−13,10 13,2776

En cuyo caso, el coeficiente de determinación sería: 𝒓𝟐 = −𝟎, 𝟗𝟖𝟔𝟔𝟐𝟑 Considerando que el signo negativo está asociado a la relación inversa (negativa) entre las variables dependiente e independiente, lo tomamos en términos de su valor absoluto: 𝒓𝟐 = 𝟎, 𝟗𝟖𝟔𝟔𝟐𝟑 Dado el valor, se puede deducir que el modelo explica el 98,66% del comportamiento del valor de la variable. Por ello, comúnmente se dice que el modelo es de “calidad” y se encuentra “ajustado”. COEFICIENTE DE CORRELACIÓN (𝒓) Por medio del coeficiente de correlación, medimos el grado de asociación que existe entre dos variables, siempre y cuando sean cuantitativas. Se obtiene aplicando la raíz cuadrada al coeficiente de determinación. En este caso, el coeficiente de correlación puede ser positivo y negativo. A saber: Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante. Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlación negativa. Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante. La fórmula del coeficiente de correlación (r), es: 𝒓=√

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) √[𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝒏(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

En resumen: 𝒓 = ±√𝒓𝟐 UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 6 Estadística

Continuando con el ejercicio, procedamos a obtener el coeficiente de correlación para determinar el grado de asociación entre el consumo regional (Y) y la recaudación impositiva (X). Así: 𝑟 = ±√𝑟 2 𝑟 = ±√0,986623 El resultado sería: 𝒓 = −𝟎, 𝟗𝟗𝟑𝟑 El resultado es negativo porque la relación entre las variables es inversa. Este coeficiente de correlación muestra un grado de asociación casi perfecto entre ambas variables, lo que, ratifica que la asociación lineal (negativa) entre ambas es de gran magnitud.

2. RECIENTEMENTE, EN LA EMPRESA ANTÁRTICA SE INICIÓ UN PROCESO DE REVISIÓN DE LA INCIDENCIA DE LA ROTACIÓN DE INVENTARIOS EN LOS BENEFICIOS NETOS. EN ESTE CASO, SE DISPONE DE LA INFORMACIÓN CORRESPONDIENTE A LAS VARIABLES CONSIDERADAS PARA LOS ÚLTIMOS DIEZ AÑOS: AÑO 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

ROTACIÓN DE INVENTARIOS* Expresado en veces al año 32 34 31 35 37 33 39 42 30 29

BENEFICIOS NETOS** Expresado en millones de corpses 40,00 40,65 39,00 44,00 48,00 40,50 45,00 48,00 34,00 30,00

* La rotación de inventarios es el indicador que permite saber el número de veces en que el inventario es realizado en un periodo determinado. Permite identificar cuantas veces el inventario se convierte en dinero o en cuentas por cobrar (se ha vendido).

En este ejercicio, debemos proceder a señalar cuál es la variable dependiente y la independiente. En tal sentido, debemos considerar que, si el beneficio neto se obtiene descontando de los ingresos por ventas los costos y gastos, y que, además, la rotación de inventarios es determinante del volumen de ventas, entonces, es preciso indicar que los beneficios netos dependerán de la rotación de inventarios. Así: Rotación de inventarios: Variable independiente (X) Beneficios netos: Variable dependiente (Y) UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 7 Estadística

De esta manera, procederemos a realizar la tabla de cálculos de los valores inherentes a las fórmulas: AÑO

ROTACIÓN DE INVENTARIOS

BENEFICIOS NETOS

(X.Y)

𝑿𝟐

𝒀𝟐

2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

(X) 32 34 31 35 37 33 39 42 30 29

(Y) 40,00 40,65 39,00 44,00 48,00 40,50 45,00 48,00 34,00 30,00

1280,00 1361,78 1209,00 1540,00 1776,00 1336,50 1755,00 2016,00 1020,00 870,00

1024,00 1122,25 961,00 1225,00 1369,00 1089,00 1521,00 1764,00 900,00 841,00

1600,00 1652,42 1521,00 1936,00 2304,00 1640,25 2025,00 2304,00 1156,00 900,00

∑ 𝑿= 341,50

∑ 𝒀= 409,15

∑(𝑿. 𝒀)= 14164,28

∑ 𝑿𝟐 11816,25

∑ 𝒀𝟐 =17038,67

Totales

* Adicionalmente, se evidencia que el número de observaciones es diez (10), de modo que: n = 10 * De igual manera, para las medias de cada una de las variables son las siguientes: Para Y: 𝑌̂ =

∑𝑌 𝑛

=

409,15 10

= 𝟒𝟎, 𝟗𝟏𝟓

Para X: ̂= 𝑿

∑𝑋 𝑛

=

341,50 10

= 𝟑𝟒, 𝟏𝟓

Con toda la información, procederemos a la obtención de los parámetros del modelo de regresión lineal simple: * Parámetro beta su uno (𝜷𝟏 ): Sea 𝜷𝟏 =

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) 𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2

Tenemos que: 𝜷𝟏 =

10(14.164,28) − (341,50)(409,15) 10(11.816,25) − (341,50)2 UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 8 Estadística

Así: 𝜷𝟏 =

141.642,80 − 139.724,725 118.162,50 − 116.622,25 𝜷𝟏 =

1.918,075 1.540,25

De esta manera, el valor de 𝛽1 es: 𝜷𝟏 = 𝟏, 𝟐𝟒𝟓𝟑𝟎𝟏 El valor de 𝛽1 es positivo, lo que implica que la pendiente de la recta de regresión es positiva. Esto es así porque, como se determinará más adelante, la relación entre las variables es positiva, esto es: * A mayor rotación de inventarios (X), mayores beneficios netos (Y); y, * A menor rotación de inventarios (X), menores beneficios netos (Y). Partiendo del cálculo anterior, se puede obtener el parámetro 𝛽0 * Parámetro beta su cero (𝜷𝟎 ): Sea: 𝜷𝟎 = 𝑌̂ − 𝛽1 (𝑋̂) Tendríamos: 𝜷𝟎 = 40,915 − (1,245301)(34,15) 𝜷𝟎 = 40,915 − 42,52703 Así, tendríamos que el parámetro 𝛽0 sería: 𝜷𝟎 = −𝟏, 𝟔𝟏𝟐𝟎𝟑 Realizados estos cálculos, podemos plantear el modelo de regresión de la siguiente manera: 𝒀 = −𝟏, 𝟔𝟏𝟐𝟎𝟑 + 𝟏, 𝟐𝟒𝟓𝟑𝟎𝟏(𝑿) Este modelo, permitiría estimar un posible valor de los beneficios netos (Y) si, por ejemplo, para el año 2014 cambia la rotación de los inventarios (X). De este modo, supongamos que para el 2014 el valor de la rotación de inventarios es de 44: 𝑌2014 = −1,61203 + 1,245301(44) El valor esperado del consumo, sería: 𝑌2014 = −1,61203 + 54,79324 UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 9 Estadística

𝒀𝟐𝟎𝟏𝟒 = 𝟓𝟑, 𝟏𝟖𝟏𝟐 Ahora bien, luego de los cálculos anteriores, resulta imperativo obtener el coeficiente de determinación, el cual, nos permitirá determinar el “ajuste” del modelo.

COEFICIENTE DE DETERMINACIÓN (𝒓𝟐 ) Partiendo de la fórmula: 𝒓𝟐 =

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) √[𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝒏(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

Procedamos a sustituir los valores en la fórmula: 𝒓𝟐 =

10(14.164,28) − (341,50)(409,15) √[10(11.816,25) − (341,50)2 ][10(∑ 17.038,67) − (∑ 409,15)2 ]

Continuamos: 𝒓𝟐 =

141.642,80 − 139.724,725 √(118.162,50 − 116.622,25)(170.386,70 − 167.403,72) 𝒓𝟐 =

1.918,075 √(1.540,25)(2.982,98)

𝒓𝟐 =

1.918,075 √4.594.543,95

𝒓𝟐 =

1.918,075 2.143,49

En cuyo caso, el coeficiente de determinación sería: 𝒓𝟐 = 𝟎, 𝟖𝟗𝟒𝟖𝟑𝟖 Dado el valor, se puede deducir que el modelo explica el 89,48% del comportamiento del valor de la variable. COEFICIENTE DE CORRELACIÓN (𝒓) Partiendo de que la fórmula del coeficiente de correlación (r), es:

UNIDADES IV Y V

Dr. Alí Javier Suárez-Brito 10 Estadística

𝒓=√

𝒏(∑ 𝑋. 𝑌) − (∑ 𝑋)(∑ 𝑌) √[𝒏(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝒏(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

Y que, en resumen: 𝒓 = ±√𝒓𝟐 Procedemos a obtener el coeficiente de correlación para determinar el grado de asociación entre los beneficios netos (Y) y la rotación de inventarios (X). Así: 𝑟 = ±√𝑟 2 𝑟 = ±√0,894838 El resultado sería: 𝒓 = 𝟎, 𝟗𝟒𝟓𝟗𝟓𝟗 El resultado es positivo porque la relación entre las variables es directa. Este coeficiente de correlación muestra un muy alto grado de asociación entre ambas variables, lo que, ratifica que la asociación lineal (positiva) entre ambas es de gran magnitud.

UNIDADES IV Y V

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.