Regresión y Correlación

Regresión y Correlación 1.- El número de turistas (en millones) entrados en España mensualmente durante los años 2001 y 2002 se expone en la siguiente

2 downloads 115 Views 1018KB Size

Recommend Stories


y
1 4 5 6 7 8 9 10 11 12 13 14 15 16 12 19 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 11 y 12 35 36 37 38 39 40 41 42 43 44 45 46 47

y
Regional Distrito Capital La Regional Distrito Capital del Servicio Nacional de Aprendizaje SENA, de conformidad con los principios de transparencia

DESUSO Y VENTA Y REEMPLAZO
DESUSO Y VENTA Y REEMPLAZO Bienes muebles amortizables fuera de uso. Tratamiento impositivo: cuando alguno de los bienes amortizables, salvo los inmu

73 y las leyes , , , y )
Ley Nº 17.671 Registro Nacional de las Personas (Con las reformas del decreto-ley 1301/73 y las leyes 20.974, 21.807, 22.435, 22.863 y 23.023) Identif

Story Transcript

Regresión y Correlación 1.- El número de turistas (en millones) entrados en España mensualmente durante los años 2001 y 2002 se expone en la siguiente estadística. Nº Turistas 2001

2,76

2,62

2,92

3,8

4,4

4,81 8,93 9,98 5,91 4,34 2,62 3,65 4,7283 5,4129

Nº Turistas 2002

2,89

2,63

3,2

3,19

4,52

4,77 8,91 9,99 5,95 4,35 2,87

3,7

4,7475 5,3203

a) Calcular en qué año hubo mayor dispersión de turistas por mes. b) Calcular la matriz de covarianzas. c) Calcular el coeficiente de correlación lineal entre los dos años e interpretarlo.

2.- Se ha tomado un grupo de parejas (con hijos) y se les ha preguntado a qué edad tuvieron su primer hijo. La información se recoge en la tabla adjunta (x = edad del padre, y = edad de la madre). Se pide: x\y 18-22 22-26 26-30 30-34 34-38

17-21 5

21-25 2 3

25-29

29-33

33-37

9 4

1 6 6 3

10 7 4

a) Estimar mediante la recta de regresión, la edad del padre, si la madre tuvo una edad de 25 años. b) Estimar mediante la recta de regresión la edad de la madre si el padre tuvo una edad de 25 años. c) Calcular e interpretar el coeficiente de correlación lineal (r) y el coeficiente de determinación (R2). d) Representar el polígono de frecuencias absoluta y el polígono de frecuencias absolutas acumuladas de la distribución marginal de los padres. e) Calcular la mediana y el percentil 90 de la distribución marginal de las madres. f) Qué media es más representativa. Justificar la respuesta.

3. La tabla siguiente muestra las respectivas estaturas x, y de una muestra de 12 padres y sus hijos mayores. Estatura x del padre

169 164

174

167 177 162

182 172

177 174 179

185

Estatura y del hijo

177 172

177

169 180 172

177 169

185 174 177

182

A) B) C) D) E)

Calcular Q1, Q3 y la mediana de las estaturas “y” de los hijos. Explicar cuál de las dos estaturas es más dispersa. Hallar e interpretar el coeficiente de correlación lineal. Calcular la recta de regresión de x sobre y. Varianza explicada y residual. ¿Qué estatura tendrá el hijo mayor de un padre que mide 177 cm?

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 1

Regresión y Correlación 4.- La tabla siguiente muestra cómo se distribuye las notas en Matemáticas y Física de 25 estudiantes X\Y [20 a 26) [26 a 32) [32 a 38) [38 a 44) [44 a 50) [14 a 20) 1 [20 a 26) 3 1 [26 a 32) 2 5 2 [32 a 38) 1 4 1 [38 a 44) 1 3 [44 a 50) 1 Sobre la distribución marginal X (Matemáticas) calcular: a) La media, y la cuasivarianza. b) Representar un diagrama de cajas y estudiar si existen puntos atípicos. Sobre la distribución marginal Y (Física) calcular: c) La media, la varianza de la muestra. d) Representar el histograma de frecuencias absolutas y el polígono de frecuencias absolutas acumuladas. Respecto de ambas variables e) Hallar e interpretar el coeficiente de correlación lineal. f) Calcular el porcentaje de la variación total de la variable nota de física que se explica mediante la relación con la variable nota de matemáticas. g) Hallar la recta de regresión que permite estimar la nota de física conocida la nota de matemáticas.

5.- De una variable estadística bidimensional se conocen los siguientes datos: ∑ x= 140; ∑ y= 90; N= 12; σx= 3.5; σy= 2.2 y el coeficiente de correlación lineal r = 0.9. Calcular: A) La recta de regresión de y sobre x. B) La recta de regresión de x sobre y. C) El valor de x para un valor de y=7. D) El punto de intersección de las rectas de regresión. E) Varianza residual. F) Varianza explicada. G) Coeficiente de determinación. H) Matriz de covarianzas.

6.- De un cierto estudio estadístico se sabe, que las rectas de regresión de la variable 1 4x + 2y = 2 1. estadística (X,Y) son   y que la varianza marginal de la variable Y es σ y = 1 5x + 3y = Hallar: a) El coeficiente de correlación lineal. b) Las medias marginales. c) La varianza marginal de X ( σ2x ).d) El valor estimado para y sabiendo que x=0.

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 2

Regresión y Correlación 7.-Se han realizado 10 mediciones de distintas distancias (x) y se ha estimado el correspondiente error (y), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada: a) Hallar la distancia media, el error medio. y las varianzas de las variables distancias y errores. b) Hallar ambas rectas de regresión, los coeficientes de regresión, las pendientes de las rectas de regresión y el coeficiente de correlación lineal.

Y

0.1

0.2

0.3

0.4

0.5

0.01

3

0

0

0

0

0.02

1

1

0

0

0

0.03

0

1

2

0

0

0.04

0

0

0

1

1

X

8.- Se han hallado la velocidad media y la distancia a la Tierra de 10 nebulosas, tal como se indica en la siguiente tabla: x 6 9 24 38 46 48 52 75 118 196 y 1,2 1,8 3,3 7,2 7 9,1 11 14,5 22,9 36,3 La variable x representa la velocidad media en cientos de km/s, y la variable y, la distancia a la Tierra en millones de parsecs. El parsec equivale a 3,6 años-luz, o sea, es la distancia a la cual se ve el diámetro de la órbita terrestre bajo un ángulo de 1’. Determinar el coeficiente de correlación lineal. 9.- Sea una parcela o porción de terreno, en la cual se han tomado las coordenadas relativas de los 12 puntos que se expresan en la tabla: Estaca X Y 1

37

64

2

39

71

3

29

53

4

42

67

5

31

55

6

30

58

7

35

77

8

28

57

9

32

56

10

22

51

11

41

76

12

37

68

a) Hallar el intervalo X ± σX . ¿Qué tanto por ciento de valores en la variable X quedan dentro de dicho intervalo?

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 3

Regresión y Correlación Siendo la distribución conjunta (X, Y) b) Calcular la matriz de covarianzas. c) El coeficiente correlación lineal. Interpretarlo d) La recta de regresión de Y sobre X. e) Varianza residual. f) El coeficiente de determinación. Interpretarlo. 10.- Se ha preguntado a 10 alumnos las horas de estudio (X) y la calificación obtenida en 1   − x + 2y = Estadística (Y) y como resultado obtenemos las rectas de regresión:   y que 1  −5x + 3y =

1 . Se pide: la varianza marginal de la variable Y es σ 2y = a) El coeficiente de correlación lineal. b) Las medias marginales.c) La covarianza d) ¿Qué tiempo tiene que dedicar como mínimo para poder aprobar? 11.-. La intensidad de corriente I, que se aprecia en un amperímetro varía con la fuerza electromotriz aplicada E, de acuerdo con la tabla de datos experimentales adjunta: E 5 10 1.5 20 25 30 I -7 -2 1.0 4 10 12 Determinar: a) La matriz de covarianzas. b) El coeficiente de correlación lineal e interpretarlo. c) La recta de regresión de la variable intensidad sobre la fuerza electromotriz. ¿Cuál será el valor estimado de la intensidad para una fuerza electromotriz de 20? 12.- La siguiente tabla representa una muestra de 6 valores de una variable estadística bidimensional (x,y). x 5 4 3 2 1 0 y 6.2 5.6 3.4 2.3 1.9 1.2 a) Representar el diagrama de dispersión. A la vista del diagrama de dispersión es lógico adoptar un ajuste lineal. b) Calcular: b1) La matriz de covarianzas. b2) El coeficiente de correlación lineal. Interpretarlo. c) Hallar la ecuación de la recta de regresión lineal y estimar el valor de “y” para x = 4. d) Calcular d1) La varianza residual. d2La varianza explicada por el ajuste lineal. 13.- Los siguientes datos representan los resultados, notas, de una determinada asignatura (Y) y el número de horas de estudio semanales (X) de 16 alumnos. ∑ xi = 96 ∑ yi = 64 ∑ xi ⋅ yi = 492 i

∑x

i

2 i

= 657

i

∑y

i 2 i

= 526

i

Se pide: a) Estimar el modelo de regresión simple que relaciona los resultados obtenidos con el número de horas dedicadas al estudio. b) Calcule una medida de la bondad del ajuste e interprete el resultado. c) Si un alumno ha estudiado 8 horas, ¿qué nota espera obtener en el examen? U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 4

Regresión y Correlación d) ¿Cuál es el número de horas mínimo que un alumno debe estudiar para superar la asignatura? Considerad que el 5 es el aprobado. 14.- La siguiente tabla indica los litros de cerveza vendidos en un bar y la temperatura (en ºC) en la ciudad durante 5 días, temperatura 34 25 32 37 39 cerveza 187 123 198 232 267 a) ¿Existe correlación entre la temperatura y los litros de cerveza vendidos? b) Hallar e interpretar el coeficiente de determinación. c) Calcular la varianza residual del ajuste lineal de y (litros) sobre x (temperatura). d) Predecir la cantidad de cerveza que se vendería en este bar un día con una temperatura de 35ºC. 15.- Los neumáticos subinflados o sobreinflados pueden acelerar el desgaste de los neumáticos y aumentar o disminuir el consumo. Se toma una muestra de tamaño 14 resultando: L: libras por pulg2

30

30

31

31

32

32

33

M : millas

29.5

30.2

32.1

34.5

36.3

35.0

38.2

L: libras por pulg2

33

34

34

35

35

36

36

M : millas

37.6

37.7

36.1

33.6

34.2

26.8

27.4

a) Hallar la matriz de covarianzas. b) Los coeficientes de correlación lineal (r) y de determinación (R2). Interpretarlos. c) Calcular la recta de regresión de L/M d) Calcular la varianza residual 16.- Conocidas la media aritmética y la varianza de cada una de las variables asociadas a una distribución bidimensional, X =3, Y =2, σ2x=6, σ2y=8 de la que se conoce, además, la recta de regresión de Y sobre X, 2x+3y-12=0. Obtener el coeficiente de correlación lineal y la recta de regresión de X sobre Y. 17.- Sea la distribución conjunta de la variable x = “número de habitaciones de un piso” con respecto a la variable y = “precio de alquiler en euros”. x\y 0-500 500-1000 1000- 1500 2 2 2 0 3 8 12 16 4 4 13 18 Se pide: a) Distribuciones marginales de las variables x e y. b) Moda y mediana de las variables x e y. c) Centro de gravedad de la distribución conjunta. d) Recta de regresión de x sobre y. U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 5

Regresión y Correlación e) Coeficiente de correlación lineal. f) Si disponemos de 600 euros ¿Cuál es el mayor número de habitaciones de un piso de alquiler que podemos conseguir? 18.- A partir del diagrama de dispersión

Se pide: a) Coeficiente de correlación lineal. b) Recta de regresión de y sobre x. c) Si y=2 ¿qué valor se puede estimar para la variable x? d) Representar las rectas de regresión sobre el diagrama de dispersión. 19.- En una unidad de pediatría, se obtuvieron los siguientes datos respecto a los pesos y edades de los niños atendidos. Peso en kilos 0 0–4 2 4–8 4 8 – 12 12 – 16 16 - 20

Edad en años 1 2 3 2 8 1

2 9 2

7 8

4

14 1

a) Obtener la mediana del peso en kilos. b) ¿Qué distribución tiene mayor dispersión relativa? c) Si un niño tiene 2 años y pesa 10 kg, ¿qué percentil representa entre los niños de 2 años? d) Hallar el sesgo de la distribución de peso en kilos. e) Hallar el coeficiente de correlación lineal. Interpretarlo. f) Si un niño tiene un año ¿cuál será su peso estimado? g) Si un niño pesa 10 kilos ¿cuántos años se estima que tendrá?

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 6

Regresión y Correlación 1.- El número de turistas (en millones) entrados en España mensualmente durante los años 2001 y 2002 se expone en la siguiente estadística. X

σx

Nº Turistas 2001

2,76

2,62

2,92

3,8

4,4

4,81 8,93 9,98 5,91 4,34 2,62 3,65 4,7283 2,3266

Nº Turistas 2002

2,89

2,63

3,2

3,19

4,52

4,77 8,91 9,99 5,95 4,35 2,87

3,7

4,7475 2,3066

a) Calcular en qué año hubo mayor dispersión de turistas por mes. b) Calcular la matriz de covarianzas. c) Calcular el coeficiente de correlación lineal entre los dos años e interpretarlo. Solución:

a) σ x 2,3266 = ≈ 0, 49205 . X 4, 7283

CV(2001) =

CV(2002) =

σ y 2,3066 = ≈ 0, 4850 . Y 4, 7475

La dispersión en el año 2001 es un poco mayor.

b)

∑x y n i

= σ xy

i

n

i

i

−= XY

12611,5 − 4, 7283 ⋅ 4, 7475 = 4, 7475 12

 σ2x σ xy   5, 4129 5,3438  = Σ =  σ xy σ 2y   5,3438 5,3203   

c) = rxy

σ xy 5,3438 = ≈ 0,996 . La correlación lineal es directa y casi perfecta σ x σ y 2,3266 ⋅ 2,32066

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 7

Regresión y Correlación 2.- Se ha tomado un grupo de parejas (con hijos) y se les ha preguntado a qué edad tuvieron su primer hijo. La información se recoge en la tabla adjunta (x = edad del padre, y = edad de la madre). Se pide: a) Estimar mediante la recta de regresión, la edad del padre, si la madre tuvo una edad de 25 años. b) Estimar mediante la recta de regresión la edad de la madre si el padre tuvo una edad de 25 años. c) Calcular e interpretar el coeficiente de correlación lineal (r) y el coeficiente de determinación (R2). d) Representar el polígono de frecuencias absoluta y el polígono de frecuencias absolutas acumuladas de la distribución marginal de los padres. e) Calcular la mediana y el percentil 90 de la distribución marginal de las madres. f) Qué media es más representativa. Justificar la respuesta. x

y 18-22 22-26 26-30 30-34 34-38

17-21 5

21-25 2 3

25-29

29-33

33-37

9 4

1 6 6 3

10 7 4

Solución: x\y

19

23

20

5

2

24

3

27

31

35

ni.xi

ni.(xi-m)2

7

140

448

13

312

208

9

1

4

6

10

20

560

0

32

6

7

13

416

208

36

3

4

7

252

448

28

n.j

5

5

13

16

21

60

1680

1312

n.jyj

95

115

351

496

735

Y = 29,87

X = 28

σ 2x =21,87

n.j(yj-m)2 590,78 235,98 107,08 20,43 552,65

f)

ni.

x = 28 y = 29,87

σ x = 4,68 σ y = 5,01

σ 2y =25,12

CV(x)=0,17

CV(y)=0,17

Las dos medias, son igual de representativas, ya que, los coeficientes de variación son iguales.

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 8

Regresión y Correlación x\y

19

27

31

5832

744

3024

5208

9800

32

5952

7840

36

3348

5040

20

23

1900

24

35

920 1656

28

1900

2576

8856

15252

22680

51264

covarianza 18,13 a) Recta de regresión de x sobre y: x −= X = ( x − 28 )

σ 2y

( y − Y)

18,13 x 0,83y + 3, 24 ⇒ x= 0,83 ⋅ 25 + 3, 24= 24 ( y − 29,87 ) ⇒= 21,87

b) Recta de regresión de y sobre x: y −= Y

( y − 29,87 )= c)= rxy

σ xy

σ xy σ2x

(x − X)

18,13 y 0, 72x + 9, 66 ⇒ y= 0, 72 ⋅ 25 + 9, 66= 27, 7 ( x − 28) ⇒= 25,12

σ xy = 0, 77 , por tanto, la relación lineal es directa pero no demasiado buena. σx σy

R 2 = 0,6 , el ajuste no es demasiado bueno. d) Polígonos de frecuencia, absoluta y absoluta acumulada de la distribución marginal “padres”. 25 20 15 10 5 0 16.

18 - 22 22 - 26 26 - 30 30 - 34 34 - 38

e) Mediana; M = 29 +

40.

70 60 50 40 30 20 10 0 18.

22.

26.

30.

34.

38.

28 60 = 30, 75 Percentil 90; P90 =33 + = 35,86 16 21

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 9

Regresión y Correlación 3. La tabla siguiente muestra las respectivas estaturas x, y de una muestra de 12 padres y sus hijos mayores. Estatura x del padre

169 164

174

167 177 162

182 172

177 174 179

185

Estatura y del hijo

177 172

177

169 180 172

177 169

185 174 177

182

A) B) C) D) E) Solución:

A)

Calcular Q1, Q3 y la mediana de las estaturas “y” de los hijos. Explicar cuál de las dos estaturas es más dispersa. Hallar e interpretar el coeficiente de correlación lineal. Calcular la recta de regresión de x sobre y. Varianza explicada y residual. ¿Qué estatura tendrá el hijo mayor de un padre que mide 177 cm?

y

Si ordenamos la variable y de menor a mayor N = 3 ⇒ Q1 = 172 ; 169 172 174 177 180 182 185 4

ni

2

2

1

4

1

1

1

Ni

2

4

5

9

10

11

12

3N = 9 ⇒ Q3 = 177.5 ; 4 N = 6 ⇒ M = 177 2

= X

2082 547 2 = 173.5; σ= = 45.5833 x 12 12

(x − X) ( y − Y) 2

2

x

y

169

177

20,25

1.17506

29913

2111 270.917 = 175.916 = = 22.5764 . . σ2y 12 12 4.7514 CV(y) = 0.027 σ y =4.7514 = 175.916

164

172

90.25

15.3351

28208

174

177

0.25

1.17506

30798

167

169

42.25

47.8311

28223

B) La estatura de los padres es más dispersa

177

180

12.25

16.6791

31860

162

172

132.25

15.3351

27864

182

177

72.25

1.17506

32214

172

169

2.25

47.8311

29068

177

185

12.25

82.5191

32745

174

174

0.25

3.67106

30276

179

177

30.25

1.17506

31683

185

182

132.25

37.0151

33670

2082 2111

547

σ x =6.7515

6.7515 CV(x) = = 0.0389 173.5

= Y

por tener su coeficiente de variación mayor.

366522 = σ xy − 173.5 ⋅175.916 = 22.074 . 12

= C) rxy

22.074 = 0.688 Directa 6.7515 ⋅ 4.7514

D) Recta de regresión de x sobre y: σ xy x −= X y−Y σ 2y

(

x − 173.5 =

)

xy

270.917 366522

22.074 (y − 175.916) 22.5764

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 10

Regresión y Correlación x = 0.978 y + 1.499

La varianza explicada σ2y ⋅ R 2 =22,5764 ⋅ 0, 6882 ≈ 10.686 La varianza residual o no explicada σ2r =σ2y (1 − R 2 ) =22,5764 ⋅ (1 − 0, 6882 ) ≈ 11.89

E) Recta de regresión de Y sobre X: y −= Y

y − 175.916=

σ xy σ2x

(x − X)

22.074 (x − 173.5) ó y = 0.484 x + 91.897 45.5833

Si la estatura del padre es x=177 sustituyendo en la ecuación anterior se obtiene y=177.56.

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 8

Regresión y Correlación 4.- La tabla siguiente muestra cómo se distribuye las notas en Matemáticas y Física de 25 estudiantes X\Y [20 a 26) [26 a 32) [32 a 38) [38 a 44) [44 a 50) [14 a 20) 1 [20 a 26) 3 1 [26 a 32) 2 5 2 [32 a 38) 1 4 1 [38 a 44) 1 3 [44 a 50) 1 Sobre la distribución marginal X (Matemáticas) calcular: a) La media, y la cuasivarianza. b) Representar un diagrama de cajas y estudiar si existen puntos atípicos. Sobre la distribución marginal Y (Física) calcular: c) La media, la varianza de la muestra. d) Representar el histograma de frecuencias absolutas y el polígono de frecuencias absolutas acumuladas. Respecto de ambas variables e) Hallar e interpretar el coeficiente de correlación lineal. f) Calcular el porcentaje de la variación total de la variable nota de física que se explica mediante la relación con la variable nota de matemáticas. g) Hallar la recta de regresión que permite estimar la nota de física conocida la nota de matemáticas. Solución: a) X = b)

791 1229,8 = 51,24 = 31,64 , S 2x = 24 25

Q1 = 26.833 , Q 3 = 36,75 , 1.5 * IQR = 14.875

Q1 − 1.5 *1QR = 11,96 , Q 3 + 1.5 * IQR = 51,625, M = 31

11.96

14

50 51.62 31

26,8

c)= Y

36.7

911 884.16 = 36, 44 = σ2y = 35,366 25 25

d)

20

26

32

38

U. D. de Matemáticas de la ETSITGC

44

Asignatura: CÁLCULO Y ESTADÍSTICA 9

Regresión y Correlación e)

rxy = 0.7719

f) R 2 = 0.32198

32,198%

g) Recta de regresión de Y sobre X: y −= Y y − 36.44 =

U. D. de Matemáticas de la ETSITGC

σ xy σ2x

(x − X)

32.198 ( x − 31.64) 49.19

Asignatura: CÁLCULO Y ESTADÍSTICA 10

Regresión y Correlación 5.- De una variable estadística bidimensional se conocen los siguientes datos: ∑ x= 140; ∑ y= 90; N= 12; σx= 3.5; σy= 2.2 y el coeficiente de correlación lineal r = 0.9. Calcular: A) La recta de regresión de y sobre x. B) La recta de regresión de x sobre y. C) El valor de x para un valor de y=7. D) El punto de intersección de las rectas de regresión. E) Varianza residual. F) varianza explicada. G) Coeficiente de determinación. H) Matriz de covarianzas Solución:

= X

∑x

i

140 35 = = ;= Y N 12 3

∑y

i σ xy σ xy 90 15 = = ; r= = = 0,9 ⇒ σ= 6,93 xy xy N 12 2 σ x σ y 3,5 ⋅ 2, 2

a) Recta de regresión de y sobre x: y −= Y

σ xy σ2x

(x − X)

15  6,93  35   = x −  ⇒ y 0,5657142857·x + 0,9 y− =  2  2  3,5  3  

b) Recta de regresión de x sobre y: x −= X

σ xy σ 2y

( y − Y)

35  6,93  15   y− = x − =   ⇒ x 1,431818181 ⋅ y + 0,928030303 2  3  2, 2  2 

c) El valor de x se obtiene de la recta de regresión de x sobre y = x 1.431818181 ⋅ y + 0.928030303=1.431818181 ⋅ 7 + 0.928030303  10.95075757

d) El punto de intersección corresponde al centro de gravedad:

( X, Y ) =

 35 15   ,   3 2

e) Depende de la recta de regresión Para la recta de regresión de y sobre x La varianza residual o no explicada σ 2r =σ2x (1 − R 2 ) =3,52 ⋅ (1 − 0,92 ) ≈ 2,3275 Para la recta de regresión de x sobre y La varianza residual o no explicada σ2r =σ2y (1 − R 2 ) =2, 22 ⋅ (1 − 0,92 ) ≈ 0,9196

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 11

Regresión y Correlación f) La varianza explicada σ 2x ⋅ R 2 =3,52 ⋅ 0,92 ≈ 9,9225 La varianza explicada σ2y ⋅ R 2 =2, 22 ⋅ 0,92 ≈ 3,9204

g) 2 2 2 0,81 R= r= 0,9=

Es bastante fiable, pues explica el 81% de la variación entre las variables.

h)  σ2x σ xy   4,84 6,93  = Σ =  σ xy σ 2y   6,93 12, 25   

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 12

Regresión y Correlación 6.- De un cierto estudio estadístico se sabe, que las rectas de regresión de la variable 1 4x + 2y = 2 1. estadística (X,Y) son   y que la varianza marginal de la variable Y es σ y = 1 5x + 3y = Hallar: a) El coeficiente de correlación lineal. b) Las medias marginales. c) La varianza marginal de X ( σ2x ). d) el valor estimado para y sabiendo que x=0. Solución: Buscaremos los coeficientes de regresión despejando x e y:  y= 1  4x + 2y =  ⇒  1  5x + 3y = x= 

1 − 2x 6  3 2 ⇒ r 2 = b xy ⋅ b yx =  −  ⋅ ( −2 ) = > 1 1 3 5  5 − y 5 5

¡Imposible!

Entonces  x= 1  4x + 2y =  ⇒  1  5x + 3y = y= 

1 1 − y  1  5 5 4 2 ⇒ r 2 = b xy ⋅ b yx =  −  ⋅  −  = < 1 1 5  2  3 6 − x 3 3

a)

5 5 r 2 = ⇒ r =±  -0,9128709291 6 6 Correlación inversa y muy fuerte b) 1 4x + 2y =  ⇒ 1 5x + 3y =

1  X = 2  Y = − 1  2

c) σ σ σ 3 1 1 −1/ 2 5 b xy = xy2 = xy = − ⇒ σ xy = − ⇒ b yx = xy2 = 2 = − ⇒ σ 2x = 10 σy 1 2 2 σx σx 3

d) Debemos utilizar la recta de regresión de y sobre x para pode predecir el valor de y: 1 1 5 1 5 y= − x= − 0= 3 3 3 3 3

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 13

Regresión y Correlación 7.- Se han realizado 10 mediciones de distintas distancias (x) y se ha estimado el correspondiente error (y), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada: a) Hallar la distancia media, el error medio. y las varianzas de las variables distancias y errores. b) Hallar ambas rectas de regresión, los coeficientes de regresión, las pendientes de las rectas de regresión y el coeficiente de correlación lineal. Solución: X\Y

0,1 3 1 0 0

0,01 0,02 0,03 0,04 n.j Yjn.j

4 0,4

2

Yj n.j

0,2 0 1 1 0

0,3 0 0 2 0

0,4 0 0 0 1

2

2

1

3 2 3 2

0,4

0,6

0,4

0,04 0,05

0,08 0,05

0,18 0,06

0,16 0,04

0,25 0,04

0,71 0,24

0,005

0,01

0,018

0,016

0,02

0,07

0,024

0,23

m2

0,0007

0,071

0,000124

0,0181

2

m11

Xi2ni. 0,0003 0,0008 0,0027 0,0032

0,24

0,007

0,0069

σ xy

0,00138 0,92115

r a) Distancia media

∑x n i

10 2,3

Xini. 0,03 0,04 0,09 0,08

Y

m1 σ

m10= X=

ni.

1 0,50

RESULTADOS: X

i

0,5 0 0 0 1

Error medio

i

0, 24 = = 0, 024 ; n 10

m 01= Y=

∑y n i

i

n

i

=

2,3 = 0, 23 10

Varianzas:

( )

σ 2x =m 20 − X

( )

σ 2y =m 02 − Y

2

2

∑x n

=

2 i

n

∑y n

=

i

i

2 i

i

n

i

( )

− X

( )

− Y

2

0, 007 = − 0, 0242 =0, 000124 10

2

0, 71 = − 0, 232 =0, 0181 10

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 14

Regresión y Correlación Covarianza:

σ xy = m11 − XY =

∑x y n i

i

n

i

i

− XY =

0, 069 − 0, 024 ⋅ 0, 23 = 0, 00138 10

b) Rectas de regresión Recta de regresión de y sobre x: y −= Y 23) ( y − 0,=

σ2x

(x − X)

0, 00138 0, 024 ) ⇒ y 11,12903225·x − 0.03709677419 ( x −= 0, 000124

Recta de regresión de x sobre y: x −= X = ( x − 0, 024 )

σ xy

σ xy σ 2y

( y − Y)

0, 00138 0, 23) ⇒ x 0,07624309392 ⋅ y + 0.006464088397 ( y −= 0, 0181

Los coeficientes de regresión b= yx

σ xy = 11,12903225 σ2x

b= xy

σ xy = 0,07624309392 σ2y

Las pendientes: b yx = tgα= 11.12903225 ⇒ α =84º 51'56 ''

b= xy

1 = 0.07624309392 ⇒ β =85º 38' 24 '' tgβ

El coeficiente de correlación lineal: σ xy 0,92115 Correlación fuerte y directa r= ± b yx ⋅ b xy = = σx σy

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 15

Regresión y Correlación 8.- Se han hallado la velocidad media y la distancia a la Tierra de 10 nebulosas, tal como se indica en la siguiente tabla: x

6

9

24

38

46

48

52

75

118

196

y

1,2

1,8

3,3

7,2

7

9,1

11

14,5

22,9

36,3

La variable x representa la velocidad media en cientos de km/s, y la variable y, la distancia a la Tierra en millones de parsecs. El parsec equivale a 3,6 años-luz, o sea, es la distancia a la cual se ve el diámetro de la órbita terrestre bajo un ángulo de 1’. Determinar el coeficiente de correlación lineal. Solución: x y x*y 6 1,2 7,2 9 1,8 16,2 24 3,3 79,2 38 7,2 273,6 46 7 322 48 9,1 436,8 52 11 572 75 14,5 1087,5 118 22,9 2702,2 196 36,3 7114,8 612 114,3 12611,5 61,2 11,43 1261,15 covarianza 561,634 coeficientes de regresión:

sumas momentos

x2 36 81 576 1444 2116 2304 2704 5625 13924 38416 67226 6722,6 2977,16

2

y 1,44 3,24 10,89 51,84 49 82,81 121 210,25 524,41 1317,69 2372,57 237,257 106,6121

0,1886476 5,268013668

Medias:

= X

∑x n i

i

i

612 = = 61, 2 ; n 10

= Y

∑y n i

i

i

= n

114,3 = 11, 43 10

Varianzas:

( )

σ 2x =m 20 − X

( )

σ =m 02 − Y 2 y

2

2

∑x n

=

2 i

n

∑y n

=

i

i

2 i

i

n

i

( )

− X

( )

− Y

2

67226 = − 61, 22 =2977,16 10

2

2372,57 = − 11, 432 =106, 6121 10

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 16

Regresión y Correlación Covarianza:

σ xy = m11 − XY =

∑x y n i

i

i

n

i

− XY =

12611,5 − 61, 2 ⋅11, 43 = 561, 634 10

Los coeficientes de regresión: b= yx

σ xy 561, 634 = = 0,1886476 σ2x 2977,16

b= xy

σ xy 561, 634 = = 5, 268013668 σ2y 106, 6121

Coeficiente de correlación lineal: r= ± b yx ⋅ b xy = 0,1886476 ⋅ 5, 268013668 ≈ 0,996 . La correlación lineal es directa y casi perfecta

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 17

Regresión y Correlación 9.- Sea una parcela o porción de terreno, en la cual se han tomado las coordenadas relativas de los 12 puntos que se expresan en la tabla: Estaca

X

Y

1

37

64

2

39

71

3

29

53

4

42

67

5

31

55

6

30

58

7

35

77

8

28

57

9

32

56

10

22

51

11

41

76

12

37

68

c) Hallar el intervalo X ± σX . ¿Qué tanto por ciento de valores en la variable X quedan dentro de dicho intervalo? Siendo la distribución conjunta (X, Y) d) Calcular la matriz de covarianzas. c) El coeficiente correlación lineal. Interpretarlo d) La recta de regresión de Y sobre X. e) Varianza residual. f) El coeficiente de determinación. Interpretarlo. Solución: Y 64

XY

X2

Y2

2368

1369

4096

71

2769

1521

5041

53

1537

841

2809

67

2814

1764

4489

31

55

1705

961

3025

30

58

1740

900

3364

35

77

2695

1225

5929

28

57

1596

784

3249

56

1792

1024

3136

X 37 39 29 42

32

U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 18

Regresión y Correlación 22

51

1122

484

2601

41

76

3116

1681

5776

37

68

2516

1369

4624

Sumas

403

753

25770

13923

48139

a) X ± σX 12

∑x

= X

i

403 = 33,5833; 12

= 12

i =1

12

= σ2x

∑x i =1

n

2 i

( )

2

− X=

13923 2 − 33,58333 = 32, 4097222 12

 σX , X + σX  33.58333333 − 32.4097222 , 33.58333333 + 32, = 4097222   X −= Resultan 9 de los 12 valores de X

22 28 29 30 31 32 35

37

37

39

41

[ 27.89,39.276]

42

Tenemos el 75% de los valores 12

∑y

b) = σ2y

i =1

2 i

( )

n

− Y=

48139 2 − 62, 75 = 74, 0208333 12

− XY =

25770 − 33,58333333 ⋅ 62,= 75 40,1458333 12

2

12

σ = xy

∑x y n i =1

i

i

i

n

 σ2x σ xy   32, 4097222 40,1458333  = Σ =  σ xy σ 2y   40,1458333 74, 0208333   

c)= rxy

σ xy = σx σy

40,1458333 ≈ 0,8196 32, 4097222 74, 0208333

por tanto, la relación lineal es directa y buena d) Recta de regresión de y sobre x: y −= Y = ( y − 62, 75 )

σ xy σ2x

(x − X)

40,146 y 21,15 + 1, 2387x ( x − 33,583) ⇒ = 32, 4097

e) La varianza residual o no explicada σ2r =σ2y (1 − R 2 ) =74, 0208 ⋅ (1 − 0,81962 ) ≈ 49, 729 f) R 2 = 0, 6718

67,18%

es el porcentaje de la variación total de las y que se explica mediante la relación con x U. D. de Matemáticas de la ETSITGC

Asignatura: CÁLCULO Y ESTADÍSTICA 19

Regresión y Correlación 10.- Se ha preguntado a 10 alumnos las horas de estudio (X) y la calificación obtenida en 1   − x + 2y = Estadística (Y) y como resultado obtenemos las rectas de regresión:   y que 1  −5x + 3y =

1 . Se pide: la varianza marginal de la variable Y es σ 2y = a) El coeficiente de correlación lineal. b) Las medias marginales.c) La covarianza d) ¿Qué tiempo tiene que dedicar como mínimo para poder aprobar? Solución: a) Buscaremos los coeficientes de regresión despejando x e y: 1 1  y= + x  1  − x + 2y = 3  1 3 2 2 ⇒ r 2 = b xy ⋅ b yx =   ⋅   =

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.