Tema 3. Relación entre dos variables cuantitativas

Tema 3. Relaci´ on entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersi´ on Cuando sobre cada individuo de una poblaci´on se o

1 downloads 79 Views 208KB Size

Recommend Stories


Tema 3. Resistores Variables
Tema 3. Resistores Variables Indice • Definición y partes • Aplicaciones – Montaje en reóstato – Montaje en potenciómetro • Leyes de variación • Co

Tema 2 DESCRIPCIÓN DE LA RELACIÓN ENTRE DOS VARIABLES NUMÉRICAS
Tema 2 DESCRIPCIÓN DE LA RELACIÓN ENTRE DOS VARIABLES NUMÉRICAS 1. DESCRIPCIÓN CONJUNTA DE LAS OBSERVACIONES DE DOS VARIABLES El tema 1 desarrollab

Prueba ji-cuadrado: χ 2. Estudiar la relación entre dos variables cualitativas. Estudiar la relación entre dos variables cualitativas
ÁNALISIS BIVARIADO Estudiar la relación entre dos variables cualitativas ÁNALISIS BIVARIADO Estudiar la relación entre dos variables cualitativas

Funciones de dos variables
Prof. Enrique Mateus Nieves Doctorando en Educación Matemática. Funciones de dos variables Una función f :  2   se representa a menudo mediante el

Story Transcript

Tema 3. Relaci´ on entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersi´ on Cuando sobre cada individuo de una poblaci´on se observan simult´aneamente dos caracter´ısticas cuantitativas X e Y , se dice que se est´ a observando una variable estad´ıstica bidimensional, que se representa por (X, Y ). La representaci´ on gr´ afica m´ as usual es el diagrama de dispersi´ on o nube de puntos, que consiste en situar en un sistema de ejes coordenados los puntos que resultan de tomar en el eje horizontal los valores de una de las variables y en el eje vertical los valores de la otra.

3.2. Coeficiente de correlaci´ on lineal • Covarianza entre X e Y : n X

sxy =

n X

(xi − x)(yi − y)

i=1

n

=

x i yi

i=1

n

− x y.

De la f´ormula anterior se deduce que la unidad de medida de sxy es el producto de la unidad de X por la unidad de Y . • Coeficiente de correlaci´ on lineal de Pearson entre X e Y : sxy rxy = . sx sy • De la f´ormula anterior se deduce que rxy no tiene unidad de medida. • Propiedad del coeficiente de correlaci´ on lineal : el resultado de rxy siempre est´a comprendido entre −1 y 1; es decir, −1 ≤ rxy ≤ 1 . • Interpretaci´ on descriptiva del coeficiente de correlaci´ on lineal : ? Si rxy > 0, existe relaci´ on lineal directa entre X e Y ; es decir, al aumentar la variable X, aumenta la variable Y . ? Si rxy < 0, existe relaci´ on lineal inversa entre X e Y ; es decir, al aumentar la variable X, disminuye la variable Y .

Dra. Josefa Mar´ın Fern´ andez. Grado en Informaci´ on y Documentaci´ on. Estad´ıstica. Tema 3

2

? Si rxy = 1, existe dependencia lineal directa exacta entre X e Y ; es decir, los puntos del diagrama de dispersi´ on est´ an situados sobre una l´ınea recta de pendiente positiva. ? Si rxy = −1, existe dependencia lineal inversa exacta entre X e Y ; es decir, los puntos del diagrama de dispersi´ on est´ an situados sobre una l´ınea recta de pendiente negativa. ? Si rxy = 0, no existe dependencia lineal entre X e Y . ? Cuanto m´ as se aproxime rxy a −1 o a 1, m´as dependencia lineal existe entre X e Y . Y cuanto m´as se aproxime rxy a 0, m´ as independencia lineal existe entre X e Y .

3.3. Recta de regresi´ on • Recta de regresi´ on de Y sobre X: aquella que permite predecir los resultados de la variable Y a partir de los valores de la variable X. • Ecuaci´on de la recta de regresi´ on (m´ınimo cuadr´atica) de Y sobre X: Yˆ = A + B X , donde: B =

sxy sy = rxy , 2 sx sx

A = y − Bx.

• Recta de regresi´ on de X sobre Y : aquella que permite predecir los resultados de la variable X a partir de los valores de la variable Y . • Ecuaci´on de la recta de regresi´ on (m´ınimo cuadr´atica) de X sobre Y : ˆ = A∗ + B ∗ Y , X donde: B∗ =

sxy sx = rxy , s2y sy

A∗ = x − B ∗ y .

3

Dra. Josefa Mar´ın Fern´ andez. Grado en Informaci´ on y Documentaci´ on. Estad´ıstica. Tema 3

Ejemplos que se van a resolver en clase Ejemplo 3.1. La tabla siguiente muestra la vejez (a˜ nos desde su publicaci´on) y la frecuencia de uso (n´ umero de veces que se consulta en un a˜ no) de ocho libros: Tabla 3.1

Vejez del libro Frecuencia de uso

1 40

3 18

2 30

4 21

3 26

5 10

4 13

3 35

Dibujar el diagrama de dispersi´ on. Ejemplo 3.2. Con los datos de la Tabla 3.1 calcular el coeficiente de correlaci´on lineal entre ambas variables. ¿C´ omo se puede calificar el grado de relaci´on lineal: muy fuerte, fuerte, moderado, d´ebil o muy d´ebil? ¿La relaci´ on es directa o inversa? Razonar las respuestas. Ejemplo 3.3. Con los datos de la Tabla 3.1 determinar la ecuaci´on de la recta de regresi´on de la frecuencia de uso sobre la vejez del libro. Sobre el mismo gr´afico en el que se ha hecho el diagrama de dispersi´ on, representar gr´aficamente la recta de regresi´on. Estimar el n´ umero anual de veces que se prestar´ıa un libro publicado hace 6 a˜ nos. ¿Es fiable esta estimaci´ on? Justificar la respuesta. Ejemplo 3.4. Con los datos de la Tabla 3.1 determinar la ecuaci´on de la recta de regresi´on de la vejez del libro sobre la frecuencia de uso. Predecir la vejez de un libro que no fuese consultado ninguna vez durante todo el a˜ no. ¿Es fiable esta predicci´on? ¿Por qu´e?

Dra. Josefa Mar´ın Fern´ andez. Grado en Informaci´ on y Documentaci´ on. Estad´ıstica. Tema 3

4

Problemas propuestos Problema 3.1. El n´ umero de libros prestados a los estudiantes y a los profesores de los diferentes departamentos de una universidad en un curso acad´emico determinado ha sido: Departamento Agricultura Antropolog´ıa Biolog´ıa Bot´ anica Cristalograf´ıa F´ısica Geolog´ıa Inform´ atica Ingenier´ıa Matem´ aticas Mineralog´ıa Psicolog´ıa Qu´ımica Zoolog´ıa

Estudiantes 396 1.122 311 562 149 1.446 1.579 557 1.044 710 52 1.153 737 1.343

Profesores 70 340 273 181 33 704 556 233 434 437 22 495 473 462

a) Dibujar el diagrama de dispersi´on. b) Calcular el coeficiente de correlaci´on lineal entre ambas variables. ¿C´omo se puede calificar el grado de relaci´ on lineal entre ambas variables: muy fuerte, fuerte, moderado, d´ebil o muy d´ebil? Razonar la respuesta. c) Determinar la ecuaci´ on de la recta de regresi´on del n´ umero de libros prestados a los estudiantes sobre el n´ umero de libros prestados a los profesores. Estimar el n´ umero de libros prestados a los estudiantes que puede esperarse cuando el n´ umero de libros prestados a los profesores sea de 400. ¿Es fiable esta estimaci´on? Justificar la respuesta. Problema 3.2. El tama˜ no de la poblaci´on y el n´ umero de libros prestados por las bibliotecas de once ciudades fue: Poblaci´ on × 100.000 1140 5 250 9 40 2 70 5 60 7 60 5 60 0 50 9 40 6 40 5 40 3

No de pr´estamos × 100.000 860 0 350 8 510 3 470 3 70 5 940 7 770 0 390 9 180 0 360 0 680 9

a) Calcular el coeficiente de correlaci´on lineal entre ambas variables. ¿C´omo se puede calificar el grado de relaci´ on lineal entre ambas variables: muy fuerte, fuerte, moderado, d´ebil o muy d´ebil? Razonar la respuesta. b) Pronosticar el n´ umero de libros prestados por las bibliotecas de una ciudad de un mill´ on de habitantes. Decir si es fiable este pron´ostico, razonando la respuesta. Problema 3.3. Los siguientes datos se refieren al n´ umero de libros y de revistas que reciben mensualmente doce bibliotecas elegidas al azar.

Dra. Josefa Mar´ın Fern´ andez. Grado en Informaci´ on y Documentaci´ on. Estad´ıstica. Tema 3

libros 1.090 7.420 4.200 8.250 8.810 1.620 3.840 9.400 3.630 14.100 2.500 11.470

5

revistas 24 92 67 158 81 59 54 171 100 276 122 200

a) Calcular el coeficiente de correlaci´on lineal entre ambas variables. ¿C´omo se puede calificar el grado de relaci´ on lineal entre ambas variables: muy fuerte, fuerte, moderado, d´ebil o muy d´ebil? Razonar la respuesta. b) Estimar el n´ umero de revistas que recibir´ıa una biblioteca en un mes en el que le enviaran 5.000 libros. ¿Es fiable esta estimaci´on? Justificar la respuesta.

Dra. Josefa Mar´ın Fern´ andez. Grado en Informaci´ on y Documentaci´ on. Estad´ıstica. Tema 3

6

Soluciones de los problemas propuestos Soluci´ on del problema 3.1. Sea X =n´ umero de libros prestados a los estudiantes de cada departamento de la determinada universidad, durante el determinado curso acad´emico e Y =n´ umero de libros prestados a los profesores de cada departamento de la determinada universidad, durante el determinado curso acad´emico. (a) El diagrama de dispersi´ on o nube de puntos consiste en situar en un sistema de ejes coordenados los puntos que resultan de tomar en el eje horizontal los valores de una de las variables y en el eje vertical los valores de la otra. (b) El coeficiente de correlaci´ on lineal entre X e Y es rxy = 00 8851. Como este coeficiente est´a bastante pr´ oximo a 1, la relaci´ on lineal entre ambas variables se puede calificar de fuerte. (c) La recta de regresi´ on del n´ umero de libros prestados a los estudiantes sobre el n´ umero de libros prestados a los profesores es la recta de regresi´on de X sobre Y , cuya ecuaci´on es: b = 950 9530 + 20 0831 Y X El n´ umero de libros prestados a los estudiantes que puede esperarse cuando el n´ umero de libros b = 950 9530 + 20 0831 · 400 = 9290 193; es decir, 929 prestados a los profesores sea de 400 es: X libros, aproximadamente. Esta estimaci´ on es bastante fiable ya que el coeficiente de correlaci´on lineal est´a bastante pr´oximo a 1 y, por tanto, los puntos de la recta de regresi´on y los puntos del diagrama de dispersi´on est´ an bastante pr´ oximos. Soluci´ on del problema 3.2. Sea X =n´ umero de habitantes de cada ciudad, multiplicado por 100.000 e Y =n´ umero de libros prestados por la biblioteca de cada ciudad, multiplicado por 100.000. (a) El coeficiente de correlaci´ on lineal entre X e Y es rxy = 00 3846. Como este coeficiente est´a pr´oximo a cero, la relaci´ on lineal entre ambas variables se puede calificar de d´ebil. (b) Para hacer este pron´ ostico hay que determinar la ecuaci´on de la recta de regresi´on de Y sobre X, que es: Yb = 450 4902304 + 00 32532773 X. El pron´ostico del n´ umero de libros prestados por las bibliotecas de una ciudad de un mill´on de b habitantes es: Y = 450 4902304+00 32532773·10 = 480 7435077 multiplicado por 100.000=4.874.3500 77 libros; es decir, aproximadamente 4.874.351 libros. Este pron´ ostico es poco fiable ya que el valor del coeficiente de correlaci´on lineal entre X e Y est´a pr´oximo a cero y, por tanto, los puntos de la recta de regresi´on y los puntos del diagrama de dispersi´ on est´ an bastante alejados. Soluci´ on del problema 3.3. Sea X =n´ umero de libros recibidos mensualmente por cada biblioteca e Y =n´ umero de revistas recibidas mensualmente por cada biblioteca. (a) El coeficiente de correlaci´ on lineal entre X e Y es rxy = 00 8605. Como este coeficiente est´a bastante pr´ oximo a 1, la relaci´ on lineal entre ambas variables se puede calificar de fuerte. (b) Para hacer esta estimaci´ on hay que determinar la recta de regresi´on de Y sobre X, que es: Yb = 210 6844 + 00 0150 X. La estimaci´ on del n´ umero de revistas que recibir´ıa una biblioteca en un mes en el que le enviaran 5 000 libros es: Yb = 210 6844+00 0150·5 000 = 960 6082; es decir, 97 libros, aproximadamente. Esta predicci´ on es bastante fiable ya que el valor del coeficiente de correlaci´on lineal entre X e Y est´a bastante pr´ oximo a 1 y, por tanto, los puntos de la recta de regresi´on y los puntos del diagrama de dispersi´ on est´ an bastante pr´oximos.

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.