MEDIA Y VARIANZA (VARIABLES DISCRETAS)

MEDIA Y VARIANZA (VARIABLES DISCRETAS). µ = E ( X ) = ∑ x P( X = x) x σ 2 = V ( X ) = E ( X 2 ) − ( E ( X )) 2 σ = D.E.( X ) = V ( X ) . EJEMPLO Su

2 downloads 188 Views 255KB Size

Story Transcript

MEDIA Y VARIANZA (VARIABLES DISCRETAS).

µ = E ( X ) = ∑ x P( X = x) x

σ 2 = V ( X ) = E ( X 2 ) − ( E ( X )) 2

σ = D.E.( X ) = V ( X ) . EJEMPLO Suponga que se tienen datos de la siguiente variable aleatoria: X = Número de aleateos por segundo de una especie de Polilla. Se obtuvo la siguiente tabla de frecuencias: Valor de X

Frecuencia Relativa P(X = x)

6

0.05

7

0.10

8

0.60

9

0.15

10

0.10

Entonces: E(X) = 6(0.05) + 7(0.10) + . . . + 10(0.10) = 8.15 E(X2) = 36 (0.05) + 49 (0.10) + . . . + 100 (0.10) = 67.25 V(X) = E (X2) - (E(X))2 = (67.25) - (8.15)2 = 0.8725 D.E. (X) = 0.9 Es decir el número promedio de aleteos por segundo de esa especie de Polilla es de 8.15 y en promedio los datos tomados se alejan o desvían del promedio en 0.9 aleteos por segundo.

MODELOS DE PROBABILIDAD PARA VARIABLES DISCRETAS.

1. MODELO BINOMIAL Suponga que hay un experimento que consiste en examinar n individuos y evaluar o medir en cada uno de ellos si se tiene o no una característica dada (sólo hay dos posibles resultados). EJEMPLOS •

Se inyectan 20 ratas con un fármaco que inhibe la síntesis de proteinas del organismo. Lo que se mide en cada rata es si resiste o no (muere) el fármaco.



Se examinan 40 monos y se evalúa el sexo.



Se plantan 20 semillas y se evalúa en cada una de ellas si germina o no.

Sea p la probabilidad de ¨éxito¨ y q = 1-p la de ¨fracaso¨ en cada uno de los n ensayos. Se asume que esta probabilidad es constante en cada uno de ellos. Sea X= Número de éxitos en los n ensayos, por ejemplo: X = Número de ratas que sobreviven X = Número de monos machos X = Número de semillas que germinan. Si se copnoce o se puede estimar p : probabilidad de éxisto en cad ensayo, entonces es posible establecer las probabilidades de ocurrencia de cada evento mediante la siguiente ecuación, denominada modelo de probabilidad binomial :

 n P( X = x) =   p x (1 − p)n−x  x

x = 0, 1, 2, . . ., n

En este modelo:

µ = E ( X ) = np σ 2 = V ( X ) = np(1 − p) EJEMPLO : Suponga que 20 investigadores realizan por separado el experimento de inyectar 20 ratas con unfármaco y cuentan cuantas de ellas sobreviven. Se obtuvo la siguiente tabla de frecuencias. Número de ratas que sobreviven

Frecuencia Absoluta

Frecuancia Relativa

0 1 2 3 4 5 Total

6 6 4 2 1 1 20

0.30 0.30 0.20 0.10 0.05 0.05 1

Para los datos anteriores n= 20, E ( X ) = 1.45 , pˆ =

E( X ) = 0.07 = 7% n

pˆ : probabilidad de que una rata sobreviva al fármaco.

 20  P ( X = 0) =   (0.07) 0 (0.93)19 = 0.23 0 M

 20  P ( X = 5) =   (0.07) 5 (0.93)15 = 0.008 5

Probabilidades Bajo el Modelo Binomial 0.23 0.35 0.25 0.11 0.035 0.008 0.983

2. MODELO DE POISSON

Este modelo es útil para calcular probabilidades de variables aleatorias que miden el número de ventos que ocurren por unidad de tiempo o de espacio. EJEMPLOS :



X = Número de veces que una planta radiactiva emite gases en un periodo de tres meses



Y = Número de plántulas que sobreviven/m2



Z = Número de semillas que germinan /parcela



W = número de góbulos rojos por gota de sangre

Sea λ el número promedio de eventos que ocurren por unidad de tiempo o espacio, entonces las probabilidades de ocurrencia para todos los eventos de las variables del tipo antes mencionado pueden calcularse a través de la siguiente ecuación, denominada modelo de probabilidad de Poisson:

e −λ λx P ( X = x) = x!

x = 0, 1, 2, ...

Bajo este modelo:

µ = E( X ) = λ σ 2 = V (X ) = λ EJEMPLO

En una investigación sobre la distribución espacial de árboles de una plantación de pino rojo, se contó el número de árboles de pino en 60 cuadrantes de una hectárea. Se obtuvo la siguiente tabla de ferecuencias:

Número de Arboles por Cuadrante

Número de Cuadrantes

0 1 2 3 4 5 6 7 8 9 Total

3 9 14 13 9 5 3 2 1 1 60

Frecuencia Relativa Probabilidades Bajo el Modelo de Poisoon 0.05 0.0450 0.15 0.1406 0.23 0.2172 0.21 0.2237 0.15 0.1728 0.08 0.1068 0.05 0.0550 0.03 0.0242 0.02 0.0090 0.02 0.0030 1.00

Las probabilidades de la última columna se obtuvieron aplicando la ecuación del modelo de Poisson, tomando λ = 3.09 = E (X).

P ( X = 0) =

e −3.09 (3.09) 0 = 0.045 0!

M e −3.09 (3.09) 9 P ( X = 9) = = 0.003 9!

EJERCICIOS DE LOS MODELOS BINOMIAL Y POISSON:

1. En una población de animales el 40% son machos. Si se seleccionan al azar 5 animales, cuál es la probabilidad de encontrar: a) 0 machos; b) 3 machos; c) menos de 4 machos; d) más de 3 machos. 2. Se realiza un experimento y se encuentra que con el abono A la probabilidad de que una semilla germine es del 80% y con el abono B del 87%. Con el abono A sembrar 200 semillas cuesta $ 20.000 y con el abono B $ 25.000. Si se siembran 200 semillas bajo cada tipo de abono: a) Cuál es el número esperado de semillas que germina bajo cad tipo de abono; b) Si la utilidad por cada semilla que germina es de $ 150, independientemente del tipo de abono usado, cuál semilla cultivaría teniendo en cuenta la rentabilidad ?. 3. El número promedio de animales por cuadrículas de 1 km2 en una región es de 80. Cuál es la probabilidad de que al seleccionar una cuadrícula de un km2 en esta se encuentren 50 animales ?. 4. El número promedio de freutos por árbol que se pudren antes de la cosecha es de 40. Si se seleccionan aleatoriamente 10 árboles el día de la cosecha, cuál es la probabilidad de encontrar: a) 40 frutos podridos; b) 400 frutos podridos. 5. La probabilidad de que en una zona un cultivo se inunde y se pierda es del 10%. Si se realizan 10 cultivos en la zona, cuál es la probabilidad de que: a) Menos de 5 cultivos se inunden; b) un cultivo se inunde; c) más de 5 cultivos se inunden. 6. En cada una de 20 fincas cafeteras, se seleccionaron aleatoriamente 20 cafetos variedad caturra y se midió en cada uno de ellos si estaban infectados por roya. Se encontraon los siguientes resultados: Número de cafetos infectados Frecuencia (# de Fincas)

5

6

7

8

9

10

6

6

4

2

1

1

Con la información anterior: a) Calcule las frecuencias relativas y relativas acumuladas e interprételas b) Haga los histogramas de frecuencias relativas c) Sea X = Número promedio de cafetos infectados por finca. Calcule el valor esperado, la varianza, la desviación estándar de X, utilizando las fórmulas de valor esperado.

d) La variable X del punto anterior es discreta o continua ?. Explique. e) Que modelo de probabilidad es el más apropiado para la variable X antes decrita?. Explique f) Calcule las probabilidades de ocurrencia de X (x=5, 6, 7, 8, 9, 10) usando el modelo de Poisson con λ igual al valor esperado calculado en el literal c). | g) Calcule las probabilidades de ocurrencia de X (x=5, 6, 7, 8, 9, 10) usando el modelo Binomial con pˆ =

E( X ) , n= 20 y E (X) es el valor promedio n

encontrado en el literal c=. h) Cuál de los dos modelos de probabilidad empleados ajusta mejor ?. Explique. 7. Una bióloga dispone de 8 plantas para hacer un experimento. Ella desconoce que 3 de las 8 plantas están afectadas por una enfermedad. El experimento se realizará con sólo 4 de las 8 plantas. Sea X = número de palntas enfermas seleccionadas para el experimento. Encuentre la probabilidad de que el experimento se realice con dos plantas enfermas y dos normales. 8. Una compañía petrolera dispone de 10 tanques en una región. La probabilidad de que un tanque tenga un derrame/año es del 1%. a). Cuál es la probabilidad de que en un año dado haya 3 tanques que tengan derrames?. b). Defina la variable X y encuentre su valor esperado ?.

MODELOS DE PROBABILIDAD PARA VARIABLES CONTINUAS 1. MODELO NORMAL (GAUSSIANO)

El modelo de probabilidad normal (Gaussiano) es útil para encontrar las probabilidades asociadas a eventos de variables aleatorias cuyas distribuciones de frecuencias son simétricas alrededor del valor promedio. Algunos ejemplos de este tipo de variables aleatorias son los siguientes: •

X = Peso de animales al nacer.



Y = Diámetro de los árboles de un bosque



Z = Altura de las plantas de una especie.



W = Error de medición con un instrumento.

Sea µ el valor promedio de la variable (E(X)) y σ2 su correspondiente varianza (V(X)), entonces las probabilidades de ocurrencia de eventos asociados a los posibles resultados de la variable estudiada pueden ser encontrados usando la siguiente expresión, llamada modelo de probabilidad normal:

b

P(a ≤ X ≤ b ) = ∫ a

1 e 2π σ

x−µ −1 / 2    σ 

2

dx .

Obviamente resultaría muy dispendioso tener que calcular estas integrales para cada valor de a, b, µ y σ . Por esta razón se acude a un procedimiento llamado estandarización, el cuál consiste en hacer la transformación anterior tendrá (si

Z=

X −µ

. La variable

σ

la distribución de frecuencias de X se ajusta a un modelo de

probabilidad normal con media µ y varianza σ2) una distribución de frecuencias que se ajusta a un modelo de probabilidad normal con media cero y varianza uno, es decir que:  a − µ   b − µ  P( a ≤ X ≤ b ) =   ≤Z ≤   =  σ   σ 



b−µ    σ 

 a−µ     σ 

1 2π

2

e −1 / 2 Z dz

La ecuación anterior también puede resultar difícil de evaluar, sin embargo para cualquier valor de a, b, µ y σ las correspondientes probabilidades pueden hallarse, sin necesidad de resolver la integral, empleando la tabla de distribución acumulada normal estándar que aparece en los libros de estadística y que se anexa a este

documento. Para ilustrar el procedimiento del cálculo de probabilidades con el modelo normal se usará el siguiente ejemplo: EJEMPLO : Suponga que se midió la variable X = Ganancia en peso (lb.) después de

un periodo de 20 días de aplicado un tratamiento. Esta variable fue evaluada en 40 cerdos y se obtuvieron los siguientes datos: 33

2

39

17

1

34

53

22

34

11

33

20

30

33

29

19

39

19

33

53

24

39

57

21

12

53

36

53

44

32

24

25

39

19

32

40

30

30

36

21

Las medidas de localización y variabilidad de este conjunto de datos son: Medida Media (µ) Mediana Varianza Desviación Estándar (σ) Cuartíl 1 Cuartíl 3 Rango Rango Intercuartílico Coeficiente de Variación

Valor 30.52 32 176.10 13.27 21 39 56 18 43.47 %

Con la información obtenida se halló la siguiente tabla de frecuencias: Intervalos 0 - 12 12 - 24 24 - 36 36 - 48 48 - 60

Frecuencia Absoluta

4 10 15 6 5 Total 40

Frecuencia Relativa 0.1 0.25 0.375 0.150 0.125 1.0

Frecuencia Abs. Acumulada 4 14 29 35 50

Frecuencia Rel. Acumulada 0.1 0.35 0.725 0.875 1.0

Prob. Bajo el Modelo Normal ? 0.23 0.34 ? ? ?

Frecuencia Absoluta

El histograma de frecuencias es:

15 12 9 6 3 0 0

12

24

36

48

Ganancia (lb) LECTURA DE LA TABLA NORMAL

Calcular, empleando la tabla normal, las siguientes probabilidades: a). P (Z>0) b). P(Z

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.