Story Transcript
Temas 6 y 7: MODELOS DE DISTRIBUCIONES DE PROBABILIDAD
6 Distribuciones de tipo discreto 6.1 Distribución Binomial Se dice que un experimento aleatorio es una prueba de Bernouilli si al realizarlo sólo pueden ocurrir dos
( )
sucesos que llamamos éxito (A) y fracaso (A ) , con probabilidades P( A) = p y P A = q = 1 − p . Se considera un experimento aleatorio que consiste en realizar, en las mismas condiciones, n pruebas de Bernouilli y se define la variable aleatoria X : número de éxitos obtenidos al realizar las n pruebas. Esta variable aleatoria se dice que sigue una distribución binomial de parámetros n y p y se utiliza la notación X → B(n, p ) Características de la distribución de probabilidad El soporte de la variable aleatoria X es: DX = {0, 1, 2,Ln}
n x n− x x ∈ DX m( x ) = p ⋅ q x La función masa de probabilidad es: m( x ) = 0 x ∉ DX Esta expresión se obtiene considerando que:
Si x ∈ D X
− x4 − x4 x4 x4 647 64n7 8 86 8 64n7 47 8 { } m( x) = P X = x = P A, A,L A, A , A ,L A U L U A , A ,L A , A, A,L A
Al ser los sucesos incompatibles, aplicamos la propiedad de la función de probabilidad y obtenemos − x4 − x4 x4 x4 647 64n7 8 86 8 64n7 47 8 m( x ) = P{X = x} = P A, A,L A, A , A ,L A + L + P A , A ,L A , A, A,L A
Como los sucesos pertenecen a un experimento compuesto formado por n experimentos (Pruebas de Bernouilli) físicamente independientes, obtenemos
m( x ) = P{X = x} = P( A)x ⋅ P( A )
n− x
+ L + P (A )
n− x
⋅ P ( A )x = p x ⋅ q n − x + L + p x ⋅ q n − x
1
Para determinar el número de sumandos, observamos que coincide con el número de sucesos que forman el suceso {X = x} , y este número es igual al de permutaciones de n elementos de los que x son iguales entre sí y los restantes también son iguales entre sí, por lo tanto obtenemos
m( x ) = P{X = x} = Pnx ,n − x p x ⋅ q n − x =
Además se cumple que
n n! p x ⋅ q n − x = p x ⋅ q n − x x!⋅(n − x )! x
∑ m(x) = 1 , ya que
x∈DX
∑ m( x ) =
x∈D X
n x n− x p ⋅ q = ( p + q )n = 1n = 1 x =0 x n
∑
(
)
La función generatriz de momentos es g (t ) = p ⋅ et + q n t ∈ R Esta expresión se obtiene considerando que
[ ]= ∑ e
g (t ) = E e
tX
n
x =0
tx n
p ⋅ q x x
n− x
(
n = ∑ p ⋅ e t x = 0 x n
)
x
(
⋅ q n− x = p ⋅ et + q
)
n
La media de la distribución es E [ X ] = np
Este resultado se obtiene considerando que
E [ X ] = g ′(0 )
Determinamos la derivada de la función generatriz de momentos calculamos
(
g ′(0 ) = n pe 0 + q
)
n −1
(
g ′(t ) = n p ⋅ e t + q
)
n −1
pe t y
pe 0 = np . Por lo tanto E [ X ] = np
La varianza de la distribución es V
( X ) = npq
Este resultado se obtiene considerando que V ( X ) = α 2 − α12 y que α2 = g ′′(0) = n2 p2 + npq Ejercicio 1: Un examen tipo test tiene 20 preguntas con 4 respuestas alternativas cada una de las que sólo una es correcta. Si un alumno contesta al azar cada pregunta del examen, determina razonadamente a) la probabilidad de que conteste correctamente al menos 5 preguntas. b) la probabilidad de que se equivoque como máximo en tres preguntas c) la probabilidad de que conteste correctamente 8 preguntas d) la probabilidad de que conteste correctamente al menos 4 pero no más de 7 preguntas. Ejercicio 2: La duración, en miles de horas, de las bombillas de la marca BB es una variable aleatoria X con función de distribución:
F (x) = 0
x≤0;
F ( x ) = 1 − e−0,2 x
x>0
Si las bombillas se venden en cajas de 10, determina razonadamente la probabilidad de que al menos 5 bombillas de una caja duren más de 6.000 horas.
2
Ejercicio 3: Una caja tiene 20 tornillos de los que 8 son defectuosos. Se extraen, con reemplazamiento, 10 tornillos de la caja. Determina razonadamente la probabilidad de que 4 de los 10 tornillos sean defectuosos. Ejercicio 4: Consideramos una población de N individuos de los que M presentan cierta característica. Se elige una muestra aleatoria con reemplazamiento de tamaño n . Determina la distribución de probabilidad de la variable aleatoria X : número de individuos en la muestra que presentan la característica.
6.2 Distribución Hipergeométrica Consideramos una población de N individuos de los que M presentan cierta característica. Se elige una muestra aleatoria sin reemplazamiento de tamaño n . Se define la variable aleatoria X : número de individuos en la muestra que presentan la característica. Esta variable aleatoria se dice que sigue una distribución hipergeométrica de parámetros N , M y n y se utiliza la notación
X → H (N , M ; n)
Características de la distribución de probabilidad
El soporte de la variable aleatoria X es D X = { 0, 1, 2, L n } si M y N − M son mayor o igual a n Si M ó N − M son menores que n algunos de los elementos de D X pueden tener probabilidad 0. Como ejemplo podemos considerar una población de 10 individuos de los que 3 presentan la característica, si se elige una muestra sin reemplazamiento de tamaño 4 entonces D X = { 0, 1, 2, 3 }
M N − M x n − x x∈ D m( x ) = X La función masa de probabilidad es: N n m( x ) = 0 x ∉ DX
Para obtener esta expresión determinamos en primer lugar el número de sucesos elementales del espacio muestral. Cada suceso elemental es una de las posibles muestras sin reemplazamiento de tamaño n que se pueden formar con los N elementos de la población. Por tanto el número de sucesos elementales es el número de combinaciones de N elementos de orden n . Como las muestras se eligen al azar se puede aceptar el postulado de indiferencia y para calcular la probabilidad de que en la muestra haya x elementos que presentan la característica y n − x elementos que no la presentan, debemos determinar el número de sucesos elementales o muestras que cumplen esta condición. El número de grupos de x elementos que se pueden formar con los M elementos que presentan la característica es el número de combinaciones de M elementos de orden x .
3
El número de grupos de n − x elementos que se pueden formar con los N − M elementos que no presentan la característica es el número de combinaciones de N − M elementos de orden n − x . Por lo tanto el número de sucesos elementales o muestras que tienen x elementos que presentan la característica y n − x que no la presentan es el producto de los dos números de grupos anteriores, y obtenemos
M N − M x n − x m( x ) = P{X = x} = N n Se puede comprobar que
si x ∈ D X
∑ m(x) = 1
x∈DX
La media de la distribución es E [ X ] = n
La varianza de la distribución es V ( X ) = n ⋅
M N
M N −M N −n ⋅ ⋅ N N N −1
Relación entre la distribución Hipergeométrica y la distribución Binomial
Si X → H ( N , M ; n ) y X * → B n , p =
M se puede demostrar que lim m X ( x ) = m X * ( x ) N N →∞
Este resultado permite calcular un valor aproximado de las probabilidades de una variable aleatoria X con distribución Hipergeométrica utilizando las probabilidades de la correspondiente variable aleatoria X * con distribución Binomial. Puede utilizarse la aproximación si la distribución de X cumple las condiciones: n N > 50 y < 0,1 N Ejercicio 5: Se han desprendido las etiquetas de 10 latas de productos hortícolas. Todas las latas son del mismo tamaño y cuatro de ellas contienen tomate y el resto maíz. Si se eligen cinco de esas latas, ¿cuál es la probabilidad de que dos o más contengan maíz? Ejercicio 6: En una clase de 50 alumnos, 30 son chicas y 20 chicos. Si se selecciona al azar un grupo de 10 alumnos para una tarea especial, determina razonadamente la probabilidad de que en el grupo se mantenga la misma proporción de chicas y chicos que en la clase. Ejercicio 7: Una empresa tiene 100 empleados de los que 30 son mujeres. Si se eligen al azar a cinco para fotocopiar y distribuir el nuevo convenio colectivo, determina razonadamente la probabilidad de que como máximo haya tres mujeres entre los empleados elegidos.
4
Ejercicio 8: Una compañía de teléfonos va a realizar una campaña publicitaria dirigida principalmente a inmigrantes con edades comprendidas entre 21 y 40 años. Para evaluar la opinión sobre dicha campaña, se pretende encuestar a 20 personas entre la población inmigrante. Si la población inmigrante en nuestro país es de 4.482.568 personas y de ellas 2.017.156 tienen edades comprendidas entre 21 y 40 años, determina razonadamente la probabilidad de que en la muestra más de la mitad sean del sector de edad de interés.
6.3 Distribución de Poisson La distribución de Poisson es apropiada para variables aleatorias X que representan el número de veces que ocurre un suceso aleatorio durante un periodo de tiempo fijo o en una región fija del espacio. Se puede demostrar que si el proceso físico que genera la ocurrencia de estos sucesos satisface tres condiciones matemáticas, entonces la distribución de la variable aleatoria X debe ser una distribución de Poisson. Las tres condiciones son: 1. El número de veces que ocurre el suceso en dos intervalos cualesquiera de tiempo (o en dos regiones del espacio) disjuntos deben ser sucesos independientes. 2. La probabilidad de que ocurra un suceso en un intervalo de tiempo (o en una región del espacio) debe ser proporcional a la longitud del intervalo (o al área o volumen de la región) 3. La probabilidad de que ocurran dos o más sucesos en un intervalo de tiempo muy pequeño (o en una región del espacio) es tan pequeña que puede despreciarse. Esta variable aleatoria X se dice que sigue una distribución de Poisson de parámetro λ notación X → P(λ )
(λ > 0) y se utiliza la
Características de la distribución de probabilidad El soporte de la variable aleatoria X es D X = { 0, 1, 2, L
}
−λ λx x = 0,1,2,K La función masa de probabilidad es: m( x) = e x! 0 en otro caso
Se puede comprobar que
∞
λx
x =0
x!
∑ m(x) = 1 , ya que ∑ m(x ) = ∑ e−λ
x∈DX
x∈D X
= e−λ
∞
∑
λx
x = 0 x!
= e −λ ⋅ eλ = 1
t La función generatriz de momentos es g (t ) = e λ (e −1 ) t ∈ R
Esta expresión se obtiene considerando que
5
[ ]
g (t ) = E etX =
( )
( )
x ∞ et λ x t t λ x ∞ − λ et λ tx − λ − λ =e = e − λ ee λ = eλ e −1 ∑ e e x! = ∑ e ∑ x! x =0 x =0 x = 0 x! ∞
(
)
La media es E[ X ] = λ Este resultado se obtiene considerando que E [ X ] = g ′(0 ) Determinamos la derivada de la función generatriz de momentos 0 g ′(0 ) = eλ (e −1)λe0 = λ . Por lo tanto E [ X ] = g ′(0 ) = λ
t g ′(t ) = eλ (e −1)λet y calculamos
La varianza es V ( X ) = λ 2 Este resultado se obtiene considerando que V ( X ) = α 2 − α12 y que α2 = g ′′(0) = λ + λ
Relación entre la distribución Binomial y la distribución de Poisson Si X → B(n, p ) y se cumple n → ∞ y p → 0 pero de modo que el valor del producto n⋅ p permanece constante (representamos esa constante por λ), entonces si X * → P(λ ) se puede demostrar que
lim m X ( x ) = e−λ
n →∞
λx x!
= m X * (x )
Este resultado permite determinar valores aproximados para las probabilidades de una variable
X → B(n, p ) utilizando las probabilidades de una variable aleatoria X * → P(λ = n ⋅ p ) . Podrá utilizarse la aproximación si la distribución de X cumple las condiciones: p ≤ 0,1 y n ⋅ p ≤ 5 , y la aproximación mejora para valores grandes de n. Ejercicio 9: El número de televisores que vende un comercio mensualmente es una variable aleatoria con distribución de Poisson, siendo igualmente probables la venta de 9 y de 10 televisores. a) Determina la probabilidad de que se vendan 9 televisores en un mes. b) Si en la primera semana de un mes se han vendido dos televisores, determina la probabilidad de que en ese mes no se vendan más de 10 televisores. c) Determina el stock que debe tener el comerciante al comienzo del mes, para tener una probabilidad de 0,99 de satisfacer la demanda durante ese mes. d) Si el beneficio por cada televisor es de 120 euros, determina el beneficio mensual esperado por el comerciante. Ejercicio 10: En el recubrimiento de láminas metálicas grandes, aparecen defectos distribuidos aleatoriamente. Si hay un promedio de 2,5 defectos por 100 metros cuadrados, calcula la probabilidad de
6
que una lámina de cinco por ocho metros no tenga defectos. De 100 de tales láminas, ¿cuántas cabe esperar que tengan dos o más defectos? Ejercicio 11: Se sabe que el 1% de los borradores de la declaración de la renta que confecciona la agencia tributaria contienen algún error. Determina razonadamente la probabilidad de que de 200 borradores analizados al menos dos de ellos tengan algún error. Si la agencia tributaria ha enviado a los contribuyentes 3.000.000 de borradores, ¿cuántos cabe esperar que contengan algún error? Ejercicio 12: Doscientos cuarenta de los trescientos mil coches matriculados en una provincia son de una determinada marca. Si se eligen al azar 500 coches, ¿cuál es la probabilidad de que dos o más sean de esa marca? Ejercicio 13: El número mensual de accidentes mortales que se producen en el sector de la construcción, es una variable aleatoria con distribución de Poisson, siendo igualmente probable que ocurran 2 y 3 accidentes mortales en un mes. a) Determina la probabilidad de que en un mes haya al menos cinco accidentes mortales en el sector de la construcción. b) Determina razonadamente la probabilidad de que en un año haya más de tres meses sin accidentes mortales en el sector de la construcción.
7
7 Distribuciones de tipo continuo 7.1 Distribución uniforme
Una variable aleatoria X se dice que sigue una distribución uniforme en el intervalo [a, b] y se utiliza la notación X → U[a , b] , si su función de densidad es:
f (x)
f ( x) =
1 b−a
a ≤ x ≤ b; f ( x) = 0 en otro caso
1/(b-a)
b
a
X
Características de la distribución de probabilidad
La función de distribución es:
F (x) = 0
x < a; F ( x) =
x−a a ≤ x ≤ b; F ( x ) = 1 x > b b−a
Como X es una variable aleatoria continua el valor de la función de distribución para cada número real x es
F ( x ) = ∫− ∞ f (t )dt , por lo tanto x
Si x < a F ( x ) =
x
∫
−∞
Si a ≤ x ≤ b F ( x ) = Si x > b F ( x ) =
x
f (t )dt =
∫ 0 dt = 0
−∞ x
x
−∞
a
∫ f (t )dt = ∫
x
b
−∞
a
∫ f (t )dt = ∫
x
1 1 1 dt = dt = [t ] ax = x − a b−a b−a ∫ b−a b−a a
b
1 1 1 dt = dt = [t ]ba = b − a = 1 ∫ b−a b−a b−a b−a a
La media es E [ X ] =
b+a 2
Este resultado se obtiene considerando que ∞
b
b
−∞
a
a
1 1 x2 b2 − a 2 (b − a )(b + a ) b + a E [ X ] = ∫ x f ( x ) dx = ∫ x dx = = = = b−a b − a 2 2(b − a ) 2(b − a ) 2
La varianza es V ( X ) =
(b − a )2 12 8
Este resultado se obtiene considerando que V ( X ) = α2 − α12
[ ]
α2 = E X 2 =
=
b b b 1 1 1 x3 b3 − a 3 2 2 2 x f ( x ) dx = x dx = x dx = = = ∫ ∫ b−a b−a ∫ b − a 3 3(b − a ) −∞ a a a ∞
(b2 + ab + a2 )(b − a ) = b2 + ab + a2 3(b − a )
3
V ( X ) = α 2 − α12 =
(
)
b2 + ab + a 2 (b + a )2 4 b2 + ab + a 2 − 3(b + a )2 (b − a )2 − = = 3 4 12 12
Propiedad: Si [a1 ,b1 ] y [a2 ,b2 ] son dos intervalos de la misma longitud (l) incluidos en el intervalo
[a,b] entonces P{a1 ≤ X ≤ b1} = P{a2 ≤ X ≤ b2 }
La igualdad anterior se cumple ya que b1
b1
a1
a1
b2
b
1 1 1 P{a1 ≤ X ≤ b1} = ∫ dx = dx = [x]ba11 = b1 − a1 = l ∫ b−a b−a b−a b−a b−a P{a2 ≤ X ≤ b2 } =
1 1 2 1 dx = dx = [x]ba22 = b2 − a2 = l ∫ b−a ∫ b−aa b−a b−a b−a a2 2
Esta propiedad permite considerar la distribución uniforme como un modelo adecuado para variables aleatorias que pueden tomar todos los valores de un intervalo de números reales y se puede admitir el postulado de indiferencia sobre los valores que toma la variable
Ejercicio 14: La cantidad de azúcar, en gramos, que se añade a las botellas de un litro de la bebida refrescante BB es una variable aleatoria X con distribución uniforme de la misma media y varianza. Si a cada una de las botellas se le añade como mínimo 6 gramos de azúcar en la bebida y ésta tiene un sabor óptimo cuando la cantidad de azúcar no supera los 15 gramos, a) Determina razonadamente la probabilidad de que una botella de la bebida contenga entre 9 y 12 gramos de azúcar. b) Estudia si la distribución de probabilidad de X es simétrica. c) Determina razonadamente los cuartiles de la distribución de probabilidad de X . d) Si las botellas se venden en cajas de doce, determina razonadamente la probabilidad de que una caja contenga como máximo 8 botellas de sabor óptimo. Ejercicio 15: Una fábrica produce varillas metálicas. La longitud X , en cm, de las varillas es una variable aleatoria con función de densidad:
f (x) = k
27 ≤ x ≤ 35 ;
f (x) = 0
en otro caso
y se sabe que las varillas con longitud superior a 33 cm. hay que recortarlas y aquellas cuya longitud es inferior a 29 cm son inservibles, a) Determina la probabilidad de que no haya que recortar una varilla
9
b) Si las varillas se venden en cajas de seis, ¿cuál es la probabilidad de tener que recortar la mitad o más de las varillas de una caja? c) Si el coste de fabricación de cada varilla es de 2 euros y se ve incrementado en 0'5 euros si la varilla hay que recortarla, determina razonadamente el beneficio esperado por varilla si el precio de venta es de 3 euros y las varillas inservibles no se venden. Ejercicio 16: Haz una relación de todas las variables aleatorias con distribución uniforme que hemos utilizado en los ejercicios del Tema 5.
7.2 Distribución exponencial Una variable aleatoria X se dice que sigue una distribución exponencial de parámetro α (α > 0) y se utiliza la notación X → Exp(α ) , si su función de densidad es:
f ( x) = α e −αx
x > 0;
f ( x) = 0
x≤0
4,5 4 3,5 3 2,5 2 1,5 1 0,5 0
Función de densidad de distribuciones exponenciales
Exp (1,5) Exp (0,5) Exp (4)
0 1 2 3 4 5 6 7 8 9
Características de la distribución de probabilidad
La función de distribución es:
F (x) = 0
x≤0
;
F ( x) = 1 − e −α ⋅ x
x>0
Esta expresión se obtiene si consideramos que como X es una variable aleatoria continua el valor de la función de distribución para cada número real x es F ( x ) = ∫
x −∞
x≤0 x>0
F ( x) = F ( x) =
x
f (t )dt , por lo tanto
x
∫
f (t )dt =
∫ 0dt = 0
∫
f (t )dt = ∫ α ⋅ e −α ⋅t dt = − e −α ⋅t 0 = −e−α ⋅ x − (− 1) = 1 − e−α ⋅ x
−∞ x
−∞ x
−∞
0
[
]x
La función generatriz de momentos es g (t ) =
α = α (α − t )−1 (α − t )
t 0 ⇔ α > t
entonces
(α − t ) < 0 ⇔ α < t
entonces
[ ]
Obtenemos g (t) = E etX =
[ ]
lim e −(α −t )⋅ x = 0 y por tanto E etX =
x → +∞
α α −t
[ ]
lim e −(α −t )⋅ x = +∞ y por tanto no existe E etX
x → +∞
α
(α − t )
= α (α − t )−1
t 0
a) Determina razonadamente la duración media y mediana de los tubos fluorescentes. b) Si la empresa desea garantizarlos durante cierto tiempo, ¿cuántas horas debe amparar la garantía para tener una confianza del 95% de que uno de esos tubos funcione por lo menos el número de horas garantizadas.
Ejercicio 18: Se ha determinado que el número de minutos que un estudiante tarda en realizar un examen de matemáticas es una variable aleatoria con distribución exponencial de media 90. Si un día cinco estudiantes van a realizar un examen de matemáticas, determina razonadamente la probabilidad de que al menos uno de los estudiantes tarde menos de 45 minutos en realizar el examen. Ejercicio 19: Se conoce que el número de personas que llegan a un cajero automático en 10 minutos sigue una distribución de Poisson con media igual a 5. Determina razonadamente la probabilidad de que en los próximos 10 minutos no llegue ninguna persona al cajero.
7.3 Distribución Normal Fue considerada por De Moivre en 1753, pero fueron Laplace y Gauss quienes la introdujeron en el siglo XIX en relación con la teoría de los errores accidentales en las medidas físicas. Es la distribución más importante porque: 1. Muchas de las variables que aparecen relacionadas con experimentos de azar están distribuidas normalmente. 2. Otras muchas variables están distribuidas normalmente en forma aproximada.
12
3. A veces variables que no están distribuidas normalmente se pueden convertir mediante transformaciones sencillas en variables distribuidas normalmente.
7.3.1 Distribución Normal (0,1) Una variable aleatoria X se dice que sigue una distribución normal de parámetros (0, 1) y se utiliza la notación X → N (0,1) , si su función de densidad es:
f (x ) =
1 − x2 2 e 2π
−∞< x 0 a) Determina razonadamente, utilizando las propiedades de la función de distribución, los valores de a yb b) Determina razonadamente el tiempo que se espera que tarde un automóvil en pasar la revisión de la ITV en esa estación. c) Si un día tienen cita concertada en la estación 20 automóviles, determina razonadamente la probabilidad de que al menos la mitad de ellos tarden más de 10 minutos en pasar la revisión de la ITV. Ejercicio 41: (Examen Septiembre 2014) Por estudios efectuados se ha determinado que la cotización de cierre diaria, en euros, de las acciones de la entidad financiera AA en la Bolsa de Madrid tiene una distribución uniforme de media 13 euros y tal que la diferencia entre el mayor valor y el menor valor de la cotización de cierre diaria es de 12 euros. Determina razonadamente la probabilidad de que en un día determinado la cotización de cierre de esas acciones no supere los 15 euros. Ejercicio 42:(Examen Septiembre 2014) La cantidad, en miles de kilos, de mermelada de tomate que produce mensualmente la empresa EE es una variable aleatoria con distribución normal de varianza 0,25 y cuya mediana es igual a 3. a) Determina razonadamente el percentil 70 de la distribución y explica el significado del valor obtenido. b) Si la empresa vende la mermelada de tomate a 6 euros el kilo, los costes de elaboración del producto ascienden a 2 euros el kilo y tiene unos gastos mensuales fijos de 6000 euros, determina razonadamente la probabilidad de que el beneficio mensual de la empresa EE supere los 8000 euros.
19