Story Transcript
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
1
1
Problemas de conteo
Ejercicio 1.1 En cierta ciudad las matr´ıculas de los autos se forman con 2 vocales diferentes seguidas de 5 d´ıgitos todos diferentes. Determinar la cantidad de matr´ıculas que pueden hacerse y determinar cu´antas de ellas comienzan con A y terminan con 89. Ejercicio 1.2 Entre 3 ingenieros, 5 economistas y 4 arquitectos deben seleccionarse 4 para formar una comisi´on. 1. Calcular cu´antas comisiones diferentes podr´ıan formarse. 2. Calcular cu´antas de esas comisiones estar´ıan integradas por un ingeniero, dos economistas y un arquitecto. 3. Calcular en cu´antas comisiones habr´ıa por lo menos dos arquitectos. Ejercicio 1.3 En una f´abrica los productos se codifican con 3 letras distintas que indican 3 operaciones que sufren cada uno de los productos y 3 cifras distintas y en ese orden: primero las letras y despu´es los n´ umeros. Las letras utilizadas son A, B, C y D. 1. ¿Cu´antos productos pueden codificarse? 2. ¿Cu´antos c´odigos empiezan con A y terminan con 9? 3. ¿En cu´antos los n´ umeros 0 y 2 aparecen juntos y en ese orden? 4. ¿En cu´antos los n´ umeros 0 y 2 aparecen juntos? 5. ¿En cu´antos productos aparecen dos n´ umeros pares juntos y el otro es impar? Ejercicio 1.4 Una caja fuerte se abre mediante una cierta clave de 5 d´ıgitos (pueden ser repetidos). Ud. es lo suficientemente audaz como para intentar abrirla, y lo hace probando n´ umeros al azar. ¿Cu´antas claves posibles hay? ¿Cu´antas claves posibles hay si se usan s´olo los d´ıgitos de 1 a 6 en vez de usar los 10? Ejercicio 1.5 Se juega a un juego del tipo 5 de Oro: hay que acertar 5 n´ umeros, elegidos dentro de 36 posibilidades. 1. ¿Cu´antas jugadas posibles hay? 2. Si se eligen 5 n´ umeros a priori, ¿cu´antas jugadas posibles hay que contengan exactamente uno de los n´ umeros elegidos? 3. Si se eligen 5 n´ umeros a priori, ¿cu´antas jugadas posibles hay que contengan por lo menos 2 de los n´ umeros elegidos? Ejercicio 1.6 * Usted va a la panader´ıa a comprar una docena de bizcochos. En la panader´ıa s´olo quedan croissants, margaritas y galletas en cantidades suficientes. 1. ¿Cu´antas elecciones distintas puede hacer? 2. Usted llega a la facultad con α croissants, β margaritas y γ galletas (α + β + γ = 12) y los reparte entre usted y 11 amigos. ¿Cu´antos repartos puede hacer? (Calcular en funci´on de α, β y γ). ¿Cu´anto deben valer α, β y γ para que dicha cantidad sea m´axima? (Sugerencia: ver como var´ıa dicha cantidad al variar en una unidad alguno de los par´ametros)
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
2
2
Propiedades de la Probabilidad
Ejercicio 2.1 Sean A, B y C sucesos. Expresar mediante operaciones con conjuntos los sucesos que corresponden a: 1. Ocurren A y B. 2. Ocurren los tres sucesos. 3. Ocurre A u ocurre B. 4. Ocurre por lo menos uno de los tres sucesos. 5. Ocurre A u ocurre B pero no los dos simult´aneamente. 6. No ocurre B. 7. No ocurre ni A ni B. 8. No ocurre ninguno de los tres sucesos. 9. Ocurre A y no ocurre B. 10. Ocurre exactamente uno de los tres sucesos. 11. Ocurren por lo menos dos de los tres sucesos. Ejercicio 2.2 Se¡consideran ¢ dos sucesos A y B tales que P (A) = 1/3 y P (B) = 1/2. Determinar el valor de P AC ∩ B en los siguientes casos: 1. A y B incompatibles (mutuamente excluyentes). 2. A ⊂ B. 3. P (A ∩ B) = 1/8. Ejercicio 2.3 Se consideran los sucesos A y B con: P (A) = 0.375, P (B) = 0.5, P (A ∩ B) = 0.25. Calcular: ¡ ¢ ¡ ¢ 1. P AC y P B C . 2. P (A ∪ B). ¡ ¢ 3. P AC ∩ B C . ¡ ¢ ¡ ¢ 4. P AC ∩ B y P A ∩ B C .
Ejercicio 2.4 Sea P una medida de probabilidad en Ω. Demostrar que: 1. Si A y B son sucesos tales que A ⊂ B entonces: P (B \ A) = P (B) − P (A) Deducir que P (A) ≤ P (B). 2. Probar que P (A ∪ B) > max{P (A) , P (B)} y que P (A ∩ B) 6 min{P (A) , P (B)}
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
3
3. * Si A, B y C son sucesos entonces se cumple que: P (A ∪ B ∪ C) = P (A)+P (B)+P (C)−P (A ∩ B)−P (A ∩ C)−P (B ∩ C)+P (A ∩ B ∩ C) 4. * Si A1 , . . . , An son sucesos probar que: Ã n ! [ X X P Ai = P (Ai ) − P (Ai ∩ Aj ) + . . . + (−1)n−1 P (A1 ∩ . . . ∩ An ) 16i6n
i=1
16i 0 ∀ω ∈ Ω P p (ω) = 1 • ω∈Ω
Demuestre entonces que: 1. La funci´on P : P (Ω) → R definida como: P (A) =
X
ω∈A
p (ω) ∀A ⊂ Ω
es una probabilidad en (Ω, P (Ω)). 2. Si se supone adem´as p (ω) = p0 > 0 constante ∀ω ∈ Ω entonces en ese caso p0 = lo tanto la funci´on anterior se convierte en: P (A) =
1 |Ω|
y por
|A| |Ω|
que es la interpretaci´on cl´asica de equiprobabilidad como casos favorables sobre casos posibles. Ejercicio 3.4 Si a un ´omnibus con n asientos suben i personas con i 6 n (o sea que no debe ser un ´omnibus montevideano, claramente). 1. ¿De cu´antas maneras posibles pueden elegirse los asientos en los que se sentar´a la gente? 2. ¿De cu´antas maneras distintas puede disponerse la gente en el ´omnibus? 3. Asumamos ahora que la gente se dispone al azar y que cada disposici´on particular tiene la misma probabilidad (equiprobabilidad). Supongamos que n = 4m y que el ´omnibus tiene un pasillo en el medio; y que a cada costado del pasillo hay m filas de 2 asientos. Para darle un toque rom´antico, suponga ahora que sube al ´omnibus Keanu Reeves o Angelina Jolie (seg´ un la opci´on de cada uno), ¿qu´e probabilidad tiene Ud. de quedar sentado al lado del personaje en cuesti´on? Ejercicio 3.5 1. Calcular la probabilidad de obtener una suma de puntos menor que 18 al tirar 3 dados. 2. * Se elige un grupo de n personas al azar. Descartando los a˜ nos bisiestos y suponiendo por lo tanto a˜ nos de 365 d´ıas, ¿cu´al es la probabilidad de que al menos dos personas cumplan el mismo dia? ¿Cu´anto tiene que ser n para que dicha probabilidad supere a 0.5?
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
7
Ejercicio 3.6 Si un dado est´a cargado de modo tal que P ({i}) = αi, ∀i = 1, 2, . . . , 6. 1. Determinar el valor de α 2. ¿Cu´al es la probabilidad de sacar 5? 3. ¿Cu´al es la probabilidad de sacar par? Ejercicio 3.7 * Un secretario o secretaria vuelve a su oficina el 31 de diciembre luego de haber despedido el a˜ no en el Mercado del Puerto. Su u ´nico trabajo consiste en enviar n cartas. Antes de la despedida ya hab´ıa escrito el nombre del destinatario en cada una de las n cartas y cada uno de los n sobres dispuestos para el env´ıo, de modo que lo u ´nico que debe hacer es acertar cada carta en el sobre que le corresponde. Obviamente coloca las cartas en los sobres de manera totalmente aleatoria (puede suponerse equiprobabilidad). 1. Calcular la probabilidad pn de que al menos una carta vaya a parar al sobre que le toca. 2. Calcular limn pn Sugerencia: Considere la siguiente generalizaci´on de la f´ormula de la probabilidad de la uni´on: ! Ã n X X [ n−1 P (Ai ∩ Aj ) + . . . + (−1) P (A1 ∩ . . . ∩ An ) P (Ai ) − Ai = P i=1
4
1≤i0
1. Demuestre que f es una funci´on de densidad para cualquier valor de λ > 0. Si una variable aleatoria X absolutamente continua tiene una densidad de esta forma se dice que X tiene distribuci´ on exponencial de par´ametro λ (X ∼ exp (λ)). 2. Si X ∼ exp (λ) hallar y graficar la funci´on de distribuci´on FX . 3. Sea X una variable aleatoria que mide el tiempo de vida (en a˜ nos) de un cierto aparato electr´onico. El fabricante desea garantizar que la duraci´on de estos aparatos supera los x 0 a˜ nos con una probabilidad de 0.90. Si se sabe que X ∼ exp (0.01), determinar x 0 . Halle tambi´en la menor cantidad de a˜ nos enteros que cumple con la condici´on. 4. Un sistema contiene cierto ¡tipo nos est´a dado por la ¢ de componente cuyo tiempo de vida en a˜ variable aleatoria T ∼ exp 18 . Si 5 de estos componentes se instalan en diferentes sistemas, ¿cu´al es la probabilidad de que al menos 2 contin´ uen funcionando despu´es de 8 a˜ nos? Ejercicio 6.11 Gumbel: una distribuci´ on max-estable 1. (a) Probar que la funci´on f : R → R tal que ¶¶ µ µ µ ¶¶¶ µ µ 1 x−α x−α exp − exp − f (x) = exp − β β β es una funci´on de densidad Diremos que una variable aleatoria X tiene distribuci´ on Gumbel si X es absolutamente continua y la densidad de X es la dada en la parte anterior. Notaci´on: X ∼ Gumbel (α, β)
(b) Si X ∼ Gumbel (α, β) hallar la funci´on de distribuci´on FX X−α (c) Probar que X ∼ Gumbel (α, β) ⇔ Z = ∼ Gumbel (0, 1) β
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
16
2. Sea X1 , X2 , ..., Xn , .... una sucesi´on de variables aleatorias independientes e igualmente distribuidas con distribuci´on exp(1). Para cada n ≥ 1 definimos las variables Mn = max {X1 , X2 , ..., Xn } (a) Hallar la distribuci´on de Mn (b) Probar lim P (Mn − ln(n) ≤ x) = FZ (x) n→+∞
donde Z ∼ Gumbel (0, 1). Ejercicio 6.12 Sea U una variable aleatoria tal que U ∼ U [0, 1] y sea F una funci´on de distribuci´on continua y estrictamente creciente. 1. Hallar la distribuci´on de X = F −1 (U ). 2. Sabiendo que un generador de n´ umeros aleatorios puede modelarse por una variable U (0, 1), utilice el generador de una calculadora o computadora para construir un valor correspondiente a una v.a. X ∼ N (0.8, 4). 3. Si X ∼ N (0.8, 4), calcule P (X 6 1.3). Repita el experimento anterior 100 veces y calcule qu´e proporci´on de veces se obtuvo un resultado menor o igual a 1.3. Haga lo mismo 1000 veces y compare con P (X 6 1.3). Ejercicio 6.13 Examen, febrero de 2000 El consumo m´aximo de agua potable de una ciudad en un d´ia cualquiera es una variable aleatoria X (en miles de m3 ) con densidad: ½ 0 si x ≤ 0 x f (x) = kxe− 3 si x > 0 1. Determine el valor de k para que f sea una densidad (de ahora en m´as se trabaja con ese valor). 2. Si la capacidad m´axima de suministro de agua es de 27.000 m3 , hallar la probabilidad de que en un d´ia determinado no se pueda satisfacer la demanda de agua potable (y por lo tanto haya corte de suministro). 3. Hallar la probabilidad de que en dos d´ıas cualesquiera de la pr´oxima semana haya corte de suministro. 4. Hallar la probabilidad de que por lo menos en un d´ıa de la pr´oxima semana haya corte de suministro. Ejercicio 6.14 Primer parcial 2001 1. Sea X una variable aleatoria real absolutamente continua con densidad f , siendo f una funci´on par (es decir, f (x) = f (−x) ∀x ∈ R). Sea FX su funci´on de distribuci´on. Probar que FX (−x) = 1 − FX (x) ∀x ∈ R. 2. La intensidad relativa de una se˜ nal de sonido se puede modelar como una variable aleatoria X absolutamente continua con densidad f (x) = 21 e−|x| ∀x ∈ R (conocida como distribuci´on de Laplace). Se sabe adem´as que una cierta se˜ nal de sonido es claramente perceptible para el o´ıdo humano medio si la intensidad relativa medida por X est´a entre −2.1 y 2.1 ¿Cu´al es la probabilidad de que al enviar una se˜ nal, esta no sea percibida claramente por los destinatarios, suponiendo que los mismos son personas con capacidad auditiva media? 3. Se emiten se˜ nales de sonido en forma independiente hasta que se reciben 2 se˜ nales con claridad. Hallar la probabilidad de tener que enviar exactamente 5 se˜ nales.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
7
17
Probabilidad Condicional e Independencia
Ejercicio 7.1 Se consideran los sucesos A y B tales que P (A) = siguientes casos: 1. Si A y B son independientes
1 4
y P (A ∪ B) =
1 3.
Calcular P (B) en los
2. Si A y B son disjuntos (o excluyentes) 3. Si A es un subconjunto de B Ejercicio 7.2 Si A y B son sucesos independientes y B y C tambi´en son sucesos independientes. ¿Puede afirmarse que A y C son independientes? En caso afirmativo demostrar, si no dar un contraejemplo. Ejercicio 7.3 Demostrar que A es independiente de A si y s´olo si P (A) = 0 ´o P (A) = 1. Ejercicio 7.4 Se consideran los eventos A y B tales que 1. P (A) = 12 , P (B) =
1 3
y P (A ∩ B) =
1 4
5 8
y P (A ∪ B) = 43 . Calcular
. Calcular
(a) P (A|B) (b) P (B|A) ¡ ¢ (c) P AC |B ¡ ¢ (d) P B C |A ¡ ¢ (e) P AC |B C ¡ ¢ (f) P B C |AC
2. P (A) = 38 , P (B) = (a) P (A|B) (b) P (B|A)
3. B ⊆ A. Calcular P (A|B) 4. A y B son disjuntos (o excluyentes), esto es A ∩ B = ∅. Calcular P (A|B). ¿Qu´e se puede decir de la independencia? Ejercicio 7.5 1. Una caja contiene 12 l´amparas de las cuales 4 son defectuosas. Se toman al azar tres l´amparas del lote una tras otra. Hallar la probabilidad de que las tres l´amparas no sean defectuosas. 2. Se consideran ahora tres cajas con l´amparas: La caja 1 contiene 10 l´amparas de las cuales 4 son defectuosas La caja 2 contiene 6 l´amparas de las cuales 1 es defectuosa La caja 3 contiene 8 l´amparas de las cuales 3 son defectuosas
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
18
Escogemos al azar una caja y luego sacamos una l´ampara al azar ¿Cu´al es la probabilidad de que la l´ampara sea defectuosa? Ejercicio 7.6 1. Se considera una caja que contiene 6 bolillas rojas, 4 blancas y 5 azules. Se extraen tres bolillas en forma sucesiva (sin reposici´on). Calcular la probabilidad que la primera sea roja, la segunda blanca y la tercera azul 2. Se consideran dos cajas con bolas. La caja 1 contiene 3 bolas rojas y 2 azules, la caja 2 contiene 2 bolas rojas y 8 azules. Se lanza una moneda, si se obtiene cara se saca una bola de la caja 1, y si se obtiene cruz se saca una bola de la caja 2. (a) Hallar la probabilidad que la bola extra´ıda sea roja. (b) Si se sabe que la bola extra´ıda es roja, ¿cu´al es la probabilidad que provenga de la caja 1? Ejercicio 7.7 1. La probabilidad de que el jugador 1 de en el blanco es 61 , la probabilidad de que el jugador 2 de en el blanco es 14 y la probabilidad de que el jugador 3 de en el blanco es 13 . Cada uno dispara una vez al blanco. (a) ¿Cu´al es la probabilidad de que el blanco sea alcanzado solamente una vez? (b) Si s´olo uno da en el blanco, ¿cu´al es la probabilidad que haya sido el jugador 1? 2. La probabilidad de que el jugador 1 de en el blanco es 2 de en el blanco es 13 .
1 4
y la probabilidad de que el jugador
(a) Si cada uno dispara dos veces, ¿cu´al es la probabilidad de que el blanco sea alcanzado por lo menos una vez? (b) Supongamos ahora que cada uno dispara una vez. Dado que el blanco fue alcanzado solamente una vez, ¿cu´al es la probabilidad que haya sido el jugador 1? Ejercicio 7.8 Se ha observado que los hombres y las mujeres reaccionan de una manera diferente en cierta circunstancia; el 70 % de las mujeres reaccionan positivamente en dicha circunstancia, mientras que el porcentaje de los hombres es solamente el 40 %. Se someti´o a una prueba a un grupo de 20 personas, 15 mujeres y 5 hombres para descubrir sus reacciones. Una prueba escogida al azar de las 20 result´o negativa. ¿Cu´al es la probabilidad de que haya sido realizada por un hombre? Ejercicio 7.9 Este ejercicio consiste en demostrar y aplicar una generalizaci´ on de la F´ ormula de Bayes. 1. Sea B1 , B2 , . . . , Bn una partici´on de Ω (es decir B1 , B2 , . . . , Bn incompatibles y y sea A otro suceso cualquiera, probar que P (A|Bj ) P (Bj ) P (Bj |A) = P n P (A|Bi ) P (Bi ) i=1
para todo j = 1, . . . , n.
n S
i=1
Bi = Ω)
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
19
2. En un pa´ıs hay cuatro partidos pol´ıticos que se dividen la opini´on p´ ublica. Se sabe que: El 35% de la poblaci´on adhiere al partido I El 31% adhiere al partido II El 28% adhiere al partido III El 6% adhiere al partido IV Entre los adherentes al partido I, un 36% corresponde a personas con ingresos inferiores a dos salarios m´ınimos Entre los adherentes al partido II, esa proporci´on es del 52% Para el partido III, es un 42% Para el partido IV, 11% Si se elige una persona al azar y resulta tener ingresos inferiores a dos salarios m´ınimos. Calcular la probabilidad de que sea un adherente al partido I; al partido II; al partido III y al partido IV. 3. Tres m´aquinas A, B y C producen respectivamente 50%, 30% y 20% del n´ umero total de art´ıculos de una f´abrica. Los porcentajes de producci´on de defectuosos de cada m´aquina son 3%, 4% y 5% respectivamente. Se toma al azar un art´ıculo de la producci´on total. Si el art´ıculo seleccionado es defectuoso, hallar la probabilidad de que halla sido producido por la m´aquina A. Ejercicio 7.10 Primer parcial, mayo de 1999 Supongamos que en un pa´ıs un 40% de los ciudadanos habilitados para votar es adherente al partido A, un 35% al partido B y un 25% al partido C. Se realiza de manera simult´anea una elecci´on interna en los tres partidos, pero como no se requiere acreditar la adhesi´on a cada partido, el voto “extrapartidario” es posible: un votante de un partido puede, si quiere, participar en la interna de otro partido. Supongamos que Ud. sabe que: Entre los adherentes de A, un 10% vot´o en la elecci´on interna de otro partido Entre los adherentes de B, un 15% vot´o en la interna de A Entre los adherentes de C, un 5% vot´o en la interna de A 1. ¿Cu´al fue el porcentaje de votos obtenidos por el partido A en las internas? 2. Si se elige al azar una persona dentro de todas las que en las votaron a A, (a) ¿cu´al es la probabilidad que sea un adherente de B? (b) ¿y cu´al es la probabilidad que sea un adherente de C? 3. Si 400.000 personas votaron en la interna de A, (a) ¿en cu´anto estimar´ıa la cantidad de votantes de A que son adherentes de B? (b) ¿y la cantidad de votantes de A que son adherentes de C? Ejercicio 7.11 Examen, marzo de 2003 Se admite que entre los jugadores profesionales de ping pong un 5% consume anfetaminas antes de cada partido. Durante un campeonato se les toma una muestra de orina a todos los jugadores. La muestra de cada jugador se divide en dos submuestras iguales a las que se les aplica un test cl´ınico: si el resultado de aplicar el test a las dos submuestras da positivo entonces el jugador es sancionado; en cualquier otro caso el jugador no es sancionado. Considere los eventos:
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
20
A1 = { el resultado de la primera submuestra da positivo } A2 = { el resultado de la segunda submuestra da positivo } B = { el jugador es sancionado} D = { el jugador consumi´o anfetaminas }
Se asume que los eventos A1 y A2 condicionados a los eventos D y a D c son independientes, esto es: P (A1 ∩ A2 |D) = P (A1 |D)P (A2 |D) y P (A1 ∩ A2 |Dc ) = P (A1 |Dc )P (A2 |Dc ). Se sabe adem´as que P (Ai |D) = 0.90 y P (Ai |Dc ) = 0.02 para i = 1, 2. 1. Calcule P (D|A1 ), esto es, la probabilidad de que un jugador haya consumido anfetaminas dado que el resultado de la primera submuestra es positivo. 2. Calcule P (B), esto es, la probabilidad de que un jugador sea sancionado. ¿Son A 1 y A2 eventos independientes? 3. Calcule P (D|B), esto es, la probabilidad de que un jugador sancionado haya consumido anfetaminas. Ejercicio 7.12 Examen, febrero 2004 De una caja que contiene 3 bolas rojas y 2 azules se extrae una bola al azar y se la coloca en una segunda caja que contiene 4 bolas azules y 2 rojas. A continuaci´ on se extrae una bola al azar de la segunda caja. 1. ¿Cu´al es la probabilidad de que se extraiga la misma bola que se extrajo de la primera caja? 2. ¿Cu´al es la probabilidad de que la bola extra´ıda de la segunda caja sea roja? 3. Si la bola extra´ıda de la segunda caja es roja, ¿cu´al es la probabilidad de que sea la misma bola que se extrajo de la primera caja?
8
Distribuci´ on conjunta. Variables independientes.
Ejercicio 8.1 Distribuciones “marginales” Sea FXY la distribuci´on conjunta de las variables aleatorias X e Y . Probar que lim FXY (x, y) = y→+∞
FX (x) y que lim FXY (x, y) = FY (y) x→+∞
Ejercicio 8.2 1. Sean X e Y dos variables aleatorias cuya distribuci´on conjunta es 1 si x ≥ 1, y ≥ 1 y si y ∈ [0, 1) , x ≥ y FXY (x, y) = x si x ∈ [0, 1) , y ≥ x 0 en los otros casos Hallar la distribuciones marginales FX y FY .
2. Sean X e Y dos variables aleatorias cuya 1 y x FXY (x, y) = xy 0
distribuci´on conjunta es si x ≥ 1, y ≥ 1 si x ≥ 1, y ∈ [0, 1) si x ∈ [0, 1) , y ≥ 1 si x ∈ [0, 1) , y ∈ [0, 1) en los otros casos
Hallar la distribuci´on (marginal) FX y la distribuci´on (marginal) FY .
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
21
3. Si X e Y son variables aleatorias, ¿las distribuciones marginales FX y FY determinan la distribuci´on conjunta FXY ? ¿En qu´e caso FX y FY determinan la distribuci´on conjunta? Ejercicio 8.3 Se considera la siguiente funci´on pXY : R2 → R ½ k (2x + y) si x ∈ {0, 1, 2, 3} , pXY (x, y) = 0 en los otros casos
y ∈ RY = {1, 2, 3}
1. Hallar k para que pXY sea funci´on de probabilidad puntual conjunta. 2. Sean X e Y variables aleatorias discretas con RX = {0, 1, 2, 3} y RY = {1, 2, 3}, cuya funci´on de probabilidad puntual conjunta es pXY . Hallar las funciones de probabilidad puntuales (marginales) pX y pY . 3. ¿X e Y son independientes? Justifique la respuesta. 4. Calcular P(1 ≤ X < 3, 2 < Y ≤ 3) y P(X + Y < 3). Ejercicio 8.4 Se considera la siguiente funci´on fXY : R2 → R ½ kxy si x ∈ (0, 4) y ∈ (1, 5) fXY (x, y) = 0 en los otros casos 1. Hallar k para que fXY sea la funci´on de densidad conjunta de dos variables aleatorias X, Y absolutamente continuas. 2. Hallar las densidades (marginales) fX y fY . 3. Hallar la distribuci´on conjunta FXY y la distribuciones (marginales) FX y FY . 4. ¿X e Y son independientes? Justifique la respuesta. 5. Calcular P(X ≥ 3, Y ≤ 2) y P(X + Y > 4). Ejercicio 8.5 Sean X1 , X2 , . . . , Xn iid con distribuci´on F . 1. Calcular la funci´on de distribuci´on de Xn∗ = max{X1 , X2 , . . . , Xn }. 2. Calcular la funci´on de distribuci´on de X1∗ = min{X1 , X2 , . . . , Xn }. Ejercicio 8.6 Gumbel: una distribuci´ on max-estable 1. (a) Probar que la funci´on f : R → R tal que µ µ ¶¶ µ µ µ ¶¶¶ x−α x−α 1 exp − exp − f (x) = exp − β β β es una funci´on de densidad. Diremos que una variable aleatoria X tiene distribuci´ on Gumbel si X es absolutamente continua y la densidad de X es la dada en la parte anterior. Notaci´on: X ∼ Gumbel (α, β).
(b) Si X ∼ Gumbel (α, β) hallar la funci´on de distribuci´on FX .
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
(c) Probar que X ∼ Gumbel (α, β) ⇔ Z =
22
X−α ∼ Gumbel (0, 1). β
2. Sea X1 , X2 , ..., Xn , .... una sucesi´on de variables aleatorias independientes e igualmente distribuidas con distribuci´on exp(1). Para cada n ≥ 1 definimos las variables Mn = max {X1 , X2 , ..., Xn } (a) Hallar la distribuci´on de Mn . (b) Probar lim P (Mn − log(n) ≤ x) = FZ (x)
n→+∞
donde Z ∼ Gumbel (0, 1)
Ejercicio 8.7 Hallar la distribuci´on FY y la densidad fY de la variable aleatoria 1. Y = log(X) donde X es una variable aleatoria con densidad fX (x) =
(
1 x2 0
x ∈ (1, +∞)
en los otros casos
2. Y = X 2 donde X es una variable aleatoria con densidad ½ 2 2xe−x x ∈ (0, +∞) fX (x) = 0 en los otros casos 3. Y = 3X + 1 donde X ∼ U [0, 1] Ejercicio 8.8 Sean X, Y v.a. independientes tales que X ∼ Bin(n, p), Y ∼ Bin(m, p). Hallar la funci´on de distribuci´on de X + Y . Ejercicio 8.9 1. Sean X, Y v.a. independientes tales que X ∼ P(λ1 ), Y ∼ P(λ2 ). Hallar la funci´on de distribuci´on de X + Y . 2. En las mismas condiciones que en 1. calcular P (X = k|X + Y = n) ∀k = 0, . . . , n. 3. Se tienen dos centrales digitales A y B. El n´ umero de llamadas que llegan en 15 minutos a las centrales se puede modelar con dos variables aleatorias independientes, X para la central A e Y para la central B tales que X ∼ P(λ1 ), Y ∼ P(λ2 ). Supongamos adem´as que en 15 minutos La probabilidad de que no llegue ninguna llamada a A es dos veces la probabilidad de que no llegue ninguna llamada a B La probabilidad de que llegue exactamente una llamada a A y la probabilidad de que llegue exactamente una llamada a B son iguales Se sabe que en en 15 minutos llegaron 10 llamadas (entre A y B). ¿Cu´al es la probabilidad de qu´e A haya recibido m´as llamadas que B? Ejercicio 8.10 Sean X, Y v.a. independientes tales que X, Y ∼ U[0, 1]. Hallar la funci´on de distribuci´on de X + Y y de XY . Ejercicio 8.11 Sean X e Y variables aleatorias independientes tales que X ∼ exp(1) e Y ∼ exp(1). Se consideran X las variables aleatorias Z = X + Y y W = . Y
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
23
1. Probar que P(X > 0, Y > 0) = 1 y probar que la densidad conjunta fXY es ½ −(x+y) e si x > 0 y > 0 fXY (x, y) = 0 en los otros casos o n © ª 2. Se consideran los conjuntos A = (x, y) ∈ IR2 : x > 0, y > 0 y Bzw = (x, y) ∈ /R2 : x + y ≤ z, xy ≤ w con z > 0 e w > 0. Dibujar A ∩ Bzw . ( ³ ´ w (1 − e−z − ze−z ) si z > 0 w > 0 1+w 3. Probar que la distribuci´on conjunta FZW es FZW (z, w) = 0 en los otros casos Sugerencia: considerar A ∩ Bzw . 4. Probar que Z y W son independientes, y deducir las distribuciones de Z y de W Ejercicio 8.12 ** Sean X1 , X2 , X3 , X4 iid ∼ U[0, 1]. 1. Halle la densidad conjunta f (x1 , x2 , x3 , x4 ) del vector (X1 , X2 , X3 , X4 ). 2. Integre en una regi´on adecuada la densidad anterior para hallar la probabilidad del suceso A = {X1 < X3 < X2 < X4 }. Interprete el resultado. 3. Se sortean ahora cuatro puntos A, B, C, D de una circunferencia de longitud 1 de forma independiente y con distribuci´on uniforme. Calcule la probabilidad de que las cuerdas AB y CD se corten. Sugerencia: descomponga el suceso en sucesos de la forma vista en la parte anterior.
9
Esperanza, Covarianza y Varianza
Ejercicio 9.1 Al invertir en la bolsa de valores, una persona puede lograr una ganancia de 4000 d´olares en un a˜ no con una probabilidad de 0.3 o bien tener una p´erdida de 1000 d´olares con probabilidad 0.7. ¿Cu´al ser´ıa la ganancia esperada de esta persona? Ejercicio 9.2 Un comerciante de joyas antiguas est´a interesado en comprar un collar de oro para el cual las probabilidades de venderlo ganando 250 d´olares, 100 d´olares, nada o perdiendo 100 d´olares, son respectivamente, 0.22, 0.36, 0.28, 0.14 . ¿Cu´al es la ganancia esperada del comerciante? Ejercicio 9.3 La funci´on de probabilidad de una variable aleatoria discreta X est´a dada por: pX (x) =
KCx3
µ ¶x µ ¶3−x 1 3 con x = 1, 2, 3. 4 4
Hallar K y la esperanza de X. Ejercicio 9.4 La funci´on de densidad de la variable aleatoria X que mide los di´ametros de paso de los hilos de 4 la rosca de una pieza est´a dada por: f (x) = π (1 − x2 ) 0 en cualquier otro caso 1. ¿Cu´al es el valor esperado de X?
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
24
2. Si ahora definimos una variable aleatoria Y tal que Y = 3X + 1, ¿cu´al es el valor esperado de Y ? Ejercicio 9.5 Una variable aleatoria continua X tiene densidad dada por: f (x) = Obtenga el valor esperado de g (X) = e
2X 3
.
½
e−x si x > 0 0 en cualquier otro caso
Ejercicio 9.6 Sea U ∼ U[0, 1]. Hallar la funci´on de distribuci´on de la variable aleatoria X = √1U , su densidad y su esperanza. Verificar que la esperanza coincide con el valor hallado mediante la f´ormula R E (g(U )) = g(t)fU (t)dt.
Ejercicio 9.7 Consideremos dos juegos de azar.
1. Se eligen 5 n´ umeros entre 1 y 20 y se sortea mediante bolilleros 5 n´ umeros entre 1 y 20 (suponemos equiprobabilidad). Si salen los 5 n´ umeros elegidos por nosotros (aunque sea en otro orden), ganamos 20 veces lo apostado; si salen 4 de los 5, ganamos 4 veces lo apostado; si salen 3 de los 5, ganamos el doble de lo apostado, y en cualquier otro caso perdemos lo apostado. (Atenci´on: cuando decimos ‘ganar’ nos referimos a cu´anto se nos paga, y no a la ganancia neta. En realidad, la ganancia neta se obtiene luego de restar lo apostado, por ej.: si acertamos los 5 n´ umeros, la ganancia neta es 19 veces lo apostado.) 2. Se eligen 5 cartas de un mazo de 32, si las 5 son del mismo color y en escalera (supongamos las cartas numeradas del 1 al 8; las escaleras son cuatro: 1 a 5, 2 a 6, 3 a 7, 4 a 8) ganamos 8 veces lo apostado, si obtenemos 5 cartas del mismo color pero no en escalera, ganamos 2 veces lo apostado; si obtenemos cartas en escalera pero no del mismo color, recuperamos lo apostado; en cualquier otro caso se pierde lo apostado. (Vale la misma precisi´on que en el juego anterior respecto de la ganancia y tambi´en suponemos equiprobabilidad.) Queremos jugar una vez por semana uno de estos juegos, con las siguientes reglas: Jugaremos siempre una suma fija S, Jugaremos siempre el mismo juego, Las distintas jugadas son totalmente independientes, no hay influencia de una jugada en la otra Jugaremos por un tiempo indefinido, muy largo. ¿Cu´al de los juegos elegir´ıa ud.? Al cabo de 1000 semanas, ¿cu´anto estimar´ıa usted que es la ganancia neta que se obtendr´ıa jugando siempre al primer juego? ¿Y al segundo?. Ejercicio 9.8 Si a ud. le dicen que el 12% de la poblaci´on est´a desempleada, el 48% tiene un solo empleo, el 35% tiene dos empleos y el 5% tiene tres, y por otra parte en una muestra tomada al azar, de manera independiente, de 1400 personas resulta que el promedio de empleos por persona es 2.04. ¿Usted qu´e dir´ıa? ¿Le parece que alg´ un dato puede estar mal, o no? Si alg´ un dato puede estar mal, ¿de cu´ales sospechar´ıa? ¿Qu´e tipos de errores podr´ıa contener la informaci´on? Si adem´as, entre esas 1400 personas hay 312 desempleados, ¿qu´e responder´ıa a las preguntas anteriores? Ejercicio 9.9 Calcular la esperanza y la varianza de las siguientes distribuciones: 1. U{1, ..., n} (uniforme discreta) 2. U[a, b] (uniforme continua)
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
25
3. P(λ) (Poisson) 4. exp(λ) (exponencial) 5. Geo(p) (geom´etrica) Ejercicio 9.10 Calcular esperanza y varianza de la distribuci´on BN(k, p) (binomial negativa). Sugerencia: Utilizar que si X1 , . . . , Xk iid ∼ Geo(p) entonces X1 + · · · + Xk ∼ BN(k, p). Ejercicio 9.11 Calcular esperanza y varianza de la distribuci´on H(n; N ; D) (hipergeom´etrica). Ejercicio 9.12 En este ejercicio se demostrar´an la Desigualdad de Markov y la Desigualdad de Tchebycheff. 1. Demostrar la Desigualdad de Markov. Sean g : R → R+ , X v.a. real y a > 0, entonces P (g(X) > a) 6
E (g (X)) . a
Sugerencia: g(X) > a1{g(X)>a} .
¡ ¢ 2. Demostrar la Desigualdad de Tchebycheff. Si X v.a. real tal que E X 2 < ∞, entonces P (|X − E (X)| > ε) 6
Var (X) ∀ε > 0. ε2
3. La producci´on diaria de motores el´ectricos en una f´abrica es (en promedio) µ = 120 con una desviaci´on est´andar de σ = 10. Hallar un intervalo que contenga por lo menos el 90% de la cantidad diaria de motores producidos. 4. El costo diario por conectarse a un servidor de internet tiene una media µ = 13U$ con una desviaci´on est´andar de σ = 6.4U$. Acotar la probabilidad de que el costo sea mayor que 30 U$. 5. Una empresa de electr´onica se encarga de suministrar tarjetas de impresoras a una f´abrica de montaje de microcomputadoras. Se estudi´o la demanda mensual de tarjetas durante algunos meses y se vio que el promedio era µ = 280 con una desviaci´on est´andar de σ = 4. ¿Cu´al es el stock de tarjetas que debe tener la empresa de electr´onica al principio de cada mes para que la demanda sea mayor que la oferta cuando mucho con una probabilidad de 0.10? Ejercicio 9.13 Primer parcial, Mayo de 1999 Se ponen a funcionar en un mismo momento (que tomamos como tiempo 0) dos lamparitas de dos marcas distintas, A y B, que se dejan prendidas hasta que se rompan. Llamemos X al tiempo de duraci´on de la lamparita A e Y al tiempo de duraci´on de la lamparita B. Admitamos que X e Y son independientes, que X sigue una distribuci´on exponencial de par´ametro λ 1 > 0 y que Y sigue una distribuci´on exponencial de par´ametro λ2 > 0. Llamemos S al tiempo en que ocurre la primera rotura de alguna de las dos lamparitas y T al tiempo en que se rompe la restante lamparita. 1. Calcular las funciones de distribuci´on de S y T . 2. Calcular E (S), E (T ). 3. Calcular E (ST ). ¿Son S y T independientes? Justifique la respuesta. 4. Calcular P (S = T ).
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
10
26
Ley Fuerte de los Grandes N´ umeros
Ejercicio 10.1 Se afirma que el 12% de la poblaci´on est´a desempleada, el 48% tiene un solo empleo, el 35% tiene dos empleos y el 5% tiene tres, y por otra parte en una muestra tomada al azar y de manera independiente, de 1400 personas resulta que el promedio de empleos es 2,04. ¿Qu´e opina de la afirmaci´on anterior? Si adem´as en esas 1400 personas hay 312 desempleados, ¿qu´e puede afirmar? Ejercicio 10.2 Este ejercicio describe el m´etodo de Montecarlo para el c´alculo de integrales. 1. Sean (Ui )i∈N ∼ U[a, b] iid y f ∈ R[a, b] (f es integrable Riemann en [a, b]), mostrar que: n
1 1X c.s. f (Ui ) −→ n b−a n i=1
Zb
f (x) dx.
a
2. Mediante la generaci´on de 100 n´ umeros aleatorios, obtenga una estimaci´on de
Z1 0
x2
e− 2 √ dx. 2π
Comparar el resultado obtenido con el provisto por las tablas de la distribuci´on N (0, 1). 3. Sea D una regi´on arbitraria de [0, 1] × [0, 1] y sean U1 , U2 , . . . , Un variables aleatorias independientes e id´enticamente distribuidas con distribuci´on U ([0, 1] × [0, 1]), es decir que se cumple que P (U ∈ A) = ´area(A ∩ [0, 1] × [0, 1]). # {i : 1 6 i 6 n y Ui ∈ D} c.s. probar que an −→ ´area(D). Si an = n n Ejercicio 10.3 Sean (Xi )i∈N variables independientes e id´enticamente distribuidas. Suponga que E (X 1 ) = 0 y Xi + Xi+1 sea Yi = . 2 c.s. Demostrar que Y n −→ 0, aunque Yn , Yn+1 pueden ser dependientes para todo n. n
Ejercicio 10.4 c.s. c.s. Demostrar que si Xn −→ a y g : R → R continua entonces g(Xn ) −→ g(a). n
n
Ejercicio 10.5 Sea {Xn : n ∈ N} una sucesi´on de v.a. iid con E (X1 ) = a > 0. Probar que entonces n X i=1
11
c.s.
Xi −→ +∞ n
Estimaci´ on Puntual
Consistencia de un estimador Sean {Xn }n∈N iid con distribuci´on Fθ donde θ es un par´ametro. Se considera la familia {Tn (X1 , . . . , Xn )}n∈N donde Tn es una funci´on de los n datos (que cumple ciertas hip´otesis). Tn (X1 , . . . , Xn ) se llama c.s. un estimador de θ. Un estimador se dice consistente si Tn (X1 , . . . , Xn ) −→ θ. n
Ejercicio 11.1 Sean (Xn )n∈N iid tales que E (X1 ) = µ y Var (X1 ) = σ 2 < ∞ (σ > 0).
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
27 c.s.
1. Demostrar que X n es un estimador consistente de µ, esto es que X n −→ µ. n
2. Demostrar que si σn2 =
n X
¡ ¡ ¢2 ¢2 1 1 Xi − X n y s2n = Xi − X n entonces n i=1 n − 1 i=1 c.s.
c.s.
σn2 −→ σ 2
s2n −→ σ 2
n
n
n
Sugerencia: c.s.
n X
c.s.
σn −→ σ n
c.s.
sn −→ σ n
n
¢2 ¡ ¢2 1X¡ 1X 2 Xi − X n = (Xi ) − X n y usar los siguientes resultados: n i=1 n i=1 c.s.
Si Xn −→ X y g : R → R es continua entonces g (Xn ) −→ g (X) n c.s.
c.s.
n
n
n
c.s.
2
Si Xn −→ X e Yn → Y y g : R → R es continua entonces g (Xn , Yn ) −→ g (X, Y ) n
Ejercicio 11.2 Definimos el coeficiente de correlaci´ on de dos variables aleatorias X e Y tales que Var (X) < ∞, Var (Y ) < ∞, Var (X) , Var (Y ) > 0 como ρ= p
Cov(X, Y ) p Var (X) Var (Y )
Sean (Xn )n∈N , (Yn )n∈N iid, tales que Var (Xn ) = σ 2 (X) < ∞, Var (Yn ) = σ 2 (Y ) < ∞, σ 2 (X), σ 2 (Y ) > 0. Sea n ¡ ¢¡ ¢ P Xi − X n Y i − Y n 1 i=1 ρn = n σn (X) σn (Y ) n
¢2 1 X¡ Xi − X n y an´alogamente con σn2 (Y ). n i=1 n n ¢¡ ¢ 1X¡ 1X c.s. Demostrar que ρn −→ ρ. Sugerencia: Xi Y i − X n Y n Xi − X n Y i − Y n = n n i=1 n i=1
con σn2 (X) =
Ejercicio 11.3 Una pieza de una m´aquina se verifica al final de cada hora de producci´on y se cambia por una nueva en caso de encontrarse rota. El tiempo de vida en horas de la pieza se puede modelar con una variable aleatoria T con distribuci´on exponencial de par´ametro λ (T ∼ exp(λ)), por lo tanto el tiempo en horas que transcurre hasta el recambio de la pieza se puede modelar con una variable aleatoria X = [T ]+1, donde [T ] es la parte entera de T (esto es, X = n si y s´olo si n−1 ≤ T < n). 1. Hallar la funci´on de probabilidad de la variable aleatoria X y probar que tiene distribuci´on geom´etrica de par´ametro 1 − e−λ (X ∼ Geo(1 − e−λ )). 2. A partir de los tiempos en los que se realiza el recambio de las piezas se desea estimar el par´ametro λ del tiempo de vida de dichas piezas. (a) Calcular λ en funci´on de µ siendo µ = E (X). (b) ¿C´omo estimar´ıa µ a partir de las observaciones X1 , X2 , . . . , Xn de los tiempos de recambio de las piezas? (c) Construir un estimador consistente para λ en funci´on de las observaciones X 1 , X2 , . . . , Xn de los tiempos de recambio de las piezas.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
28
Estimaci´ on por m´ axima verosimilitud Sean X1 , X2 , . . . Xn iid ∼ F Encontrar los estimadores de m´axima verosimilitud para los siguientes par´ametros: 1. p si la distribuci´on es Ber(p) 2. λ si la distribuci´on es P(λ) 3. p si la distribuci´on es Geo(p) 4. µ y σ 2 si la distribuci´on es N (µ, σ 2 ) 5. a y b si la distribuci´on es U[a, b]. Sesgo de un estimador Sean {Xn : n ∈ N} iid con distribuci´on Fθ . Se define el sesgo de un estimador de θ, Tn = Tn (X1 , . . . , Xn ) como E (Tn − θ). Un estimador Tn se dice insesgado si su sesgo es cero, es decir E (Tn ) = 0 ∀ n ∈ N. Decimos que es asint´ oticamente insesgado si E (Tn − θ) → 0. n
Ejercicio 11.4 Sean (Xn )n∈N iid tales que E (X1 ) = µ y Var (X1 ) = σ 2 < ∞ (σ > 0). 1. Mostrar que X n es insesgado como estimador de µ, que σn2 no es insesgado como estimador de σ 2 y que s2n es insesgado para σ 2 . 2. Mostrar que σn y sn no son insesgados como estimadores de σ. 3. Sea X1 , . . . , Xn ∼ exp(λ) iid, entonces insesgado.
1 es consistente como estimador de λ pero no Xn
Sugerencia: para las dos u ´ltimas partes usar la desigualdad de Jensen2 . Ejercicio 11.5 Se considera una muestra X1 , X2 , ..., Xn iid con media E (X) = µ y varianza Var (X) = σ 2 . Se n P ai Xi (una combinaci´on lineal de las observaciones). considera el estimador µ b= i=1
1. Hallar la relaci´on que tienen que cumplir los coeficientes ai para que µ b sea un estimador insesgado de la media µ.
2. Entre todos los estimadores lineales e insesgados de la media µ hallar el de varianza m´ınima. Sugerencia: usar la desigualdad de Cauchy-Schwarz para vectores en Rn .
Ejercicio 11.6 Una forma de evaluar la eficiencia es a trav´es del error cuadr´ atico medio, que ¡ de un estimador ¢ se define como ECM (Tn ) = E (Tn − θ)2 . Demostrar que si el estimador Tn tiene sesgo an entonces ECM (Tn ) = Var (Tn ) + a2n . Ejercicio 11.7 Sean X1 , . . . , Xn iid ∼ P(λ). 1. Estimar λ por el m´etodo de los momentos. Observar que es insesgado y calcular el error cuadr´atico medio. 2 Desigualdad de Jensen: si ϕ : R → R es una funci´ on con ϕ(x)00 > 0 ∀x, entonces ϕ (E (X)) 6 E (ϕ(X)). Adem´ as el igual se cumple si ϕ(x) es lineal. El enunciado anterior es v´ alido m´ as en general para cualquier ϕ convexa
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
29
2. Probar que s2n tambi´en es un estimador insesgado para λ. 3. Encontrar el estimador de m´axima verosimilitud para λ y observar que coincide con el estimador obtenido por el m´etodo de los momentos. Ejercicio 11.8 Sean X1 , . . . , Xn iid ∼ U[0, θ]. Interesa estimar el valor de θ. 1. Hallar el estimador de θ por el m´etodo de los momentos. 2. Estudiar su sesgo, varianza y error cuadr´atico medio. 3. Demostrar que el estimador de m´axima verosimilitud de θ es Xn∗ , el m´aximo de los valores muestrales. Ejercicio 11.9 Sea X ∼ Gumbel (α, β), es decir que X es absolutamente continua con densidad µ µ ¶¶ µ µ µ ¶¶¶ x−α x−α 1 f (x) = exp − exp − exp − β β β Hallar estimaciones de los par´ametros α y β por el m´etodo de momentos. X−α ∼ Gumbel (0, 1), con E (Z) = γ donde γ = Sugerencia: X ∼ Gumbel (α, β) ⇔ Z = β 0, 5772 es la constante de Euler y Var (Z) = π 2 /6. Ejercicio 11.10 Examen diciembre de 2003 Para modelar la cantidad X de productos defectuosos que se encuentran en una l´ınea de producci´on en determinado per´ıodo de tiempo se utiliza un modelo de dos par´ametros llamado “Poisson con Ceros Forzados” (PCF). Decimos que la variable X tiene distribuci´on de Poisson con ceros Forzados, y se nota X ∼ P CF (λ, p), si X puede escribirse como X = Y Z con Y , Z independientes tales que: Y tiene distribuci´on de Poisson de par´ametro λ (Y ∼ P (λ)) Z tiene distribuci´on de Bernoulli de par´ametro p (Z ∼ Ber (p)) El modelo representa que si la producci´on tiene una muy baja tasa de errores, la probabilidad de que no haya defectuosos es m´as alta que en un modelo de Poisson tradicional. 1. Hallar P (X = k) ∀k ≥ 0. 2. Decimos que X = 0 es un “cero forzado” cuando ocurre Z = 0. Dado que se observa X = 0 hallar la probabilidad de que no sea un “cero forzado” (esto es Z = 1). ¡ ¢ 3. Hallar E (X), E X 2 y Var (X).
ˆ y pˆ de los par´ametros 4. Dada una muestra X1 , . . . , Xn iid ∼ P CF (λ, p), halle estimadores λ por el m´etodo de los momentos. 5. Para la siguiente lista de 10 observaciones: 0, 0, 0, 2, 0, 0, 4, 1, 0, 0, estime λ y p por el m´etodo de los momentos. Ejercicio 11.11 En este ejercicio hallaremos un estimador consistente para la media de una distribuci´on. Para hacerlo, se sugiere leer la parte II del cap´ıtulo 8 en el fasc´ıculo 3 de Probabilidad y Estad´ıstica de Gonzalo Perera.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
30
1. Probar la siguiente afirmaci´on:µ Si la sucesi´ ¶on de sucesos {An : n ∈ N} verifican que ∞ ∞ S P∞ T An = 0(lema de Borel-Cantelli). n=1 P (An ) < ∞, entonces P m=1 n=m
2. Sea (Yn )n∈N una sucesi´on de VA reales tales que ∀ε > 0
∞ X
n=1
P (|Yn | > ε) < ∞ ⇒ Yn −→n 0
c.s., es decir, P (limn Yn = 0) = P ({ω ∈ Ω : limn Yn (ω) = 0}) = 1 3. Sean X1 . . . Xn VA reales independientes tales que E(Xi4 ) < ∞∀i, E(Xi ) = 0∀i ⇒ Ã
(a) E
n X i=1
E(Xi4 )
!4
=
n X
E(Xi4 ) + C24
E(Xi2 )E(Xj2 )
1≤i6=j≤n
i=1
à à n !4 !2 n X X 4 4 (b) E E(Xi ) ≤ 6 E(Xi ) . i=1
X
i=1
4. (LFGN) Sean (Xi )i∈N variables independientes tales que: (a) E(Xi4 ) ≤ M < ∞∀i ∈ N.
(b) E(Xi ) = µ∀i ∈ N
n
Se cumple que Xn −→n µ c.s., donde Xn =
1X Xi n i=1
Ejercicio 11.12 En este ejercicio hallaremos un estimador consistente para la mediana de una distribuci´on. (Dada una v.a. X se dice que θ es una mediana de X si P (X > θ) > 21 y P (X 6 θ) > 21 .) 1. Utilice la desigualdad de Markov para v.a. iid con g(x) = x4 para demostrar que à !4 n X ¡¯ ¯ ¢ 1 P ¯X n ¯ > ε 6 4 4 E Xi n ε i=1 2. Sea Xn ∼ Bin(n, δ) ∀n > 1 con δ < 21 y an sucesi´on real tal que ann → 12 . Utilizar la siguiente n desigualdad à à n q !4 !2 n X X 4 E (Xi ) E Xi 6 6 i=1
i=1
y la descomposici´on de la binomial en suma de Ber(δ) independientes para probar que ∞ X
n=1
P (Xn > an ) < ∞
3. Sean X1 , . . . , Xn iid ∼ F y sean X1∗ , . . . , Xn∗ los estad´ısticos de orden (la muestra ordenada de menor a mayor). Supongamos que la distribuci´on de los datos tiene una mediana u ´nica c.s. θ. Mostrar que si an es una sucesi´on de enteros tal que ann → 12 , entonces Xa∗n −→ θ. n
n
Sugerencia: considerar los sucesos {|Xa∗n − θ| > ε}, con ε > 0 arbitrario y probar que n P 1{Xi 90). 3. Computadora mediante, simule 100 variables Bin(144, 0.25) y cuente cu´antas veces X 6 40; A sea A ese n´ umero. Comparar 100 con el c´alculo realizado en 1. Usar el Teorema Central A del L´ımite para hallar, a partir de 100 un intervalo de confianza aproximado a nivel α para el verdadero valor de µ = P (X 6 40). Decidir si el c´alculo de 1. es correcto o no. Ejercicio 12.2 Los resistores de cierto tipo de tienen resistencias que en promedio son de µ = 200 ohms, con una desviaci´on est´andar de σ = 10 ohms. Se toman (al azar) 25 de estos resistores y se conectan (en forma independiente) en un circuito. 1. Calcular la probabilidad (aproximada) de que la resistencia promedio de los 25 resistores este entre 199 y 202 ohms. 2. Calcular la probabilidad (aproximada) de que la resistencia total de los 25 resistores no sea mayor que 5100 ohms. Ejercicio 12.3 Si X1 , . . . , Xn iid ∼ exp(5) y n es muy grande, ¿por qu´e distribuci´on puede aproximarse la distribuci´on de X n ? Ejercicio 12.4 1. Si X ∼ BN(k, p), con k muy grande, hallar una aproximaci´on de su distribuci´on. Sugerencia: Usar la descomposici´on de una BN como suma de geom´etricas. 2. Si X ∼ BN(1600, 0.25), calcular P (X > 6200).
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
32
Ejercicio 12.5 En este ejercicio aplicaremos el Teorema Central del L´ımite al m´etodo de Montecarlo. {i : 1 ≤ i 6 n y Ui ∈ D} . Mostrar Sean D una regi´on de [0, 1]2 , (Ui )i∈N iid ∼ U([0, 1]2 ) y an = n que para n grande à √ ! n |an − ´area(D)| P p > z α2 ∼ = α. ´area(D)(1 − ´area(D)) Ejercicio 12.6 Primer parcial, mayo de 1999 Supongamos que un bolillero contiene N bolillas que pueden ser rojas, blancas o azules. Supongamos que hay r bolillas rojas y b blancas (y por lo tanto N −(r+b) azules), con r > 1, b > 1. Tomamos una muestra de n bolillas elegidas al azar con reposici´on. Definimos X = n´ umero de bolillas rojas observadas en la muestra, Y = n´ umero de bolillas blancas observadas en la muestra, Z = n´ umero de bolillas azules observadas en al muestra. 1. Calcular las funciones de probabilidad de X, de Y y de Z (si se reconoce alguna distribuci´on conocida, tanto mejor para usted). 2. Calcular E (X) , Var (X) , E (Y ) , Var (Y ). 3. Hallar la funci´on de probabilidad de X + Y . Calcular E (X + Y ) , Var (X + Y ). 4. ¿Son X e Y independientes? Justifique la respuesta. 5. Supongamos que N = 2000. Si se repite 2500 veces de manera independiente la experiencia de muestrear 10 bolillas con reposici´on y se obtiene una cantidad promedio de 3,2 bolillas rojas y 4,6 bolillas blancas, ¿le parece cre´ıble que en el bolillero haya m´as de 1250 bolillas azules? Ejercicio 12.7 Segundo parcial diciembre de 2004 Dados dos n´ umeros, a y λ > 0, decimos que X es una variable Pseudo Exponencial de par´ametros a y λ (y lo denotamos X ∼ P E(a, λ)) si su funci´on de densidad est´a definida por: ½ 0 si x < a fX (x) = (1) Ce−λx si a ≤ x donde C es una constante. 1. (a) Calcule C como funci´on de a y λ. (b) Calcule mX , la mediana de la variable X, E(X) y Var(X). 2. Considere una muestra de variables aleatorias X1 , X2 , . . . Xn i.i.d ∼ P E(a, λ). Construya estimadores consistentes para los par´ametros a y λ. (a) por el m´etodo de los momentos. (b) usando promedio emp´ırico Xn y la mediana emp´ırica es mn .
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
33
3. Suponga que a = 2 y que las variables aleatorias X1 , X2 , . . . Xn i.i.d. ∼ P E(2, λ) modelan los tiempos de recambio de componentes en un sistema electr´onico; de manera que el tiempo en que se realiza el n-´esimo recambio es Yn = X1 + X2 + . . . Xn . Estime el m´aximo valor de λ para que el tiempo de recambio de la pieza n´ umero 144 (esto es, Y144 ) sea superior a 576 con probabilidad mayor o igual que 21 . Ejercicio 12.8 Examen diciembre de 2004 Considere una variable aleatoria X absolutamente continua con densidad de probabilidad ½ 2a si 1 ≤ x ≤ b x2 donde a > 12 y b > 1. fX (x) = (2) 0 en caso contrario, 1. Calcule b como funci´on de a. 2. Calcule E(X), Var(X) y mX , la mediana de X. Considere ahora una muestra, X1 , X2 , . . . , X100 , de variables aleatorias i.i.d. con densidad dada por (2). 3. Construya un estimador consistente para el par´ametro b. Justifique su respuesta. 4. Suponiendo a = 1, estime la probabilidad de que el promedio de la muestra est´e en el intervalo [1.8 log 2, 2.1 log 2].
13
Estimaci´ on por Intervalos
Ejercicio 13.1 1. Una m´aquina de refrescos est´a ajustada de tal manera que la cantidad de l´ıquido despachada se distribuye aproximadamente en forma normal con una desviaci´on est´andar igual a 0.15 decilitros. Encontrar un intervalo de confianza al nivel 0.05 para la media de todos los refrescos que sirve esta m´aquina si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitros. 2. ¿Qu´e tan grande tiene que ser la muestra si se desea tener una confianza del 95% de que la media muestral no difiere en m´as de 0.03 decilitros de la media real µ? Ejercicio 13.2 Se ha llevado a cabo un experimento para determinar la vida u ´til de un cierto tipo de mecha (en condiciones extremas). Para esto se tomaron 50 mechas al azar de un stock mayor de mechas, y se les midi´o el tiempo de vida (en cientos de horas) obteni´endose los como promedio muestral X n = 2.266. Por estudios previos se sabe que el tiempo de vida de las mechas de ese tipo tiene una distribuci´on N (µ, σ 2 ) con σ = 1.935.Determinar un intervalo de confianza para la vida u ´til promedio µ de las mechas de ese tipo, con un nivel de confianza igual a 0.95. Ejercicio 13.3 Los contenidos de 7 recipientes similares de ´acido sulf´ urico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Encontrar un intervalo de confianza al nivel 0.05 para la media de todos los recipientes, suponiendo una distribuci´on aproximadamente normal. Ejercicio 13.4 Una m´aquina produce piezas met´alicas de forma cil´ındrica. Se toma una muestra de piezas cuyos
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
34
di´ametros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 cent´ımetros. Encontrar un intervalo de confianza al nivel 0.01 para el di´ametro promedio de piezas de esta m´aquina, si se supone una distribuci´on aproximadamente normal. Ejercicio 13.5 Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidos por determinada compa˜ n´ıa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.0. Encontrar un intervalo de confianza al nivel de 0.05 para la varianza de todos los paquetes de semillas de pasto que distribuy´o esta compan´ıa, suponiendo una poblaci´on normal. Ejercicio 13.6 Un fabricante de bater´ıas para autom´ovil asegura que sus bater´ıas duran, en promedio, 3 a˜ nos con una varianza de un a˜ no. Si 5 de estas bater´ıas tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 a˜ nos, determine un intervalo de confianza al nivel 0.05 para σ 2 e indique si es v´alida la afirmaci´on del fabricante de que σ 2 = 1. Se supone que la poblaci´on de las duraciones de las bater´ıas se distribuye aproximadamente en forma normal. Ejercicio 13.7 1. Al probar 100 barras de acero que fabric´o la compa˜ n´ıa A se encuentra que 12 no cumplieron con las especificaciones. (a) Determinar un intervalo de confianza al nivel 5% para la proporci´on verdadera de las barras de acero que no cumplen las especificaciones. (b) Si se desea estimar la proporci´on verdadera que no cumple con las especificaciones con una exactitud de 0.05 y a un nivel de confianza de 0.05. ¿ Cu´antas barras se deben muestrear 2. (a) Hallar un intervalo de confianza al nivel 2% para la proporci´on de art´ıculos defectuosos en un proceso de producci´on, si se encontraron 8 art´ıculos defectuosos en una muestra de tama˜ no 100. (b) ¿Qu´e tan grande debe ser la muestra para tener una confianza de 98% de que la proporci´on estimada no difiera m´as de 0.05 de la proporci´on verdadera de defectuosos? 3. Se est´a considerando un nuevo sistema de montaje industrial. El sistema actual tiene una probabilidad de montaje “perfecto” del 80% . Se realiza una muestra de 40 montajes experimentales con el nuevo sistema y 34 de ellos son “perfectos”. Hallar un intervalo de confianza al nivel 5% para la probabilidad de ´exito (montaje “perfecto”) del nuevo sistema. ¿ Se obtienen grandes mejoras con el nuevo sistema?
14
Pruebas de Hip´ otesis
Ejercicio 14.1 Un medicamento para los s´ıntomas de determinada alergia es eficaz en el 50% de los pacientes. Para determinar si un nuevo medicamento es mejor se les administra el medicamento a 20 personas afectadas por alergia. Si 15 o m´as personas no presentan s´ıntomas despu´es del tratamiento se considera que el nuevo medicamento es mejor. 1. Considere el test de hip´otesis con hip´otesis nula p = 0, 5 e hip´otesis alternativa p > 0, 5, donde p es la probabilidad de que una persona no presente m´as s´ıntomas de alergia luego del tratamiento, con el criterio de decisi´on anterior. (a) Calcular la probabilidad α de decidir que el medicamento nuevo es mejor, cuando en realidad no lo es (error de tipo I).
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
35
(b) Calcular la probabilidad β de quedarse con el medicamento viejo cuando el nuevo es mejor y es eficaz en el 70% de los casos (error de tipo II, con la hip´otesis alternativa p = 0, 7). 2. Considere como criterio de decisi´on una regi´on cr´ıtica del tipo R = {X > c}, siendo X la cantidad de personas, dentro de la muestra de 20, para las cuales el tratamiento es eficaz. (Es decir que si X > c se decide que el nuevo medicamento es mejor). (a) Construya una regi´on cr´ıtica para que α = 0, 01. (b) Calcular β en este caso. Ejercicio 14.2 Para probar la hip´otesis nula de que la resistencia media de determinado pl´astico es µ 0 = 2 2 10 lb/pulg contra la posibilidad de que sea µ1 = 10, 3 lb/pulg (hip´otesis alternativa) se realizaron las siguientes mediciones: 9.8, 10.4, 10.6, 9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 9.7, de la resistencia de este pl´astico. Las mediciones son independientes, con distribuci´on normal con σ = 0, 6. 1. Se decide seg´ un el siguiente criterio: si el promedio de las mediciones es menor que 10,15 consideramos que la resistencia es 10, y de lo contrario consideramos que la resistencia es 10,3. ¿Qu´e decisi´on tomar´ıa para los datos anteriores? Calcular α y β. ¾ ½√ n(X n −µ0 ) > z 2. Se usa la siguiente regi´on cr´ıtica para testear al nivel α: Rα = α . σ (a) Decidir si se puede rechazar la hip´otesis nula para los siguientes niveles α 1 = 0, 01, α2 = 0, 05 y α3 = 0, 1. (b) Calcular β en cada caso. Observar que a medida que crece α, decrece β. La regi´on cr´ıtica utilizada en esta parte corresponde a un test sobre la media para datos normales. Ejercicio 14.3 Una compa˜ n´ıa produce un tipo de tubos fluorescentes cuya duraci´on promedio est´a distribuida en forma normal con una media µ = 1600horas y una desviaci´on est´andar de σ = 120 horas. Al tomar una muestra de 100 tubos fluorescentes producidos por la compa˜ n´ıa, se obtuvo una duraci´on muestral promedio X 100 = 1570 horas. 1. Testear la hip´otesis nula µ = 1600 horas contra la hip´otesis alternativa µ 6= 1600 horas con un nivel significaci´ = 0, 01, usando la siguiente regi´on cr´ıtica para testear al nivel α: ¯ on α ¾ ½¯ de ¯ √n(X n −µ0 ) ¯ ¯ ¯ Rα = ¯ σ ¯ ≥ z α2 .
2. Testear la hip´otesis nula µ = 1600 horas contra la hip´otesis alternativa µ < 1600 horas con un½nivel de significaci´ on α = 0, 01. Para este test usamos la siguiente regi´on cr´ıtica: ¾ √ n(X n −µ0 ) 6 −zα . Rα = σ 3. Se cree que mediante un nuevo proceso de fabricaci´on se puede mejorar la duraci´on promedio de los tubos fluorescentes. (Se mantiene una desviaci´on est´andar de σ = 120 horas.) La regla de decisi´on basada en la duraci´on promedio de los 100 tubos fabricados por el nuevo proceso, para rechazar el proceso primitivo al nivel de significaci´ on 0,01 se¾hace utilizando la ½√ n(X n −µ0 ) > zα . Bajo esta regla siguiente regi´on cr´ıtica para testear al nivel α: Rα = σ de decisi´on hallar la probabilidad de quedarse con el proceso primitivo cuando en realidad el nuevo proceso incrementa la duraci´on promedio a 1640 horas.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
36
Ejercicio 14.4 Se toma una muestra aleatoria de n habitantes de una ciudad muy grande, en la que una proporci´on p de personas padecen una cierta enfermedad. La muestra es de n = 400 y se encuentran 165 personas enfermas. 1. Se desea concluir sobre el valor de p. (a) Construir un intervalo de confianza al 5% para p.
½
H0 : p = 35% usando como H1 : p½= 40% ¾ √ n(X n −p0 ) > zα . criterio de decisi´on la siguiente regi´on cr´ıtica al nivel α: Rα = √
(b) Testear, al nivel α = 0, 05, para los datos anteriores:
p0 (1−p0 )
2. Calcular β. 3. Calcular el p-valor. ¿Cu´al es la decisi´on en este caso? Ejercicio 14.5 −|x|a ∀x∈R Supongamos que X1 , X2 , X3 , X4 iid, con densidad f (x) = ae 2 ½ H0 : a = 1 se utiliza la siguiente regi´on cr´ıtica: R = {M < 3}, siendo 1. Para testear H1 : a = 2 M = max {X1 , X2 , X3 , X4 }. Calcular α y β. 2. Idem si se utiliza la regi´on cr´ıtica R0 = {m > 1}, donde m = min {X1 , X2 , X3 , X4 }. 3. Considere ahora regiones cr´ıticas del tipo R = {M < c}. (a) Hallar α y β en funci´on de c. Graficar. (b) Hallar el p-valor para los siguientes datos: 2.2, 2.5, 1.8, 1.3. ¿Cu´al es la decisi´on ? Ejercicio 14.6 Examen agosto 2003 1. Considere tres cajas: la Caja 1 contiene 2 bolas rojas y 2 azules, la Caja 2 contiene 3 bolas rojas y 1 azul y la Caja 3 est´a inicialmente vac´ıa. Se extraen al azar de manera independiente una bola de la Caja 1 y una bola de la Caja 2 y se las coloca en la Caja 3. (a) Calcule la probabilidad de que en la Caja 3 queden dos bolas rojas. (b) Calcule la probabilidad de que en la Caja 3 queden una bola roja y otra azul. (c) Si se extrae al azar una bola de la caja 3, ¿cu´al es la probabilidad de que ´esta sea roja? (d) Dado que al extraer una bola al azar de la caja 3, ´esta result´o ser roja, ¿cu´al es la probabilidad de que la restante bola en la caja tambi´en sea roja? 2. Se necesita decidir entre dos hip´otesis relativas a la Caja 3: ½ H0 : las dos bolas son rojas H1 : una de las bolas es roja y la otra azul. El criterio para decidir entre una u otra hip´otesis es el siguiente: se hacen dos extracciones con reposici´ on de la Caja 3 y se decide H0 en caso de que en las dos extracciones se obtenga una bola roja; se decide H1 en caso contrario. (a) ¿Cu´al es la probabilidad de decidir H0 siendo H1 verdadera? (b) ¿Cu´al es la probabilidad de decidir H1 siendo H0 verdadera?
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
14.1
37
Test de Aleatoriedad
Ejercicio 14.7 Un corredor observ´o la siguiente venta de bonos a lo largo de un a˜ no: enero febrero marzo abril mayo junio
19 23 20 17 18 20
julio agosto setiembre octubre noviembre diciembre
22 24 25 28 30 21
1. Aplique el test de rachas para decidir si los datos pueden considerarse iid. 2. Utilizando el test de correlaci´on de rangos de Spearman analice posibles tendencias en la venta de bonos. Ejercicio 14.8 Al realizar pruebas de torsi´on con un determinado tipo de alambre de acero se obtuvieron los siguientes resultados. Estudie su aleatoriedad. x1 x2 x3 x4 x5
= 2.5 = 4.15 = 2.72 = 2.63 = 3.69
x6 = 3.79 x7 = 4.85 x8 = 2.87 x9 = 3.47 x10 = 4.13
x11 x12 x13 x14 x15
= 4.98 = 2.57 = 2.97 = 4.5 = 4.95
x16 x17 x18 x19 x20
= 3.36 = 3.54 = 3.89 = 3.03 = 3.98
x21 x22 x23 x24 x25
= = = = =
3.38 4.07 2.7 2.82 3.29
x26 x27 x28 x29 x30
= = = = =
4.04 4.16 4.71 2.96 3.97
x31 x32 x33 x34 x35
= 4.68 = 3.88 = 4.19 = 2.52 = 2.8
Ejercicio 14.9 Se consideraron 14 muestras de un determinado mineral para determinar su contenido de hierro, obteni´endose los siguientes datos: 74.3
74.1
75.4
67.4
69.3
70.5
70.1
69.9
68.7
70.3
70.7
71.1
74.4
70.2
Estudiar la aleatoriedad de la muestra. Ejercicio 14.10 Las siguientes son mediciones de temperatura tomadas a la misma hora durante 20 d´ıas: 1 2 3 4 5
22.67 21.66 16.31 15.95 15.15
6 7 8 9 10
17.88 23.17 24.85 15.17 23.19
11 12 13 14 15
21.21 20.60 17.44 23.33 17.63
16 17 18 19 20
22.54 21.60 17.14 21.02 21.05
1. Aplique tests de aleatoriedad para determinar si la muestra puede considerarse aleatoria. 2. En caso de que se rechace la hip´otesis de datos iid, intente determinar el grado de de dependencia de los datos.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
38
Ejercicio 14.11 Los siguientes datos corresponden a porcentaje de divorcios en los Estados Unidos: A˜ no 1945 1950 1955 1960 1965 1970 1975 1980 1985
Porcentaje 3.5% 2.6% 2.3% 2.2% 2.5% 3.5% 4.8% 5.2% 5.0%
Establezca si existe una tendencia en los datos.
14.2
Test de Ajuste
Ejercicio 14.12 Los siguientes datos son mediciones iid de la concentraci´on test de Kolmogorov-Smirnov para ajustar a una distribuci´on y b = 2 (C(50, 22 )). X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 62 47 50 49 55 52 49 15 53 49
de hierro en una aleaci´on. Usar el de Cauchy con par´ametros M = 50 X11 50
X12 52
X13 57
X14 51
X15 46
Ejercicio 14.13 Simular una muestra de 100 datos iid con distribuci´on uniforme en el intervalo [−1, 1]. 1. Usar un test de de Kolmogorov-Smirnov para ajustar la muestra a una distribuci´on uniforme en el intervalo [−1, 1] (U[−1, 1]). 2. Suponga que quiere ajustar la misma muestra a una distribuci´on uniforme pero no conoce los par´ametros. Utilizando una parte de la muestra para estimar y otra para hacer el test use Kolmogorov-Smirnov para ajustar a una distribuci´on uniforme con los par´ametros estimados. Compare los resultados que obtiene estimando par´ametros por el m´etodo de m´axima verosimilitud y por el m´etodo de los momentos. Ejercicio 14.14 Se tienen las siguientes mediciones iid del punto de ebullici´on de un compuesto de silicio (en grados Celsius). X1 99.78 X9 100.16
X2 99.17 X10 100.09
X3 100.06 X11 99.91
X4 100.14 X12 100.36
X5 99.43 X13 99.71
X6 100.60 X14 101.09
X7 100.59 X15 99.93
X8 99.98 X16 100.06
1. Realizar un test de D’Agostino para la muestra. ¿Puede asumir que los datos son normales? 2. Realizar un test de Shapiro-Wilk para la muestra. Ejercicio 14.15 Se tienen los siguientes tiempos de falla iid (en minutos) de ciertos componentes electr´onicos.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING X1 1.75 X11 1.50
X2 0.13 X12 4.24
X3 1.63 X13 7.18
X4 0.56 X14 7.44
X5 18.45 X15 6.62
X6 7.95 X16 3.45
39
X7 0.80 X17 0.62
X8 3.37 X18 2.85
X9 0.46 X19 0.81
X10 1.23 X20 3.10
1. Estudiar si puede considerar que los datos son exponenciales de par´ametro λ = 0.25 realizando un test de Kolmogorov-Smirnov. 2. Estudiar si puede considerar que los datos son exponenciales. Ejercicio 14.16 Se desea ajustar la distribuci´on de la cantidad de mensajes que recibe el controlador de tr´afico a´ereo de un aeropuerto durante un intervalo de cinco minutos. Para 400 intervalos de cinco minutos se contaron la cantidad de mensajes recibidos y se obtuvieron las siguientes frecuencias: n´ umero de radio-mensajes frecuencias observadas
a lo sumo 1 18
2 47
3 76
4 68
5 74
6 46
7 39
8 15
9 9
m´as de 10 8
¿Los datos pueden considerarse distribuidos con la distribuci´on de Poisson con λ = 4.6? Ejercicio 14.17 Se tienen 100 datos iid correspondientes a variaciones de precios. Se desea saber si los datos tienen distribuci´on log´ıstica. Para eso se determinaron 10 intervalos I1 = (−∞, a1 ], . . . , I10 = (a9 , +∞), donde los extremos de los intervalos son a1 = 1.41, a2 = 3.84, a3 = 5.46, a4 = 6.78, a5 = 8, a6 = 9.22, a7 = 10.54, a8 = 12.16, a9 = 14.59, y se cont´o la cantidad de datos en cada intervalo resultando: I1 14
I2 7
I3 11
I4 9
I5 13
I6 8
I7 16
I8 10
I9 6
I10 6
1. Decidir si los datos tienen distribuci´on log´ıstica con par´ametros µ = 8 y a = 3 (L(8, 3)). Los intervalos I1 , . . . , I10 se tomaron de modo que si X ∼ L(8, 3), entonces P (X ∈ Ik ) = 0.1, k = 1, . . . , 10. 2. Decidir si los datos tienen distribuci´on log´ıstica sin asumir ninguna hip´otesis previa sobre los par´ametros. (Sugerencia: para la estimaci´on de par´ametros con ‘solver’ en Excel usar para la condici´on inicial que el promedio de los datos es X 100 = 7.2948 y que el estimador de la desviaci´on est´andar es s100 = 5.2984.)
14.3
Test de Comparaci´ on
Ejercicio 14.18 Los datos siguientes representan las variaciones de poblaci´on (en porcentajes) entre 1970 y 1980 en regiones Aplicar el test de Kolmogorov-Smirnov para ver si las variaciones son iguales. rural
1.1
no rurales
-21.7 -2.4
-16.3 9.9
-11.3 14.2
-10.4 18.4
-7 20.1
-2 23.1
1.9
6.2
70.4
Ejercicio 14.19 Sean las siguientes muestras iid independientes. La muestra A tiene distribuci´on F y la muestra B tiene distribuci´on G. A B
79 96
13 141
138 133
129 107
59 102
76 128
75 110
53 104
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
Testear
½
14.4
Test de Medianas
40
H0 : θ = 0 con el modelo G(x) = F (x − θ). H1 : θ 6= 0
Ejercicio 14.20 La resistencia de determinado pl´astico a la fatiga debe ser de 15.5 lb/pulg 2 . Los resultados de 20 piezas del pl´astico fueron los siguientes: 1 2 3 4 5
14.77 14.19 15.66 12.82 16.34
6 7 8 9 10
12.4 14.25 14.29 17.39 16.68
11 12 13 14 15
16.68 15.28 14.87 14.24 15.55
16 17 18 19 20
14.05 13.93 14.71 13.64 15.6
¿Hay suficiente evidencia experimental como para dudar de que no se cumple con las especificaciones? Ejercicio 14.21 Se dispone de 12 valores obtenidos del generador aleatorio de n´ umeros marca ACME. 0.99
0.84
0.48
0.37
0.44
0.98
0.75
0.81
0.68
0.7
0.5
0.23
Si el generador es bueno, esos doce n´ umeros deber´ıan ser: (i) iid (independientes e id´enticamente distribuidos), (ii) con distribuci´on U [0, 1], y por lo tanto, (iii) su “media”debe ser 21 . 1. Investigue si el generador aleatorio de n´ umeros marca ACME es bueno testeando las afirmaciones (i) y (ii). 2. Investigue la afirmaci´on (iii). Ejercicio 14.22 Se presume que un tratamiento reduce el peso de las personas. Mediante una muestra aleatoria se seleccionan 10 personas que siguieron dicho tratamiento durante todo el tiempo exigido. Puede suponerse que los datos de los pacientes son (X1 , Y1 ), . . . , (X10 , Y10 ) iid. El peso de cada paciente, antes y despu´es del tratamiento (medido en kg) es el siguiente: persona peso antes peso despu´es
14.5
1 108 95
2 72 76
3 81 69
4 104 81
5 69 56
6 73 81
7 114 95
8 86 81
9 92 71
10 98 97
Test de Independencia
Ejercicio 14.23 Un grupo de investigadores desea evaluar si un nuevo equipo de tratamiento aguas residuales es efectivo para reducir los niveles de contaminantes de las aguas vertidas a un r´ıo por 10 curtiembres. A tales efectos se midi´o el nivel de contaminantes antes (A) y despu´es (B) del tratamiento, los resultados fueron los siguientes:
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
1 1.52
1 2.08
2 2.92
2 3.03
3 4.44
3 0.80
41
4 4.24
Muestra A 5 6 1.72 3.70
7 3.64
8 4.82
9 2.12
10 2.08
4 0.96
Muestra B 5 6 2.71 2.39
7 3.07
8 2.87
9 0.33
10 1.76
Utilizando pruebas de hip´otesis: 1. Estudiar la aleatoriedad de ambas muestras. 2. ¿Hay independencia entre los datos de una muestra y otra? Justifique su respuesta. Ejercicio 14.24 1. Para comparar el desempe˜ no de los estudiantes en un curso en relaci´on con su desempe˜ no en la prueba de ingreso, se toma al azar una muestra de 400 estudiantes de los archivos de la bedel´ıa y se obtienen los siguientes datos
Desempe˜ no en el curso
Desempe˜ no en la prueba de ingreso Mala Normal Muy Buena Aplazado 23 60 29 Normal 28 79 60 Muy Buena 9 49 63 Total 60 188 152
Total 112 167 121 400
¿El desempe˜ no en la prueba de ingreso y el desempe˜ no en el curso son independientes?. (Use el nivel de significaci´on de α = 0.01). 2. Repita el an´alisis anterior tras combinar las categor´ıas mala y normal en la prueba de ingreso y las categor´ıas aplazado y normal del curso de facultad. Ejercicio 14.25 Se tiene una muestra de 200 ratones afectados por una cierta enfermedad. Se suministra un suero a 100 ratones (grupo A) pero no al resto (grupo B). Se encuentra que 75 ratones del grupo A y 65 ratones del grupo B se recuperan de la enfermedad. ¿Los datos proporcionan evidencia de que el suero cure la enfermedad?
14.6
Test param´ etricos
Ejercicio 14.26 Puede suponerse que el registro de lluvias de 10 puntos distintos del pa´ıs aporta resultados iid gaussianos, decidir si el promedio de lluvias es 12 mm, si los datos (en mm.) son: 14, 8, 30, 6, 12, 11, 10, 14, 12, 8 Ejercicio 14.27 Se consideran 16 mediciones de una cierta concentraci´on. Puede suponerse que las mediciones X1 , . . . , X1 6 siguen el modelo: Xi = m + ei , donde e1 , . . . , e16 iid ∼ N (0, s2 ). 1. Si la muestra es: 0.50, 0.38, 0.61, 0.44, 0.53, 0.42, 0.43, 0.47, 0.58, 0.36, 0.55, 0.51, 0.57, 0.59, 0.46, 0.48 Hallar un intervalo de confianza al nivel 5% para m.
Probabilidad y Estad´ıstica - 2006 - IMERL - FING
2. Si se considera el test:
½
42
H0 : µ = 0.50 ¿Cu´al es su decisi´on para a = 0.05? H1 : µ 6= 0.50
3. Para el test anterior calcular el p-valor a∗ ¿Cu´al es su decisi´on final? ¿Puede determinar la probabilidad de error en su decisi´on? Ejercicio 14.28 Se posee una muestra de 9 mediciones de una longitud. Puede suponerse que los datos observados son iid y gaussianos (N (µ, σ 2 )). 1. Si los datos son: 1.838415, 2.7354, 3.871649, 3.503454, 2.506013, 1.819116, 2.912714, 4.764129, 3.100576 testear si σ = 0.95 ´o no. 2. Utilizando la decisi´on tomada en la parte anterior y los mismos datos, testear las hip´otesis: ½ H0 : µ = 3.0 H1 : µ 6= 3.5 Ejercicio 14.29 Se debe reparar una m´aquina en una f´abrica cuando produce m´as de 10% de piezas defectuosas en un lote grande de art´ıculos producido diariamente. Una muestra aleatoria de tama˜ no 100 art´ıculos de la producci´on del d´ıa contiene 15 piezas defectuosas y el supervisor dice que se debe reparar la m´aquina. Testear la hip´otesis nula de la proporci´on de piezas defectuosas es menor o igual al 10%”contra la hip´otesis alternativa “la proporci´on de piezas defectuosas es mayor que el 10%” Ejercicio 14.30 Se toma una muestra aleatoria de n habitantes de una ciudad muy grande, en la que una proporci´on p de personas padecen una cierta enfermedad. 1. Si n = 400 y se encuentran 165 personas enfermas, estimar p y construir un intervalo de confianza al 5 ½ H0 : p = 0.35 2. Testear para los datos anteriores H1 : p 6= 0.40 Ejercicio 14.31 En un estudio de rocas sedimentarias se obtuvieron los siguientes di´ametros (medidos en mm.) de dos tipos de arena: Arena I: 0.63, 0.17, 0.35, 0.49, 0.18, 0.43, 0.12, 0.20, 0.47, 1.36, 0.51, 0.45, 0.84, 0.32, 0.40 Arena II: 1.13, 0.54, 0.96, 0.26, 0.39, 0.88, 0.92, 0.53, 1.01, 0.48, 0.89, 1.07, 1.11, 0.58 Se supone que ambas muestras son iid, gaussianas e independientes entre s´ı. Se desea saber si los dos tipos de arena son iguales o no lo son. Ejercicio 14.32 Se desea comparar la proporci´on de motores defectuosos que se producen en dos turnos de trabajadores. Se seleccionaron al azar un gran n´ umero de motores que se produjeron en una semana determinada, de los cuales n1 = 50 motores son de la producci´on del turno 1 y n2 = 60 motores son de la producci´on del turno 2. Result´o que 4 motores del turno 1 eran defectuosos y 6 de la producci´on del turno 2. ¿Hay una diferencia significativa entre las cantidades de motores defectuosos en los dos turnos?