Angel Francisco Arvelo
[email protected] 1
ANGEL FRANCISCO ARVELO LUJAN Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el área de Probabilidad y Estadística, con más de 40 años de experiencia en las más reconocidas universidades del área metropolitana de Caracas. Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003 Universidad Central de Venezuela: Profesor por Concurso de Oposición desde 1993 al presente Universidad Simón Bolívar: Profesor desde 2005 al presente Universidad Metropolitana: Profesor desde 1973 a 1987 Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004 Sus datos personales son : Lugar y Fecha de Nacimiento: Caracas, 16-02-1947 Correo electrónico:
[email protected] Teléfono: 58 416 6357636 Estudios realizados: Ingeniero Industrial. UCAB Caracas 1968 Máster en Estadística Matemática CIENES , Universidad de Chile 1972 Cursos de Especialización en Estadística No Paramétrica Universidad de Michigan 1982 Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al Presente El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los Laboratorios de esa misma Universidad especializados en ensayos de Calidad, Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB 1998. En numerosas oportunidades, el Profesor Arvelo ha dictado cursos empresariales en el área de “Estadística General” y “Control Estadístico de Procesos”. Una mayor información, puede ser obtenidos en la siguiente página web: www.arvelo.com.ve
Angel Francisco Arvelo
[email protected] 2
Resumen sobre Temas de Estadística: Cálculo de Probabilidades Profesor: Angel Francisco Arvelo L. I. Definiciones Básicas I.1-Espacio Muestral: Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cuando cada uno de los elementos del espacio muestral tiene idéntica oportunidad de ocurrir, se dice que el espacio es equiprobable . I.2 - Evento o Suceso : Es cualquier subconjunto del espacio muestral. Sucesos elementales son aquellos que tienen un solo elemento. Sucesos excluyentes son aquellos que no pueden ocurrir simultáneamente, y en consecuencia su intersección es vacía, es decir: A y B son excluyentes ⇔ A∩B = Ø 1.3- Algebra de eventos: Entre los eventos, se puede definir un álgebra, para designar otros eventos, entre los cuales los más importantes son: AUB Representa la ocurrencia de por lo menos uno de los dos. A ∩ B Representa la ocurrencia de los dos eventos simultáneamente. Ac Representa la no ocurrencia del evento . Ac ∩ Bc Representa la no ocurrencia de ninguno de los dos eventos. A - B = A ∩ Bc Representa la ocurrencia del evento "A" solamente (A - B) U (B -A) Representa la ocurrencia solo uno de los eventos. 1.4 Axiomas del cálculo de probabilidades • La probabilidad del espacio muestral es igual a 1; P(Ω) = 1 • P(A) ≥ 0 , para cualquier evento “A” • Si “A” y “B” son eventos excluyentes: P(AUB) = P(A) + P(B) De los axiomas anteriores se puede demostrar que la probabilidad de cualquier evento “A” es siempre un número real comprendido en el intervalo cerrado [ 0, 1] , es decir 0 ≤ P(A) ≤ 1 , para cualquier evento “A” II. Fórmulas Básicas para el Cálculo de Probabilidades . II.1 Probabilidad por Conteo: Esta fórmula se aplica cuando es posible contar todos los elementos del espacio muestral, y todos los elementos que pertenecen al evento cuya probabilidad se pretende calcular. Se exige que el espacio muestral sea equiprobable .
Ejemplos para resolver en clase: Ejemplo 1 : Al lanzar dos dados . a) ¿ Cual es la probabilidad de obtener una suma igual a 9 ? . b) ¿ Cual es la probabilidad de que los dos números obtenidos sean pares ? . c) ¿ Cual es la probabilidad de que salga algún 6 ? .
Angel Francisco Arvelo
[email protected] 3
Solución : El espacio muestral es equiprobable sólo si se hace distinción entre los dados. De no hacerla aquellos resultados con dos números diferentes estarían en ventaja con los que tienen el mismo n{umero repetido. En consecuencia, el espacio equiprobable estaría definido por todos los puntos (x ;y) donde x= 1,2,3,4,5,6 ; y = 1,2,3,4,5,6. Este espacio tiene 36 puntos. El evento “Suma 9 “ tiene 4 puntos : (3,6) (4,5) (5,4) y (6,3) Por tanto su probabilidad es 4 / 36 = 1 / 9 El evento “Obtener dos números Pares” da cuando x=2,4 ó 6 ,y = 2,4 ó 6 , es decir de 3 x 3 = 9 maneras. Su probabilidad es entonces : 9 / 36 = 1 / 4. El evento “Sacar algún 6” tiene 11 puntos a su favor y su probabilidad es 11/ 36 II.2 Fórmula de la unión : Esta fórmula se aplica cuando se tienen varios eventos, y se quiere calcular la probabilidad de que ocurra por lo menos uno de ellos. Regla de adición para eventos excluyentes: P(AUB) = P(A) + P(B) Regla de adición para eventos no excluyentes: P(AUB) = P(A) + P(B) - P(A ∩ B) Ejemplo para resolver en clase: Ejemplo 2 : El 6% de las piezas producidas por una cierta máquina presentan el defecto "A" por lo menos , el 4% el defecto "B" por lo menos, y el 2% ambos defectos . Si se selecciona al azar una pieza, calcule las siguientes probabilidades: a) Que presente algún defecto . b) Que presente solo un defecto . c) Que no presente defectos. Solución: Se tiene P(A) = 0,06 , P(B) = 0,04 , P(A∩B) = 0,02 Presentar algún defecto es el evento AUB , en consecuencia: P(AUB ) = 0,06 + 0,04 – 0,02 = 0,08 Presentar solo un defecto es el evento (A - B) U (B -A) = AUB – A ∩ B , y por tanto su probabilidad es : 0,08 – 0,02 = 0,06 No presentar defectos es el evento Ac ∩ Bc = (AUB)c , y su probabilidad es 1- P(AUB) = 1 – 0,08 = 0,92 Esta fórmula de la unión puede ser generalizada para más de dos eventos. Para el caso de tres , la fórmula establece: P(AUBUC) = P(A) + P(B) + P(C) – P(A∩B) – P(A∩C) - P(B∩C) + P(A∩B∩C) Su demostración se deja al estudiante, y es muy fácil de obtener aplicando la formula de la unión de dos a los eventos AUB y C II.3 Fórmula del Complemento : Esta fórmula se utiliza cuando resulta más sencillo calcular la probabilidad de que no ocurra el evento, que calcular la de que ocurra . P(A) = 1 - P (Ac) Al aplicar esta fórmula hay que identificar cual es el complemento del evento y evaluar cual resulta más sencillo de calcular, la del evento o la de su complemento.
Angel Francisco Arvelo
[email protected] 4
Algunos complementos importantes son: EVENTO Al menos uno o Por lo menos uno A lo sumo x veces o No más de x veces Por lo menos x veces ó, x veces o mas Fracaso todas las veces Como mínimo x éxitos
COMPLEMENTO Ninguno Mas de x veces Menos de x veces Al menos un éxito A lo sumo (x-1) éxitos
Ejemplo 3: En un grupo de 6 personas hay dos que son amigos. Si estas 6 personas son acomodadas al azar en una fila de 6 sillas, ¿ cuál es la probabilidad de que los dos amigos queden separados ?. Solución Las formas como 6 personas pueden sentarse en 6 sillas es 6! = 720 El complemento de quedar separados es quedar juntos. Resulta más sencillo calcular las formas como los amigos pueden quedar juntos, pues podríamos considerarlos a ellos dos como un bloque que conjuntamente con las otras 4 personas harían un total de 5 unidades a permutar. Tomando en cuenta además, que los amigos dentro del bloque pudieran permutarse de 2 formas, tendríamos que las formas de quedar juntos es entonces 2 (5! ) = 240 , y la probabilidad de quedar separados 1 – 240/ 720 = 2/3 II.4 Fórmula de la Probabilidad Condicional : Se define como probabilidad de un evento "B" condicionada a otro evento "A" , a la probabilidad de que ocurra el evento "B" , dando como cierto que ocurrió el evento "A" .
Ejemplo 4: En una asignatura, el 10% fue reprobado únicamente en el primer parcial, el 8% fue reprobado únicamente en el segundo parcial, y el 5% en ambos parciales . Calcular las siguientes probabilidades: a) Un estudiante que aprobó el primer parcial, haya sido reprobado en el segundo. b) Un estudiante reprobado en el primer parcial haya sido reprobado en el segundo parcial . c) Un estudiante reprobado en el segundo parcial haya sido reprobado en el primer parcial . d) Un estudiante que haya aprobado algún parcial haya reprobado el segundo Solución: Usualmente es tipo de ejercicios es enfrentado construyendo los conocidos diagramas de Venn tal como se indica en la figura:
Angel Francisco Arvelo
[email protected] 5
En este caso si definimos los siguientes eventos: A. Reprobar el primer parcial ⇒ Ac : Aprobar el primer parcial B. : Reprobar el segundo parcial ⇒ Bc : Aprobar el segundo parcial Tenemos que los que aprobaron ambos parciales fueron 100 – 10- 8 – 5 = 77% , los que aprobaron el primer parcial fueron 100 – 15 = 85% , y los que aprobaron el segundo parcial 100 -13 = 87 % En consecuencia tenemos que: P( B | Ac ) = 8 / 85 P( B | A ) = 5 / 15 = 1 /3 P( A | B ) = 5 / 13 P( B | Ac U Bc ) = 8 / 95
Ejemplo 5: De los 300 estudiantes que aprobaron el examen de admisión, el 50% había nacido en Caracas, el 30% en el interior, y el 20% en el extranjero. De los estudiantes nacidos en Caracas, el 60% eran graduados en liceos públicos; de los nacidos en el interior el 30% , y de los nacidos en el extranjero el 50% . a) Si se elige al azar un estudiante, y éste resultó no ser egresado de un liceo público, ¿ cuál es la probabilidad de que haya nacido en el interior ? . b) Si se elige al azar un estudiante, y éste resultó no ser nacido en el extranjero, ¿ cuál es la probabilidad de que provenga de un liceo público? Solución : La metodología utilizada en el ejemplo anterior con el Diagrama de Venn , suele complicarse cuando hay más de dos eventos involucrados en el problema, y un recurso útil en estos casos, es la construcción de una tabla de doble entrada , llamada “tabla de contingencia” , de la siguiente manera: El lugar de nacimiento presenta tres opciones que van a ser representadas en las filas de la tabla, y el tipo de liceo presenta dos alternativas que se van a representar en las columnas de la tablas. Las diferentes celdas de la tabla representan las intersecciones de lugar de nacimiento con el liceo de procedencia, y las sumas de cada fila y de cada columna, el total de cada categoría. Para los datos de ejercicio, la tabla quedaría de la siguiente manera, una vez calculados los porcentajes correspondientes sobre un gran total de 300 estudiantes: PUBLICO NO PUBLICO TOTAL
Angel Francisco Arvelo
[email protected] 6
CARACAS 90 150 INTERIOR 27 90 EXTRANJERO 30 60 TOTAL 300 Una vez llevados los datos a la tabla, procedemos a completarla de manera que cuadren los totales de fila y de columna con los datos dados, tal como se indica a continuación; PUBLICO NO PUBLICO TOTAL CARACAS 90 60 150 INTERIOR 27 63 90 EXTRANJERO 30 30 60 TOTAL 147 153 300 Al completar la tabla, la solución del ejercicio es obvia. a) Si tenemos la condición de que el estudiante seleccionado resultó no ser egresado de un liceo público, entonces tenemos 153 casos posibles , y por tanto la probabilidad de que haya nacido en el interior es : 63 / 153 P ( Interior |No publico ) = 63 / 153 Si tenemos la condición de que el estudiante seleccionado resultó no ser nacido en el extranjero , entonces tenemos 150 + 90 = 240 casos posibles , de los cuales 90 + 27 = 117 provienen de liceos públicos ; por tanto la probabilidad pedida es : 117 / 240 P (Publico | No Extranjero) = 117 / 240 II.5 Eventos independientes y Fórmula del producto : Se dice que dos eventos son independientes, cuando la ocurrencia de uno de ellos no afecta la probabilidad del otro. A y B son independientes ⇔: P(A ∩ B) = P(A) P(B) Si son tres eventos A, B y C , la independencia exige que se cumplan 4 condiciones : P(A ∩ B) = P(A) P(B) , P(A ∩ C) = P(A) P(C); P(B ∩ C) = P(B) P(C) , y además P(A ∩ B∩ C) = P(A) P(B) P(C) En general, para que “n” eventos sean independientes es necesario que la probabilidad de cualquier intersección entre dos, tres , etc., e incluso todos ellos, sea igual al producto entre las probabilidades de los eventos involucrados en esa intersección. Solamente en caso de que los eventos sean independientes se pueden multiplicar las probabilidades; y en caso de que no sean independientes, la probabilidad de la intersección debe ser calculada por la fórmula de la probabilidad condicional, es decir: Para eventos dependientes: P(A∩B) = P(A) P(B|A) Si son tres: P(A∩B∩C) = P(A) P(B | A) P(C | A∩B) Es decir, la probabilidad de que ocurran dos eventos simultáneamente es la de de probabilidad de que ocurra el primero multiplicada por la de que ocurra el segundo dado que ocurrió el primero ; y si son tres, hay que multiplicar también por la de que ocurra el tercero dado que ocurrieron los dos primeros.
Angel Francisco Arvelo
[email protected] 7
Cuando la condición del problema no obliga a que el evento deba ocurrir en un determinado orden, tanto para eventos independientes como para dependientes, es necesario tomar el cuenta el número de órdenes como puede ocurrir. Cuando el experimento es con reemplazo, cada extracción es independiente de las restantes; cuando no hay reemplazo, la probabilidad de cada extracción está condicionada a las anteriores. Cuando los eventos son independientes la ocurrencia de uno no afecta la probabilidad del otro, y se cumple: P(B|A) = P(B) y P(A|B) = P(A) Ejemplo 6: Una caja contiene diez tornillos, de los cuales tres son defectuosos y los siete restantes buenos. Si se seleccionan al azar dos tornillos, calcule la probabilidad de que salga uno bueno y otro defectuoso, en caso de que el muestreo sea: a) con reemplazo, b) sin reemplazo. Solución: Para resolver por probabilidad condicional, tendríamos que considerar los siguientes eventos: Evento A : Seleccionar la primera buena P(A) = 710 Evento B: Seleccionar la segunda defectuosa P(B|A) = 3/ 9 si se extraen sin reemplazo ó P(B|A) = 3/ 10 si hay reemplazo P(A∩B) = 7/10 x 3/ 9 = 7/30 sin reemplazo, o P(A∩B) = 7/10 x 3/ 10 = 21/100 con reemplazo Este evento A∩B representa la ocurrencia de ambos eventos, es decir la primera buena y la segunda defectuosa en ese estricto orden. Si la condición del problema no exige que sea en ese estricto orden, tal como es el caso en donde la pregunta es que uno salga bueno y otro defectuoso sin especificar el orden, entonces es necesario considerar el otro orden cuya probabilidad es la misma. En consecuencia si C es el evento sacar una buena y otra defectuosa P( C ) = 2 x 7/10 x 3 / 9 = 7 /15 sin reemplazo o P( C ) = 2 x 7/10 x 3 / 10 = 21 /50 con reemplazo Nótese que si pregunta fuese la probabilidad de extraer dos defectuosas, entonces la respuesta sería 3/10 x 2 / 9 = 1 /15 sin reemplazo, ó 3/10 x 3 / 10 = 9 /100 con reemplazo. En este caso no queda multiplicada por 2, pues existe un solo orden que es “Defectuosa” la primera y “Defectuosa” la segunda Ejemplo 7 : Por experiencia anterior se sabe que la probabilidad de que una máquina fabrique una pieza defectuosa es de 2% . Si se supone que la producción de cada pieza es independiente de las restantes, ¿cuál es la probabilidad de que en una caja de diez piezas se encuentren: a) cero defectuosas , b) por lo menos dos defectuosas . Solución: a) Para que la diez piezas de la caja sean todas buenas, es necesario que ocurran 10 eventos simultáneamente, primera buena, segunda buena, …,décima buena, cada uno con probabilidad 98%. Al suponer que son independientes, la probabilidad de que ocurran todos es producto (0,98)10 = 0,8171
Angel Francisco Arvelo
[email protected] 8
b)El evento obtener por lo menos dos defectuosas incluye varios casos, 2 defectuosas , ó 3 , etc., hasta 10 defectuosas. Su complemento es “A lo mas una defectuosa” que sólo incluye dos casos “Ninguna defectuosa” o “Sólo una defectuosa” En el apartado anterior ya se encontró la probabilidad de ninguna defectuosa que resultó ser 0,8171. Para calcular la probabilidad de “Sólo una defectuosa” debemos considerar que un posible orden es la primera defectuosa y las nueve restantes buenas, cuya probabilidad es: (0.02) (0,98)9 = 0,0167 La defectuosa podría ir en cualquiera de las 10 posiciones, por tanto, la probabilidad de que sólo una defectuosa es : 10 ( 0,0167) = 0,1670 El evento “A lo más una defectuosa” es la unión entre los eventos “Ninguna Defectuosa” y “Sólo una defectuosa” los cuales son excluyentes. P(A lo mas una defectuosa) = 0,8171 + 0,1670 = 0,9841 P( Por lo menos dos defectuosas) = 1- 0,9841 = 0,0159 II.6 Fórmula de la Probabilidad Total y Teorema de Bayes : La fórmula de la Probabilidad Total se usa cuando un evento "B" puede ocurrir por varias causas, todas excluyentes entre si: A1, A2 ....,An,de probabilidades conocidas, y se quiere calcular la probabilidad total de que ocurra el evento, sin importar la causa que lo origine. P(B) = P(A1) P(B |A1) + P(A2) P(B |A2) + ......... + P(An) P (B | An) La fórmula de Bayes se utiliza cuando se da la condición de que ocurrió el evento, y se quiere calcular la probabilidad de que haya ocurrido por una causa determinada.
Para aplicar cualquiera de estas dos fórmulas es conveniente construir un árbol de probabilidad o de decisión. El árbol de probabilidades es un diagrama de flujo en donde se representan los posibles caminos por lo que se puede llegar a un evento final. El árbol está formado por nodos y ramas El nodo inicial es único y representa en el momento de inicio, los demás nodos representan instantes intermedios en donde debe tomarse una decisión sobre el rumbo a seguir. Las ramas del árbol representan las posibles decisiones que se pueden tomar, o los posibles resultados del experimento aleatorios. La ocurrencia de los eventos representados en una rama está condicionada a la ocurrencia de las ramas precedentes. Las probabilidades correspondientes a todas las ramas que convergen a un mismo nodos, deben sumar 1 .
Angel Francisco Arvelo
[email protected] 9
Para aplicar la fórmula de la Probabilidad Total, las probabilidades correspondientes a ramas consecutivas que conducen al evento final se multiplican, y luego se suman todos esos productos. Para aplicar la fórmula de Bayes se divide el producto de probabilidades correspondiente a la causa específica, entre la probabilidad total. La técnica de construir un árbol resulta particularmente útil cuando se tiene una secuencia de experimentos, en donde la probabilidad de ocurrencia de un evento en cada etapa está condicionada a lo que ocurrió en las etapas anteriores, Ejemplo 8: En cierto sector, los grupos de ingresos bajos, medios y altos constituyen el 20%, 55% y 25% de la población respectivamente. Se sabe además que el 80% del grupo de bajos recursos, el 30% de los grupos medios, y el 10% de los grupos altos, se oponen a un proyecto de ley. a) Si se selecciona al azar un individuo de esta población, ¿cuál es la probabilidad de que se oponga al proyecto de ley? b) Si la persona seleccionada se opuso al proyecto de ley, ¿cuál es la probabilidad de que sea del grupo de bajos ingresos? Solución: La primera etapa del experimento, es seleccionar una persona. La selección de esta persona puede dar tres resultados: A (Ingresos Bajos), B (Ingresos Medios) o C (Ingresos Altos). La segunda etapa del experimento es preguntarle a la persona si está a favor o en contra del proyecto de ley; pero esta opinión está condicionada al nivel de ingresos de la persona El árbol de probabilidad escomo sigue:
Tenemos tres caminos para llegar al evento “En Contra” , y la probabilidad total de alcanzarlo es: P(En contra) = 0,20(0,80) + 0,55 (0,30) + 0,25 (0.10) = 0,35 P( A | En contra) = 0,20 (0,80) / 0,35 = 0,4571 Ejemplo 9 : En una fábrica se utilizan 3 máquinas A , B y C para producir un mismo artículo . La máquina A produce 100 piezas diarias, y cada una tiene una probabilidad de 0,06 de ser defectuosa. La máquina B produce 200 piezas diarias, y
Angel Francisco Arvelo
[email protected] 10
cada una tiene una probabilidad 0,02 de ser defectuosa, y la máquina C produce 300 piezas diarias , cada una con probabilidad 0,01 de ser defectuosa . Suponiendo que la producción de cada una de las piezas es independiente de las restantes. a) ¿ Cual es la probabilidad de que una pieza seleccionada al azar durante un día cualquiera, sea defectuosa ? . b) Si examinada una pieza seleccionada al azar, ésta resulto ser defectuosa, ¿cuál es la probabilidad de que haya sido producida por la máquina B? Solución: La fábrica produce 100 + 200 + 300 = 600 piezas diarias, de las cuales 1/6 las produce la máquina “A” , 1/3 la “B” y ½ la “C”. La primera etapa del proceso, es decidir cuál de las tres máquinas va a producir la pieza , y una vez decidido esto , el resultado puede ser que la pieza producida sea “buena” o “defectuosa”” ,lo que depende de la máquina seleccionada. El árbol de probabilidad es el siguiente:
Tenemos tres caminos para llegar al evento “Defectuosa” , y la probabilidad total de alcanzarlo es: P(Defectuosa) = 1/6 (0,06) + 1/3 (0,02) + ½ (0.01) = 0,0217 P( B| Defectuosa) = 1/3 (0,02) / 0,0217 = 0,3077 Ejemplo 10: Dos jugadores “A” y “B” lanzan alternadamente un dado, comenzando “A” . El primero en sacar un 6 gana un premio. ¿Qué probabilidad tiene “A” de ganar este premio? Solución: Este es un caso de árbol infinito, pues si bien es cierto hay una secuencia de lanzamientos, no hay una fecha cierta para la culminación del juego, y este podría prolongarse hasta el infinito. El árbol quedaría como sigue:
Angel Francisco Arvelo
[email protected] 11
P ( Ganar A) = 1/6 + 5/6 5/6 1/6 + …… Se obtiene una suma infinita, es decir una serie, en este caso geométrica, y para hallar su límite de convergencia hay que recordar que para una serie geométrica este es a / (1-r) ,siempre y cuando |r|