Story Transcript
Tema 7
Probabilidad. Distribuciones binomial y normal 7.1.
Introducci´ on
En este tema trataremos algunas cuestiones b´ asicas sobre Probabilidad. Tanto la Probabilidad como la Estad´ıstica son dos campos de las Matem´ aticas que proporcionan u ´tiles herramientas para el estudio de las ciencias de la vida. Muchos fen´ omenos de la naturaleza no son deterministas, es decir, conllevan una aleatoriedad. La teor´ıa de la Probabilidad estudia las leyes que modelan esa aleatoriedad mientras que la teor´ıa estad´ıstica analiza los datos concretos obtenidos de los experimentos; ambas son las caras de una misma moneda que deben conocerse para entender mejor la realidad que se estudia en su conjunto. Los primeros investigadores de la probabilidad de sucesos, sobre todo aplicada a los juegos de azar, fueron los franceses Pierre Fermat (1601-1665) y Blaise Pascal (1623-1662). El nombre de azar proviene de los juegos de dados, donde aparec´ıa pintada la flor de azahar y estaba asociada a la buena suerte, significaba una buena partida. Incluso el nombre de suceso aleatorio, es decir, suceso del cual es imposible predecir el resultado, proviene del lat´ın “aleas”que significa dado. Sin embargo, ya un siglo antes Galileo estudi´ o problemas sencillos como porqu´e es mejor apostar a sacar un 10 que a sacar un 9 en una tirada de tres dados. Antes que Galileo tambi´en se dedic´ o al estudio de estos problemas Cardano, quien incluso escribi´ o un libro sobre los juegos de dados en el que llega a explicar c´ omo hacer trampas para ganar. La introducci´ on de Pascal y Fermat en este tema vino de la amistad de Pascal con un jugador profesional, conocido como Caballero de Mer´e, quien propuso a Pascal una serie de problemas sobre distintas situaciones en las apuestas de dados. Pascal enviaba los problemas a Fermat, con quien le un´ıa una buena amistad y as´ı mantuvieron una continua correspondencia sobre ideas y m´etodos. Pierre Simon Laplace (1749-1827) construy´ o la formulaci´ on definitiva de la teor´ıa general de la probabilidad. Laplace defini´ o el c´ alculo de probabilidades como “el sentido com´ un expresado con n´ umeros”. Este tema consta de las siguientes secciones: 1. Probabilidad. 89
90
TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL 2. Distribuciones discretas. La distribuci´ on binomial. 3. Distribuciones continuas. La distribuci´ on normal.
7.2.
Probabilidad
Llamamos experimento a cualquier proceso que genera un conjunto de datos. Un experimento se dice aleatorio cuando se puede repetir en las mismas condiciones, sus posibles resultados son conocidos previamente y el resultado de cada prueba depende del azar. Un experimento se dice determinista cuando al repetirlo en las mismas condiciones, produce siempre el mismo resultado. Son experimentos aleatorios - -El lanzamiento de un dado. - -El lanzamiento de una moneda. - -La extracci´ on de un naipe de la baraja. - -El tiempo de espera de una persona en la parada del autob´ us. - -El n´ umero de hijos de una pareja, el sexo del mayor, su estatura o el n´ umero de a˜ nos que vivir´ a. - -El n´ umero de veces que hay que lanzar una moneda hasta que salga cara. El espacio muestral, que se denota por Ω, es el conjunto de todos los posibles resultados de un experimento aleatorio. Cualquier subconjunto del espacio muestral se denomina suceso. Se llama suceso elemental al constituido por un solo punto del espacio muestral. Example En el lanzamiento del dado una vez, Ω{1, 2, 3, 4, 5, 6}. Un suceso elemental es, por ejemplo, “que salga el 4”, es decir, A = {4}. Un suceso no elemental es “que salga un n´ umero impar”, que se representar´a como B = {1, 3, 5}. Un espacio muestral puede ser discreto (formado por puntos sueltos) o continuo. Los espacios discretos pueden tener un n´ umero finito o infinito de valores. Algunos ejemplos, - -Lanzamiento de un dado, Ω = {1, 2, 3, 4, 5, 6}. - -Lanzamiento de una moneda, Ω = {C, X}.
´ BINOMIAL 7.3. DISTRIBUCIONES DISCRETAS. LA DISTRIBUCION
91
- -N´ umero de veces que hay que lanzar una moneda hasta que salga cara, Ω = {1, 2, ..., n, ...}. - -Tiempo de espera de una persona en la parada del autob´ us, Ω = [0, 40] (si la frecuencia del autob´ us es de 40 minutos). La teor´ıa de la probabilidad se ocupa de medir la posibilidad de que ocurra un suceso, hasta qu´e punto se puede esperar que ocurra un suceso. La definici´ on de probabilidad es: Definici´ on 7.1. Se llama probabilidad a una regla que asocia a cada suceso, A, del espacio de sucesos, un n´ umero, que representamos por P (A) y llamamos probabilidad de A y que cumple los siguientes axiomas: 1. P (A) ≥ 0 cualquiera que sea A. 2. P (Ω) = 1. 3. Si A y B son dos sucesos disjuntos (es decir, incompatibles), entonces P (A ∪ B) = P (A) + P (B). La probabilidad es un ejemplo de los que se llama una variable aleatoria. Definici´ on 7.2. Se llama variable aleatoria a toda regla que asocia a cada elemento de un espacio muestral, Ω, un n´ umero real. Ejemplo. Al lanzar tres veces una moneda, donde Ω = {(CCC), (CCX), (CXC), (XCC), (CXX), (XCX), (XXC), (XXX)}, se puede considerar la variable aleatoria Z que indique “el n´ umero de caras que salen”. As´ı, por ejemplo, Z(CCC) = 3, Z(CXC) = 2, Z(XXC) = 1, Z(XXX) = 0 Las variables aleatorias pueden ser discretas y continuas. A cada una de ellas y los ejemplos m´ as relevantes dedicamos las siguientes preguntas.
7.3.
Distribuciones discretas. La distribuci´ on binomial
Una variable aleatoria se llama discreta cuando s´ olo puede tomar ciertos valores enteros. El ejemplo m´ as importante de este tipo de variable es el siguiente. Supongamos que un experimento aleatorio con las siguientes caracter´ısticas. 1. En cada prueba del experimento s´ olo son posibles dos resultados a los que se suele llamar ´ exito y fracaso.
92
TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL 2. El resultado obtenido en cada prueba es independiente de los resultados anteriores. 3. La probabilidad del ´exito es constante, esto es, no var´ıa de una prueba a otra. Se representa por p.
Se dice que este experimento sigue el modelo de la distribuci´ on binomial. A la variable aleatoria que expresa el n´ umero de ´exitos obtenidos en cada prueba, se la llama variable aleatoria binomial y se la representa por B(n, p), siendo n y p los par´ ametros de dicha distribuci´ on.
7.4.
Distribuciones continuas. La distribuci´ on normal
Una variable aleatoria se llama continua cuando puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real. En este caso, no tiene sentido hablar de la probabilidad de que tome un valor concreto, porque es 0; en cambio tiene inter´es conocer la probabilidad correspondiente a un intervalo. A una variable aleatoria continua, X, que toma los valores x, se puede asociar una funci´ on, f (x), con las siguientes propiedades: 1. f (x) ≥ 0 en todo su dominio de definici´ on. 2. El ´area encerrada bajo la gr´ afica de f (x) es la unidad. Entonces, f (x) se llama la funci´ on de densidad de la variable X. Con esta funci´ on, se determinan las probabilidades de la manera siguiente: la probabilidad de que la variable X tome los valores comprendidos entre a y b es el ´ area limitada por la curva y = f (x), el eje OX y las rectas verticales x = a y x = b. Si a = −∞ y/o b = +∞, la extensi´ on es evidente. El ejemplo m´ as importante de variable aleatoria continua es la llamada distribuci´ on normal, llamada as´ı porque en un tiempo se crey´ o que describ´ıa el comportamiento “normal”de los fen´ omenos. En todo caso, describe multitud de fen´ omenos en biolog´ıa, pedagog´ıa, psicolog´ıa,.., y esto es as´ı por varios motivos: 1. En gran n´ umero de situaciones hay una fuerte influencia a eliminar por igual a lo que se desv´ıan en an´ aloga medida de la media, sea esta desviaci´ on por arriba o sea por debajo. 2. Se observa que muchos fen´ omenos son sumas de efectos parciales independientes, que estos efectos parciales pueden estar sesgados, pero que la suma s´ı se ajusta a una distribuci´ on sim´etrica que va disminuyendo de forma regular al alejarse de la normal. Por ejemplo, en el peso de las personas de una poblaci´ on, influye la componente gen´etica, el clima, la alimentaci´ on,..; algunas de estas influencias puede no distribuirse normalmente, pero s´ı lo hace el peso. Este hecho fue justificado matem´ aticamente en un importante teorema llamado Teorema Central del L´ımite, que nos dice que si se suman un n´ umero grande de variables aleatorias independientes, id´enticamente distribuidas con media y varianza finitas, entonces tras un cambio de variable adecuado, la distribuci´ on de la variable resultante es aproximadamente, la normal.
´ NORMAL 7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION
93
La distribuc´ on continua m´ as importante es la normal, porque es la que aparece m´ as frecuentemente. Su func´ on de densidad tiene esta forma
Definici´ on 7.3. La funci´ on de densidad de una variable aleatoria, X, con distribuci´ on normal de par´ ametros µ y σ, que denotaremos N (µ, σ) es 1 x−µ 2 1 f (x) = √ e− 2 ( σ ) σ 2π
− ∞ < x < +∞.
El par´ ametro µ es la media y el par´ ametro σ 2 es la varianza. Definici´ on 7.4. Se llama funci´ on de distribuci´ on de la distribuci´ on normal N (µ, σ) a la funci´ on definida por Z x F (x) = f (s) ds, −∞ < x < +∞. −∞
Puede observarse que la funci´ on f (x) es una funci´ on de densidad, esto es, Z +∞ 1 x−µ 2 1 √ f (x) ≥ 0, e− 2 ( σ ) dx = 1, σ 2π −∞ y que tiene adem´ as las siguientes propiedades: 1. Es sim´etrica respecto de la recta x = µ. 2. El m´ aximo est´ a en x = µ. 3. La funci´ on tiene dos puntos de inflexi´ on en x = µ − σ y x = µ + σ.
94
TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL
Por lo que se ha dicho antes 1 P (a ≤ X ≤ b) = F (b) − F (a) = √ σ 2π
Z
b
1
e− 2 (
x−µ 2 ) σ
dx,
a
pero esta integral s´ olo puede aproximarse num´ericamente.
Existe una tabla que contiene los valores de estas integrales, de la que hablamos en la Secci´ on siguiente, para la normal N(0,1). Para el caso general de una variable normal X de media µ y desviaci´ on t´ıpica σ, se hace el cambio de variable Z=
X −µ , σ
que es ya una variable normal est´ andar. As´ı F (x) = P (X ≤ x) = P (σZ + µ ≤ x) = P (Z ≤ que se puede obtener mediante la tabla siguiente:
x−µ ), σ
´ 7.5. CALCULO DE PROBABILIDADES USANDO LA TABLA
7.5.
C´ alculo de probabilidades usando la tabla
Ejemplos: 1. P (Z ≤ 1,43) 2. P (Z ≤ −1,34) 3. P (1,18 ≤ Z ≤ 1,56)
95
96
TEMA 7. PROBABILIDAD. DISTRIBUCIONES BINOMIAL Y NORMAL 4. P (−1,65 ≤ Z ≤ −1,24) 5. P (−0,18 ≤ Z ≤ 1,73) 6. P (Z ≤ k) = 0,75 7. P (Z ≤ k) = 0,35