Story Transcript
46
Estad´ıstica
Tema 4: Variables aleatorias El concepto de variable aleatoria surge de la necesidad de hacer m´as manejables matem´aticamente los resultados de los experimentos aleatorios, que en muchos casos son cualitativos, y que siguen patrones muy similares aunque la naturaleza del experimento no lo sea. Por ejemplo, un experimento consistente en observar el resultado de tirar una moneda, si ´esta est´ a trucada y la probabilidad de cara es 0.9 y la de cruz es 0.1, es similar al experimento observar una pieza fabricada en un proceso que produce un 90% de piezas buenas y un 10% de piezas con defecto, pues en ambos casos, los posibles resultados del experimento son dos y la asignaci´on de probabilidades a los resultados es igual. Sin embargo, ambos experimentos son de naturaleza totalmente diferente.
3.1 Variable aleatoria y ley de probabilidad asociada a la variable. Definici´ on 1 Dado un espacio muestral Ω asociado a un experimento aleatorio, llamaremos variable aleatoria (v.a.) definida sobre Ω a una aplicaci´ on X de Ω en IR. Por ejemplo, en los dos experimentos de la introducci´on, podr´ıa definirse la aplicaci´on X que asigna al resultado “cara” el valor 1 y al resultado “cruz” el valor 0. Igualmente, en el caso de la pieza, podr´ıa definirse una variable asignando al resultado “buena” el valor 1 y al resultado “defectuosa” el valor 0. Definici´ on 2 Dada una variable aleatoria X definida sobre el conjunto de sucesos de un experimento aleatorio, llamaremos soporte de X, que se denota por SX , al conjunto de posibles valores (n´ umeros reales) de la variable aleatoria. Observaci´ on 1 El soporte de una variable aleatoria puede ser discreto o consistir en un intervalo de IR. En los dos ejemplos anteriores, SX = {0, 1}. El soporte de la variable aleatoria se puede considerar como un nuevo espacio muestral, sobre el que se puede definir una probabilidad relacionada con la probabilidad definida sobre el espacio muestral original Ω, de la siguiente forma: dado A ⊂ IR, p(A) = p({ω ∈ Ω/X(ω) ∈ A}) De esta forma se define una aplicaci´on con llegada en el intervalo [0,1], sobre los subconjuntos del soporte que son imagen de un suceso de Ω y se puede demostrar que esta aplicaci´on es una probabilidad. Esta probabilidad se denomina probabilidad asociada a la v.a. X, ley de probabilidad de la v. a. X o distribuci´on de la v.a. X. En el ejemplo: p(1) = p(cara) = 0.9, p(0) = p(cruz) = 0.1 e igualmente: p(1) = p(buena) = 0.9, p(0) = p(def ectuosa) = 0.1 Es decir, las probabilidades definidas sobre SX = {0, 1} son iguales, a´ un cuando los experimentos sean diferentes. Una vez que se conoce el soporte de una variable aleatoria y su distribuci´on, se puede “olvidar” el experimento original. Cada variable aleatoria distinta (es decir, con soporte o distribuci´ on distinta) constituye un modelo probabil´ıstico. En el resto del tema y en los siguientes nos centraremos en el estudio de estos modelos.
47
Estad´ıstica
3.2 Variables aleatorias discretas. Una variable aleatoria es discreta si su soporte es discreto, es decir, si consiste en un n´ umero finito o numerable de resultados: SX = {x1 , x2 , . . . xn , . . .}. on de una variable aleatoria discreta X queda determinada Definici´ on 3 La ley de probabilidad o distribuci´ por los valores p(xi ) = p(X = xi ), i = 1, 2, . . .. Se puede extender la definici´on de p a cualquier n´ umero real, defini´endola como cero para todos los x 6= xi , i = 1, 2, . . .. A esta funci´on definida en IR se la denomina funci´on de probabilidad o de masa de la variable aleatoria.
Ejemplo: El ejemplo m´as sencillo de variable discreta es la variable discreta uniforme, cuyo soporte es SX = {x1 , x2 , . . . , xn } con probabilidades: p(xi ) = n1 . Otra forma de definir la distribuci´on de una v.a. discreta es mediante la funci´on de distribuci´ on: Definici´ on 4 Llamaremos funci´ on de distribuci´ on de la variable aleatoria X a la funci´ on: F : IR 7−→ [0, 1] definida por: F (x) = p(X ≤ x). Propiedades 1
Propiedades de la funci´ on de distribuci´ on.
(a) lim F (x) = 1 y lim F (x) = 0. x7→∞
x7→−∞
La primera igualdad se debe a que {X ≤ ∞} es todo el espacio muestral y la segunda a que {X ≤ −∞} es su complementario. (b) Si SX = {x1 , x2 , . . . xn , . . .} y los valores est´ an ordenados de menor a mayor, F (x) =
k P
p(xi ), si x ∈ [xk , xk+1 ).
i=1
(c) F es creciente: si x ≤ y, F (x) ≤ F (y). (d) F es continua a la derecha: lim F (x + h) = F (x). h7→0+
(e) p(xi ) = F (xi ) − F (xi−1 ). (f ) Como consecuencia de todas las propiedades anteriores, la gr´ afica de F es discontinua con saltos finitos en los puntos de probabilidad no nula, y creciente.
3.3 Variables aleatorias continuas. De forma intuitiva, una variable aleatoria continua es aquella que toma valores en un intervalo de IR. Posteriormente daremos una definici´on m´as rigurosa. Vamos a introducir este concepto y el de distribuci´on de una variable continua de forma intuitiva, partiendo de un ejemplo. Consideremos la medida del di´ametro interior de un rodamiento de determinadas caracter´ısticas. Esta medida puede considerarse una variable aleatoria pues las medidas de los distintos rodamientos tomar´an valores aleatorios dentro de un intervalo de IR m´as o menos amplio. Si tomamos 100 de estos
48
Estad´ıstica
rodamientos, anotamos sus medidas y construimos el histograma correspondiente, despu´es de haber agrupado en clases, cada rect´angulo del histograma tendr´a ´area proporcional a la frecuencia relativa de la clase correspondiente, y esta frecuencia se puede escribir como: fi = Fi+1 − Fi , donde fi es la frecuencia relativa de la clase [xi , xi+1 ) y Fi+1 es la correspondiente frecuencia relativa acumulada. Vamos a suponer que la raz´on de proporcionalidad es 1 y por tanto, que: (xi+1 − xi )hi = Fi+1 − Fi d´onde hi es la altura del rect´angulo. Podemos observar en ese histograma que el ´area total es 1 y que la probabilidad de que una de las 100 piezas escogida al azar tenga su medida en el intervalo [xi , xi+1 ) es el ´area del histograma correspondiente a este intervalo Si ahora medimos 1000 piezas y agrupamos en clases (igualmente espaciadas), obtendremos un nuevo histograma; si tomamos 100000 piezas y agrupamos en clases, ..., los sucesivos histogramas van a ir aproxim´andose a una curva (Ley de Regularidad Estad´ıstica). ¿Cu´al va a ser la altura f(x) correspondiente a cada x del soporte de esta variable, en esa curva?. En el histograma inicial, la altura de un punto x que estuviese en el intervalo [xi , xi+1 ) era: hi =
Fi+1 − Fi xi+1 − xi
e igualmente en los sucesivos histogramas, de forma que f(x) ser´a el l´ımite de estas alturas cuando el n´ umero de piezas observadas y el n´ umero de clases tiendan a infinito (y por tanto la amplitud de las clases tienda a cero). A esta curva l´ımite la vamos a llamar funci´on de densidad. Su nombre proviene de la similitud entre el concepto de probabilidad, las frecuencias relativas y la interpretaci´on de ´estas como masas. Cuando se consideran variables aleatorias continuas, el soporte de la variable se puede interpretar como una varilla delgada de masa unidad y densidad no constante, dada por la funci´on de densidad de probabilidad f(x). Igual que en el caso de la varilla (en el que cada punto de la misma tiene masa cero) la probabilidad de cada punto es cero, sin embargo, la probabilidad de un intervalo contenido en el soporte (equivalente a la masa de un trozo de varilla) puede ser no nula. Definici´ on 5 Diremos que una variable aleatoria X es continua si existe una funci´ on f : IR 7−→ IR, integrable, tal que: (a) f (x) ≥ 0 para todo x ∈ IR. (b)
R∞
−∞ f (x)dx
(c) p(X ≤ x) =
= 1. Rx
−∞ f (t)dt.
A dicha funci´ on se la denomina funci´ on de densidad de la variable aleatoria X. Observaci´ on 2 A partir de lo desarrollado en la introducci´ on de este punto, se deduce que f (x) describe el comportamiento “a largo plazo” ( es decir, cuando el n´ umero de observaciones tiende a infinito) de la variable.
49
Estad´ıstica
Ejemplo: De nuevo, el ejemplo m´as sencillo de v. a. continua es la v.a. continua uniforme, que se define como aquella que tiene densidad constante en un intervalo acotado de IR. As´ı, la v.a. continua uniforme en [a, b] ser´a la que tiene por soporte SX = [a, b] y densidad: (
f (x) = (¿Por qu´e
1 b−a
a≤x≤b en otro caso
0
1 b−a ?)
Igual que ocurre con las v.a. discretas, la distribuci´on de una v.a. continua se puede definir tambi´en a partir de la funci´on de distribuci´on de la variable, que se define de igual forma: on de distribuci´ on de la variable aleatoria X a la funci´ on: F : IR 7−→ Definici´ on 6 Llamaremos funci´ [0, 1] definida por: F (x) = p(X ≤ x). Teniendo en cuenta la definici´on de funci´on de densidad, se cumplen las siguientes propiedades: Propiedades 2 (a) lim F (x) = 1 y lim F (x) = 0. x7→∞
x7→−∞
(b) F es creciente: si x ≤ y, F (x) ≤ F (y). (c) F (x) =
Rx
−∞ f (t)dt.
(d) F(x) es continua en IR. (e) F(x) es derivable y F 0 (x) = f (x), para cada x ∈ R en el que la funci´ on de densidad es continua. (f ) La probabilidad de un punto es nula. (g) p([a, b]) = p((a, b]) = p([a, b)) = p((a, b)) = F (b) − F (a) =
Rb a
f (t)dt.
Ejemplo: La funci´on de distribuci´on de la v.a. continua uniforme ser´a:
F (x) =
0
si x ≤ a a≤x≤b si x ≥ b
x−a b−a
1
3.4 Medidas caracter´ısticas de una v.a. Las medidas caracter´ısticas asociadas a una v.a. reciben el mismo nombre que en el caso de variables estad´ısticas y se interpretan de id´entica forma. En este caso, para distinguir unas y otras, se representan con letras griegas. Vamos a definir a continuaci´on las principales. Podr´a observarse que en el caso discreto, las definiciones son totalmente an´alogas a las dadas para v. estad´ısticas, si en ´estas se cambia frecuencia relativa por probabilidad. Medida Media o Esperanza Varianza Desviaci´on t´ıpica
v.a.discretas µ ´o E(X) xi p(xi )
v.a. continuas −∞ xf (x) dx
P
R∞
σ2
i P
R∞
σ
i r P
qR ∞
(xi − µ)2 p(xi ) (xi − µ)2 p(xi )
i
−∞ (x
− µ)2 f (x) dx
−∞ (x
− µ)2 f (x) dx
50
Estad´ıstica
Observaci´ on 3 La media de una variable aleatoria se interpreta como el valor esperado a largo plazo, de la variable, de ah´ı su nombre de Esperanza. En cuanto a las restantes medidas, se definen: • Mediana: - en el caso discreto se calcula de igual forma que para variables estad´ısticas. - en el caso continuo, es el valor para el que F (x) = 21 . • Moda: - en el caso discreto, es el valor xi para el cu´al p toma el valor m´as alto. - en el caso continuo, coincide con los m´aximos absolutos de la funci´on de densidad. • Cuartiles: - en el caso discreto se calculan de igual forma que para variables estad´ısticas. - en el caso continuo son: Q1 el valor para el que F (x) = 14 y Q3 el valor para el que F (x) = 34 . • Rango intercuart´ılico: en ambos casos se define como la diferencia entre los cuartiles, Q3 − Q1 . • Coeficiente de variaci´on: en ambos casos se define como
σ µ.
Un resultado importante, que expresa la relaci´on existente entre la media de una variable aleatoria y su desviaci´on t´ıpica, es el teorema de Chebychev, cuyo enunciado es similar al visto en Estad´ıstica Descriptiva, y cuya demostraci´on, en el caso discreto es an´aloga y por tanto, no la repetiremos: Teorema 1 Teorema de Chebychev Sea X una v.a. con media µ finita y desviaci´ on t´ıpica σ finita. Entonces, si k es un n´ umero real con 1 k ≥ 1: p(µ − kσ ≤ X ≤ µ + kσ) > 1 − 2 k
3.5 Transformaciones de v.a. Igual que cuando trabajamos con variables estad´ısticas, a veces interesa realizar un cambio de escala o una traslaci´on u otro tipo de transformaci´on que simetrice la distribuci´on o la haga m´as f´acilmente manejable. Las principales transformaciones son las citadas en el tema 1. Definici´ on 7 Dada una variable aleatoria X, con soporte SX , llamaremos transformaci´ on de la variable a una aplicaci´ on h : SX 7−→ IR, no constante. La funci´ on Y=h(X), cuyos valores son las im´ agenes de h, es una nueva variable aleatoria, cuya distribuci´ on viene dada por la de la variable X, mediante la igualdad: p(Y ≤ y) = p(x/h(x) ≤ y). Su soporte es SY = h(SX ). Observaci´ on 4 Si X es una v.a. discreta, con soporte {x1 , x2 , . . . , xn , . . .}, la variable Y ser´ a discreta, con soporte SY = {h(x1 ), h(x2 ), . . .} y p(yi ) = p({xj /h(xj ) = yi }). Si X es una v.a. continua, con funci´ on de distribuci´ on F (x), si h es continua, la v.a. Y ser´ a continua, con funci´ on de distribuci´ on G(y) = p({x/h(x) ≤ y}). Por tanto, se observa que en el caso discreto obtener la ley de probabilidades de la nueva variable es sencillo. En el caso continuo, puede complicarse, dependiendo de la expresi´on de la funci´on h. En general, el c´alculo de las funciones de densidad y de distribuci´on de la v.a. Y se hace a trav´es de la definici´on de funci´on de distribuci´on y una vez obtenida ´esta, se obtiene la de densidad derivando.
51
Estad´ıstica
Medidas de la variable transformada. Proposici´ on 1 Sea X una v.a y h(x) una transformaci´ on. Si Y = h(X) es la variable transformada, entonces: µY = µY = σY2 = σY2 =
P
h(xi )p(xi )
Ri∞
−∞ h(x)f (x) dx
si X es discreta si X es continua
(h(xi ) − µY )2 p(xi ) i R∞ 2 −∞ (h(x) − µY ) f (x) dx
P
Las dem´as medidas se calculan seg´ un la definici´on.
si X es discreta si X es continua