Funciones Medibles e Integración

Cap´ıtulo 3 Funciones Medibles e Integraci´ on 3.1. Introducci´ on Sea X : Ω → Ω0 donde Ω0 es el recorrido de X, es decir, para todo ω 0 ∈ Ω0 exist

1 downloads 197 Views 240KB Size

Recommend Stories


Funciones exponencial, logarítmica e hiperbólicas
Funciones exponencial, logarítmica e hiperbólicas Introducción Tradicionalmente, el estudio de los logaritmos ha ido inevitablemente unido de las tab

Funciones. Definiciones. Dominio, rango e imagen
Funciones La idea de función aparece por todas partes: cada persona tiene una edad o un número de hijos o una cantidad de dinero en el bolsillo. No ne

Story Transcript

Cap´ıtulo 3

Funciones Medibles e Integraci´ on 3.1.

Introducci´ on

Sea X : Ω → Ω0 donde Ω0 es el recorrido de X, es decir, para todo ω 0 ∈ Ω0 existe ω ∈ Ω con X(ω) = ω 0 . X determina la funci´on X −1 : P(Ω0 ) → P(Ω) definida por

X −1 (A0 ) = {ω ∈ Ω : X(ω) ∈ A0 } = {X ∈ A0 }

para A0 ⊂ Ω0 . Propiedades. (i) X −1 (∅) = ∅, X −1 (Ω0 ) = Ω. (ii) X −1 (A0c ) = (X −1 (A0 ))c de modo que X −1 (Ω0 − A0 ) = Ω − X −1 (A0 ). (iii) X −1 (∪t∈T A0t ) = ∪t∈T X −1 (A0t ), X −1 (∩t∈T A0t ) = ∩t∈T X −1 (A0t ). Veamos la demostraci´on de (ii) ω ∈ X −1 (A0c ) ⇔ X(ω) ∈ A0c ⇔ X(ω) ∈ / A0 ⇔ ω ∈ / X −1 (A0 ) ⇔ ω ∈ (X −1 (A0 ))c . Si C 0 ⊂ P(Ω0 ) es una colecci´on de subconjuntos de Ω0 , definimos X −1 (C 0 ) = {X −1 (C 0 ) : C 0 ∈ C 0 }. Proposici´ on 3.1 Si F 0 es una σ-´ algebra de subconjuntos de Ω0 entonces X −1 (F 0 ) es una σ-´ algebra de subconjuntos de Ω. Demostraci´ on. Usando las propiedades de X −1 , (i) Ω0 ∈ F 0 ⇒ X −1 (Ω0 ) = Ω ∈ X −1 (F 0 ). (ii) A0 ∈ F 0 ⇒ (A0 )c ∈ F 0 . Por lo tanto si X −1 (A0 ) ∈ X −1 (F 0 ) tenemos (X −1 (A0 ))c = X −1 ((A0 )c ) ∈ X −1 (F 0 ). (iii) Si X −1 (A0n ) ∈ X −1 (F 0 ) entonces ∪n X −1 (A0n ) = X −1 (∪n A0n ) ∈ X −1 (F 0 ) porque ∪n A0n ∈ F 0 . ¥

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

32

Proposici´ on 3.2 Si C 0 es una colecci´ on de subconjuntos de Ω0 entonces X −1 (σ(C 0 )) = σ(X −1 (C 0 )). Demostraci´ on. Por la proposici´on 3.1, X −1 (σ(C 0 )) es una σ-´algebra y X −1 (C 0 ) ⊂ X −1 (σ(C 0 )) porque 0 0 C ⊂ σ(C ) y por minimalidad σ(X −1 (C 0 )) ⊂ X −1 (σ(C 0 )). Para ver el rec´ıproco definimos F 0 = {B 0 ∈ P(Ω0 ) : X −1 (B 0 ) ∈ σ(X −1 (C 0 ))}. Entonces F 0 es una σ-´algebra ya que (i) Ω0 ∈ F 0 porque X −1 (Ω0 ) = Ω ∈ σ(X −1 (C 0 )). (ii) Si A0 ∈ F 0 entonces (A0 )c ∈ F 0 ya que X −1 (A0c ) = (X −1 (A0 ))c ∈ σ(X −1 (C)) si X −1 (A0 ) ∈ σ(X −1 (C 0 )). (iii) Si Bn0 ∈ F 0 entonces X −1 (Bn0 ) ∈ σ(X −1 (C 0 )), por lo tanto X −1 (∪n Bn0 ) = ∪n X −1 (Bn0 ) ∈ σ(X −1 (C 0 )) Por definici´on, X −1 (F 0 ) ⊂ σ(X −1 (C 0 )). Adem´as C 0 ⊂ F 0 porque X −1 (C 0 ) ⊂ σ(X −1 (C 0 )). Como F 0 es una σ-´algebra, σ(C 0 ) ⊂ F 0 y por lo tanto X −1 (σ(C 0 )) ⊂ X −1 (F 0 ) ⊂ σ(X −1 (C 0 )). ¥

3.2.

Funciones Medibles

Definici´ on 3.1 Sean (Ω, F) y (Ω0 , F 0 ) dos espacios medibles. Una funci´on X : Ω → Ω0 es medible si −1 0 X (F ) ⊂ F. En este caso escribimos X ∈ F/F 0 o X ∈ F si esta claro cual es la σ-´algebra F 0 . Observaci´ on 3.1

1. En Teor´ıa de Probabilidad se dice que X es una variable aleatoria.

2. La medibilidad de X no implica que X(A) ∈ F 0 para todo A ∈ F . Por ejemplo, si F 0 = {∅, Ω0 } entonces toda funci´on X : Ω → Ω0 es medible, cualquiera sea F, pero si A ∈ F y X(A) es un subconjunto no vac´ıo y propio de Ω0 entonces X(A) ∈ / F 0. 3. Si (Ω, F) es un espacio medible y X : Ω → Rn , decimos que X es (Borel) medible si X es medible cuando tomamos la σ-´algebra de los borelianos Bn como σ-´algebra en Rn . Si Ω es un subconjunto de Rk o es Rk y decimos que X es Borel medible, suponemos que F = Bk . Ejemplo 3.1 Si A ∈ B la funci´on 1A (x) es una funci´on medible. Proposici´ on 3.3 Sea X : (Ω, F) → (Ω0 , F 0 ) y supongamos que F 0 = σ(C 0 ), entonces X es medible si y −1 s´ olo si X (C) ⊂ F.

3.2. FUNCIONES MEDIBLES

33

Demostraci´ on. X −1 (C) ⊂ F ⇒ σ(X −1 (C 0 )) ⊂ F y en consecuencia X −1 (σ(C 0 )) = X −1 (F 0 ) = σ(X −1 (C 0 )) ⊂ F. ¥ Ejemplo 3.2 Una funci´on continua X de Rk en Rn es medible porque si O es la clase de los conjuntos abiertos de Rn , entonces para todo A ∈ O se tiene que X −1 (A) es abierto y por lo tanto est´a en Bk . Ejemplo 3.3 Para mostrar que una funci´on X : Ω → R es Borel medible, es suficiente mostrar que {ω : X(ω) > c} ∈ F para todo real c. Porque si C es la clase de conjuntos (c, ∞), c ∈ R, entonces σ(C) = B. Los conjuntos {ω : X(ω) > c} se pueden reemplazar por {ω : X(ω) ≥ c}, {ω : X(ω) < c} o {ω : X(ω) ≤ c}. Definici´ on 3.2 Sea (Ω, F, P ) un espacio de probabilidad y X : (Ω, F) → (Ω0 , F 0 ) una variable aleatoria. Definimos la funci´on PX = P ◦ X −1 en F 0 por PX (A0 ) = P ◦ X −1 (A0 ) = P (X −1 (A0 )). PX es una probabilidad sobre (Ω0 , F 0 ) que se conoce como la medida inducida por, la distribuci´ on o la ley de X Para verificar que PX es una medida de probabilidad sobre F 0 observamos que 1. PX (Ω0 ) = P (Ω) = 1. 2. PX (A0 ) ≥ 0, ∀A0 ∈ F 0 . 3. Si (A0n )n≥1 son disjuntos 2 a 2 entonces PX (∪n A0n ) = P (∪n X −1 (A0n )) =

X

P (X −1 (A0n )) =

n

X

PX (A0n )

n

porque (X −1 (A0n ))n≥1 son disjuntos en F. Si X toma valores en R su distribuci´on PX es una probabilidad en R caracterizada por su funci´on de distribuci´on FX (x) = PX ((−∞, x]) = P (X ≤ x). Decimos que FX es la funci´on de distribuci´on de X. Si FX tiene una densidad fX decimos que es la densidad de X. Proposici´ on 3.4 La composici´ on de funciones medibles es medible. Demostraci´ on. Sean X : (E, E) → (F, F) y Y : (F, F) → (G, G) dos funciones medible. Sea A ∈ G entonces (Y ◦ X)−1 (A) = X −1 (Y −1 (A)). Como Y es medible, B = Y −1 (A) ∈ F. Como X es medible, X −1 (B) ∈ E.

¥

Proposici´ on 3.5 Si X, Y son funciones medibles, tambi´en lo son X + Y, X · Y, X ∨ Y, X ∧ Y y X/Y (Y 6= 0).

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

34 Demostraci´ on. Ejercicio.

Dada una funci´on X definimos X + y X − por X + (ω) = m´ax{0, X(ω)},

X − (ω) = − m´ın{0, X(ω)}.

entonces X(ω) = X + (ω) − X − (ω) y |X(ω)| = X + (ω) + X − (ω) y ambas funciones X + y X − son nonegativas. Corolario 3.1 Las funciones X + , X − y |X| son medibles. Demostraci´ on. Ejercicio. Corolario 3.2 Si X = (X1 , . . . , Xk ) es un vector aleatorio y g : Rk → R es medible, entonces g(X) es medible. En particular, si g es continua entonces es medible y el resultado vale. Demostraci´ on. Ejercicio. Ejemplos 3.4 k X i=1

xi ,

k 1X xi , k i=1

sup xi ,

1≤i≤k

k Y

xi ,

i=1

k X

x2i

i=1

k

son todas funciones continuas de R en R. Otro ejemplo interesante es la proyecci´ on πi : Rk → R definida por πi (x1 , . . . , xk ) = xi . πi es continua y si X = (X1 , . . . , Xk ) es un vector aleatorio entonces πi (X) = Xi es una variable aleatoria. Proposici´ on 3.6 X = (X1 , . . . , Xk ) es un vector aleatorio si y s´ olo si Xi es una variable aleatoria para i = 1, . . . , k. Demostraci´ on. El ejemplo anterior muestra que la condici´on es necesaria. Para el rec´ıproco comenzamos con Bk = σ(Sk ) donde Sk es la clase de los rect´angulos abiertos en Rk . Sean X1 , . . . , Xk variables aleatorias y B = I1 × · · · × Ik un rect´angulo de lados I1 , . . . , Ik . Entonces X

−1

(B) =

k \

Xi−1 (Ii ).

i=1

Como cada Xi es una variable aleatoria, Xi−1 (Ii ) ∈ Bk , de modo que X −1 (B) ∈ Bk y X −1 (Sk ) ⊂ Bk . En consecuencia X −1 es medible. ¥

Proposici´ on 3.7 X = (X1 , X2 , . . . ) es una sucesi´ on aleatoria si y s´ olo si para cada i ≥ 1 la i-´esima componente Xi es una v.a. Adem´ as, X es una sucesi´ on aleatoria si y s´ olo si (X1 , . . . , Xk ) es un vector aleatorio para todo k. Demostraci´ on. Ejercicio. Proposici´ on 3.8 Sean X1 , X2 , . . . funciones medibles definidas sobre (Ω, F), entonces

´ 3.3. σ-ALGEBRAS GENERADAS POR FUNCIONES

35

(i) sup Xn , ´ınf Xn , l´ım sup Xn , l´ım inf Xn son funciones medibles. (ii) Si Xn (ω) → X(ω) para todo ω ∈ Ω, X es una funci´ on medible. (iii) El conjunto en el cual la sucesi´ on (Xn ) converge es medible. Demostraci´ on. (i) {Xn ≤ α} ∈ F porque Xn es medible. Por lo tanto {supn Xn ≤ α} = ∩n {Xn ≤ α} est´a en F, para todo α y en consecuencia supn Xn es medible. De manera similar {´ınf n Xn ≤ α} = ∪n {Xn ≤ α} ∈ F e ´ınf n Xn es medible. Como consecuencia l´ım inf Xn y l´ım supn Xn son medibles. (ii) Es consecuencia de (i) porque l´ım Xn = l´ım supn Xn = l´ım inf Xn . (iii) Tenemos {ω : l´ım Xn (ω) existe }c = {ω : l´ım inf Xn (ω) < l´ım sup Xn (ω)} n [ = {l´ım inf Xn < r < l´ım sup Xn } r∈Q

=

[

{[l´ım inf Xn < r] ∩ [l´ım sup Xn ≤ r]c } ∈ B.

r∈Q

Observaci´ on 3.2 Observamos que la clase de las funciones medibles no es cerrada si la operaciones anteriores se realizan una cantidad no-numerable de veces. Es decir si A no es numerable y fα : Ω → R es medible para cada α ∈ A, no es necesariamente cierto que f (ω) = sup fα (ω) α∈A

sea medible. Por ejemplo, si A ⊂ [0, 1] es un conjunto no medible y ponemos ( 1 si ω = α fα (ω) = 0 si ω = 6 α entonces para cada α ∈ A, fα es M-medible pero sup fα (ω) = 1A (ω)

α∈A

no es medible.

3.3.

´ σ-Algebras Generadas por Funciones

Definici´ on 3.3 Sea X : (Ω, F) → (R, B) una variable aleatoria. La σ-´algebra generada por X, σ(X), se define como σ(X) = X −1 (B). Equivalentemente, σ(X) = {{X ∈ A}, A ∈ B}. En general, si X : (Ω, F) → (Ω0 , F 0 ) definimos σ(X) = X −1 (F). Si G ⊂ F es una sub-σ-´algebra de F decimos que X es medible respecto a G si σ(X) ⊂ G. Si para cada t ∈ T tenemos Xt : (Ω, F) → (Ω0 , F 0 ) definimos σ(Xt , t ∈ T ) = σ(∪t∈T σ(Xt )) la menor σ-´algebra que contiene a todas las σ(Xt ).

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

36

Ejemplos 3.5 1. Si X(ω) = 32 para todo ω entonces σ(X) = {{X ∈ B}, B ∈ B} = σ(∅, Ω} = {∅, Ω} 2. Sea X = 1A para alg´ un A ∈ B. X toma valores en {0, 1} y X −1 ({0}) = Ac ,

X −1 ({1}) = A,

y por lo tanto σ(X) = {∅, Ω, A, Ac }. Definici´ on 3.4 Una funci´on es simple si es medible y toma un n´ umero finito de valores. Si X toma valores a1 , . . . ak , definimos Ai = X −1 ({ai }) = {X = ai }. Entonces {Ai , i = 1, . . . , k} es una partici´on de Ω y podemos representar a X como X=

k X

a i 1 Ai

i=1

y σ(X) = σ(A1 , . . . , Ak ) = {∪i∈I Ai : I ⊂ {i, . . . .k}}. Proposici´ on 3.9 Sea X una funci´ on medible y C una clase de subconjuntos de R tales que σ(C) = B. Entonces σ(X) = σ({X ∈ B} : B ∈ C) Demostraci´ on. σ({X ∈ B} : B ∈ C} = σ(X −1 (B), B ∈ C} = σ(X −1 (C)) = X −1 (σ(C)) = X −1 (B) = σ(X). ¥ El siguiente teorema es fundamental para la definici´on de la integral de Lebesgue. Teorema 3.1 (de Aproximaci´ on) Dada una funci´ on medible y no negativa X : Ω → R+ , existe una sucesi´ on creciente de funciones simples no negativas Xn : Ω → R+ tales que Xn ↑ X. Demostraci´ on. Para todo entero positivo n definimos p−1 p ≤ X(ω) < n }, p = 1, . . . , 22n 2n 2 22n = Ω − ∪p=1 Qp,n = {ω : X(ω) ≥ 2n }

Qp,n = {ω : Q0,n

Entonces, como X es F-medible, Qp,n ∈ F y los conjuntos Qp,n , p = 0, 1, . . . , 22n forman una partici´on de Ω. Definimos ( p−1 para ω ∈ Qp,n , p = 1, 2, . . . , 22n n Xn (ω) = 2n 2 para ω ∈ Q0,n . Esta funci´on es simple y tenemos que 0 ≤ Xn ≤ X.

3.4. INTEGRALES

37

Si ω ∈ Qp,n entonces o bien ω ∈ Q2p−1,n+1 o ω ∈ Q2p,n+1 y en consecuencia Xn (ω) = Xn+1 (ω)

o

Xn (ω) +

1 = Xn+1 (ω). 2n+1

Adem´as, si ω ∈ Q0,n entonces Xn (ω) = 2n ≤ X(ω), y en consecuencia ω ∈ Q0,n+1 o ω ∈ Qp,n+1 para alg´ un p ≥ 22n+1 + 1. En cualquier caso Xn+1 (ω) ≥ Xn (ω). Por lo tanto para todo entero n Xn (ω) ≤ Xn+1 (ω)

para todo ω ∈ Ω,

y la sucesi´on de funciones simples (Xn ) es creciente. Si X(ω) es finita, entonces para 2n > X(ω) tenemos que 0 ≤ X(ω) − Xn (ω) < 2−n y en consecuencia Xn (ω) → X(ω) cuando n → ∞. Por otro lado, si X(ω) = ∞ entonces para todo n, Xn (ω) = 2n , y de nuevo tenemos que Xn (ω) → X(ω) cuando n → ∞. ¥

3.4. 3.4.1.

Integrales Funciones Simples No Negativas

Si X(ω) =

Pn

i=1 ci 1Ai (ω)

con ci ≥ 0, i = 1, . . . , n, definimos Z X dµ =

n X

ci µ(Ai ).

i=1

Esta suma siempre est´a definida, aunque su valor puede ser +∞, ya que todos los t´erminos son nonegativos, y se conoce como la integral de X respecto a µ, el valor esperado o la esperanza de X. Tomamos la convenci´on de que si xi = 0 y µ(Ai ) = ∞ entonces ci µ(Ai ) = 0. Como la representaci´on de una funci´on simple no es u ´nica, debemos verificar que la definici´on es independiente de la representaci´on que usemos. Supongamos que n m X X X(ω) = ci 1Ai (ω) = dj 1Bj (ω), i=1

j=1

como ambas colecciones de conjuntos son particiones de Ω tenemos que µ(Ai ) =

m X

µ(Ai ∩ Bj )

y

µ(Bj ) =

n X

j=1

µ(Ai ∩ Bj ).

i=1

Adem´as, si Ai ∩ Bj no es vac´ıo, tiene al menos un elemento ω y X(ω) = ci = dj . Por lo tanto n X i=1

ci µ(Ai ) =

n X m X

ci µ(Ai ∩ Bj ) =

i=1 j=1

n X m X

dj µ(Ai ∩ Bj ) =

i=1 j=1

j=1

Si tenemos dos funciones simples no-negativas X(ω) =

n X i=1

ci 1Ai (ω),

Y (ω) =

m X

m X j=1

dj 1Bj (ω),

dj µ(Bj ).

(3.1)

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

38

podemos usar las representaciones X=

n X m X

ci 1Ai ∩Bj (ω),

Y =

i=1 j=1

n m X X

dj 1Ai ∩Bj (ω),

j=1 i=1

en t´erminos de la partici´on Ai ∩ Bj . Ahora la funci´on simple X + Y tiene la representaci´on X +Y =

n X m X (ci + dj )1Ai ∩Bj i=1 j=1

y Z (X + Y ) dµ =

n X m X (ci + dj )µ(Ai ∩ Bj ) i=1 j=1

= =

n X m X

ci µ(Ai ∩ Bj ) +

i=1 j=1 n X

m X

i=1

j=1

X dµ +

dj µ(Ai ∩ Bj )

i=1 j=1

ci µ(Ai ) +

Z =

n X m X

Z

dj µ(Bj )

Y dµ

de modo que la integral de funciones simples no-negativas es aditiva. Es inmediato adem´as que si α ≥ 0, β ≥ 0 y X, Y son funciones simples no-negativas entonces Z Z Z (αX + βY ) dµ = α X dµ + β Y dµ de modo que la integraci´on es lineal en la clase de las funciones simples no-negativas. Tambi´en es f´acil R R ver que si X, Y son funciones simples y X ≥ Y entonces X dµ ≥ Y dµ.

3.4.2.

Funciones Medibles No-Negativas

Dada una funci´on medible no-negativa X : Ω → R+ , sabemos R que existe una sucesi´on creciente de funciones simples no-negativas Xn tales que Xn ↑ X. La integral Xn dµ est´a definida para todo n y es creciente, por lo tanto tiene un l´ımite, que puede ser +∞. Definimos Z Z X dµ = l´ım Xn dµ. n→∞

Tenemos que verificar que esta definici´on no depende de la sucesi´on (Xn ) de funciones simples aproximantes. Proposici´ on 3.10 Sea (Xn ) una sucesi´ on creciente de funciones simples no-negativas y X = l´ımn Xn ≥ Y donde Y es simple y no-negativa. Entonces Z Z l´ım Xn dµ ≥ Y dµ. (3.2) n→∞

R Pk Demostraci´ on. Sea Y = i=1 ci 1Ei . Si Y dµ = ∞, para alg´ un entero i, 1 ≤ i ≤ k, tal que ci > 0, µ(Ei ) = +∞. Entonces para cualquier ε fijo con 0 < ε < ci , definimos los conjuntos An = {ω : Xn (ω) + ε > Y (ω)}

(3.3)

3.4. INTEGRALES

39

La sucesi´on de conjuntos An ∩ Ei , n ≥ 1, es mon´otona creciente y converge a Ei , y por lo tanto µ(An ∩ Ei ) → ∞ cuando n → ∞. Por otro lado Z Z Xn dµ ≥ Xn 1An ∩Ei dµ ≥ (ci − ε)µ(An ∩ Ei ) → ∞ (n → ∞). Por lo tanto (3.2) vale si

R

Y dµ = ∞. Supongamos ahora que esta integral es convergente y sea A = {ω : Y (ω) > 0} = ∪i:ci >0 Ei .

Como Y es simple, c = m´ınci >0 ci > 0 y µ(A) < ∞. Supongamos que ε > 0 y definimos An de nuevo por (3.3). Entonces Z Z Z Xn dµ ≥ Xn 1An ∩A dµ ≥ (Y − ε)1An ∩A dµ Z Z = Y 1An ∩A dµ − εµ(An ∩ A) ≥ Y 1An dµ − εµ(A). Como µ(An ∩ Ei ) → µ(Ei ) para cada i, podemos evaluar las integrales como sumas finitas y encontrar un entero n0 = n0 (ε) tal que Z Z Xn dµ ≥ Y dµ − ε − εµ(A) para n ≥ n0 , y hemos establecido (3.2) tambi´en en el caso

R

Y dµ < ∞.

¥

Veamos ahora que la definici´on de la integral no depende de la sucesi´on aproximante. Supongamos que tenemos dos sucesiones crecientes de funciones simples (Xn ) y (Ym ) que convergen a la funci´on X. Para cada m fijo tenemos X = l´ım Xn ≥ Ym , n

y por la proposici´on anterior,

Z l´ım n

Haciendo ahora m → ∞,

Z Xn dµ ≥

Z l´ım n

Ym dµ. Z

Xn dµ ≥ l´ım m

Ym dµ.

Un argumento similar demuestra que la desigualdad en sentido contrario tambi´en vale y por lo tanto Z Z l´ım Xn dµ = l´ım Ym dµ. n

m

Por lo tanto la integral est´a bien definida para funciones medibles no-negativas. Como consecuencia de la linealidad de la integral para funciones simples, tenemos que si α ≥ 0, β ≥ 0 entonces Z Z Z (αX + βY ) dµ = α X dµ + β Y dµ. R De acuerdo a nuestra definici´on, si X ≥ 0 es medible, X dµ puede R ser finita o +∞. Decimos que una funci´on medible X ≥ 0 es integrable con respecto a la medida µ si X dµ < ∞. Hay dos razones por las cuales una R funci´on de este tipo puede no ser integrable. O bien existe una funci´on simple Y ≤ X para la cual Y dµ = ∞, R lo que implica la existencia de un c > 0 para el cual µ{ω : X(ω) > c} = +∞, o bien es posible que Y dµ < ∞ para todas las funciones simples tales que Y ≤ X (lo que implica que µ{ω : X(ω) R > c} < ∞, para todo c > 0) pero, para cualquier sucesi´on Yn de funciones simples que converja a X, Yn dµ → +∞ cuando n → ∞.

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

40

3.4.3.

Funciones Medibles Integrables.

Sabemos que si X : Ω → R∗ es medible, tambi´en lo son X + , X − y tenemos X = X + − X − . Si ambas funciones X + y X − son integrables, decimos que X es integrable y definimos Z Z Z + X dµ = X dµ − X − dµ. Usamos la notaci´on L1 (Ω, F, µ) o L1 (µ) para la clase de funciones integrables y la notaci´on Z Z Z X(ω) µ(dω) = X(ω) dµ(ω) = X dµ para la integral. Si (Ω, F, P ) es un espacio de probabilidad y X : Ω → R es una variable aleatoria integrable llamamos esperanza a su integral y escribimos Z E(X) = X(ω) dP (ω).

3.4.4.

Varianza y Covarianza

Sea X : Ω → R una variable aleatoria y supongamos que X 2 ∈ L1 , que escribimos como X ∈ L2 . Definimos la varianza de X como Var(X) = E(X − E(X))2 2 y tambi´en usamos la notaci´on σX para ella. Por la linealidad de la esperanza tenemos

Var(X) = E(X 2 ) − (E(X))2 . p La ra´ız cuadrada de la varianza σX = Var(X) se conoce como la desviaci´ on t´ıpica de la variable aleatoria. Si X, Y ∈ L2 definimos Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))], y de nuevo por linealidad Cov(X, Y ) = E(XY ) − E(X) E(Y ). Observamos que si X = Y , entonces Cov(X, Y ) = Var(X). La covarianza es una medida de la dependencia lineal entre dos variables aleatorias, pero su valor depende de las unidades en las cuales expresemos las variables. Para obtener una medida normalizada de la dependencia lineal entre dos variables, dividimos la covarianza entre las desviaciones t´ıpicas de las variables. Este par´ametro se conoce como la correlaci´ on entre X e Y : ρ(X, Y ) =

Cov(X, Y ) σX σY

Si Cov(X, Y ) = 0 decimos que X e Y no est´an correlacionadas. Demostraremos m´as adelante que |ρ(X, Y )| ≤ 1. La covarianza es una funci´on bilineal: Si X1 , . . . , Xk y Y1 , . . . , Ym son variables aleatorias en L2 , entonces para cualesquiera constantes a1 , . . . , ak y b1 , . . . , bm Cov

k ³X i=1

ai Xi ,

m X j=1

´ bj Y j =

k X m X i=1 j=1

ai bj Cov(Xi , Yj ).

(3.4)

3.5. PROPIEDADES DE LA INTEGRAL

41

Para ver esto, podemos suponer, sin p´erdida de generalidad, que E(Xi ) = E(Yj ) = 0 para i = 1, . . . , k; j = 1, . . . , m. Entonces Cov

k ³X

ai Xi ,

i=1

m X

k m ´ ³X ´ X bj Yj = E ai Xi bj Yj

j=1

i=1

=

k X m X

j=1

ai bj E(Xi Yj )

i=1 j=1

=

k X m X

ai bj Cov(Xi , Yj )

i=1 j=1

Un caso especial de esta f´ormula se usa para calcular la varianza de la suma de variables X1 , . . . , Xn en L2 . Tenemos n n n n X n ³X ´ ³X ´ X X Var Xi = Cov Xi , Xj = Cov(Xi , Xj ). i=1

i=1

j=1

i=1 j=1

Dividimos el conjunto de ´ındices en los casos i = j e i 6= j y obtenemos Var

n ³X

n ´ X Xi = Cov(Xi , Xi ) + 2

i=1

i=1

=

n X

Cov(Xi , Xj )

1≤i 0 entonces (cX)+ = cX + ,

(cX)− = cX − ,

y el resultado es v´alido porque ya lo demostramos para funciones medibles no-negativas. De manera similar, si c < 0 (cX)+ = −cX − , (cX)− = −cX + , Z Z Z Z Z Z cX dµ = (cX)+ dµ − (cX)− dµ = (−c) X − dµ + c X + dµ = c X dµ. (6) La primera afirmaci´on es cierta por la definici´on. Si X ≥ Y , entonces X = Y +(X −Y ) y (X −Y ) ≥ 0. Por (3) tenemos Z Z Z Z X dµ = Y dµ + (X − Y ) dµ ≥ Y dµ. (7) es consecuencia de (6) ya que X1A ≤ X1B . (8) Si{ω : X(ω) > 0} tiene medida positiva, por la continuidad de la medida µ existe un entero n tal que, si A = {ω : X(ω) > 1/n}, se tiene que µ(A) > 0. Pero n−1 1A ≤ X1A ≤ X, de modo que Z Z 1 1 X dµ ≥ 1A dµ = µ(A) > 0. n n R Por lo tanto, si X ≥ 0 y X dµ = 0, necesariamente µ{ω : X(ω) > 0} = 0. (9) Si X = Y c.s. entonces X + = Y + , X − = Y − c.s. En la construcci´on de la sucesi´on aproximante en el teorema 3.1, los conjuntos Qp,s para las funciones X + y Y + tendr´an todos la misma medida. Por lo tanto hay funciones simples Xn → X + , Yn → Y + tales que Z Z Xn dµ = Yn dµ, n = 1, 2, . . . R R R R y por lo tanto se tiene que X + dµ = Y + dµ. De manera similar X − dµ = Y − dµ. R + − + (10) R −Si |Z| ≤ X entonces 0 ≤ Z ≤ X, 0 ≤ Z ≤ X. Usando (6) tenemos que tanto Z dµ como Z dµ son finitos y por lo tanto Z es integrable. ¥

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

44

Ejemplo 3.6 Sea Ω = [0, 1] y λ la medida de Lebesgue. Sea X(ω) = 1Q∩[0,1] . Sabemos que λ(Q) = 0 de modo que λ(X = 0) = 1 = λ([0, 1] − Q). Por lo tanto

Z

Z X dµ =

0 dµ = 0.

Corolario 3.3 Si X : Ω → R∗ es acotada, medible y se anula fuera de un conjunto E ∈ F con µ(E) < ∞, entonces X es integrable con respecto a µ. Demostraci´ on. Si |X| ≤ K, entonces la funci´on simple K1E es integrable y la integrabilidad de X sigue ahora de (9). ¥ Observaci´ on 3.3 Si F es completa respecto a µ, entonces podemos modificar (9) de la siguiente manera: ∗ ∗ Si X : Ω R R → R es integrable y Y : Ω → R es tal que X = Y c.s., entonces Y es integrable y X dµ = Y dµ. Hay un rec´ıproco de la afirmaci´on anterior: Si X y Y son integrables y Z Z X dµ = Y dµ para todo E ∈ F, E

E

entonces X = Y c.s. Para ver esto supongamos que es falso, de modo que µ{x : X(ω) 6= Y (ω)} > 0. Entonces al menos uno de los conjuntos {x : X(ω) > Y (ω)}, {x : X(ω) < Y (ω)} tiene medida positiva. Supongamos que es el primero, por la continuidad de la medida existe un entero n tal que En = {ω : X(ω) ≥ Y (ω) + Pero entonces

Z

1 }, n

Z X dµ −

En

Y dµ > En

µ(En ) > 0.

1 µ(En ) > 0 n

lo que es una contradicci´on y por lo tanto demuestra el resultado.

3.5.1.

Desigualdades de Markov y Chebychev

Proposici´ on 3.11 (Desigualdad de Markov) Sea X ∈ L1 (Ω, F, P ) una variable aleatoria. Para cualquier λ > 0, P (|X| ≥ λ) ≤ E(|X|)/λ. Demostraci´ on. Observamos que 1{ |X| ≥1} ≤ λ

|X| |X| 1 |X| . ≤ λ { λ ≥1} λ

Tomando esperanza se obtiene el resultado.

¥

Corolario 3.4 (Desigualdad de Chebychev) Si X ∈ L2 (Ω) es una variable aleatoria, P (|X − E(X)| ≥ λ) ≤ Var(X)/λ2 . Demostraci´ on. Usando la desigualdad de Markov P (|X − E(X)| ≥ λ) = P (|X − E(X)|2 ≥ λ2 ) ≤ E(X − E(X))2 /λ2 = Var(X)/λ2 . ¥

3.6. LAS INTEGRALES DE LEBESGUE Y DE LEBESGUE-STIELTJES

3.6.

45

Las Integrales de Lebesgue y de Lebesgue-Stieltjes

Hemos definido la integral sobre un espacio de medida abstracto (Ω, F, µ) aunque hist´oricamente se consider´ o primero el espacio (R, M, λ) donde λ denota la medida de Lebesgue definida sobre los conjuntos Lebesgue-medibles M. R R Si E ∈ M y f es Lebesgue-medible es usual escribir E f (x) dx en lugar de E f dλ. En particular si Rb E es un intervalo con extremos a, b, escribimos a f (x) dx. Observamos que como la medida de Lebesgue de un punto es cero, no importa si incluimos los extremos en elRintervalo Ro no. En particular, a puede ser R∞ −∞ y b puede ser +∞ de modo que −∞ f (x) dx quiere decir R f dλ = f dλ. Es importante observar que la integral sobre un intervalo infinito se define directamente, ya que un intervalo de este tipo es medible, y no como l´ımite de integrales sobre intervalo finitos. Usar la medida de Lebesgue-Stieltjes que se obtiene a partir de una funci´on de Stieltjes F en lugar de usar la medida de Lebesgue es equivalente a trabajar en el espacio de medida (R, M(F ), µF ), donde µF es la medida de Lebesgue-Stieltjes que definimos en el cap´ıtulo anterior y M(F ) es la σ-´algebra de los conjuntos medibles respecto a µ∗F . Usamos las notaciones Z Z f (x) dF (x) o f (x) dµF (x). E

E

En este caso la medida de un punto puede ser distinta de cero y por lo tanto al integrar sobre un intervalo es necesario especificar si se incluyen los extremos o no. Por esto no usamos la notaci´on Rb f (x)dF (x) a menos que sepamos que F es continua. a Como las σ-´algebras de conjuntos medibles son completas con respecto a las medidas de Lebesgue o de Lebesgue-Stieltjes, vemos que si f : R → R∗ es integrable y f = g c.s., entonces g : R → R∗ tambi´en es integrable. Caso Particular Llamamos δx a la medida de Dirac en el punto x: ( 1 si x ∈ A, δx (A) = 0 si x ∈ / A. δ es una medida de probabilidad definida en P(R). Si xn , n ≥ 1 es una sucesi´on de n´ umeros reales y pn , n ≥ 1 es una sucesi´on de n´ umeros reales positivos entonces µ(A) =

∞ X

pn δxn (A)

n=1

define una medida de Lebesgue-Stieltjes concentrada en el conjunto numerable {xn , n ≥ 1}. Si P la medida es finita y si pn = 1 es una medida de probabilidad. Si f : R → R es una funci´on cualquiera entonces Z ∞ X f dµ = pn f (xn ).

P

pn < ∞,

n=1

P En el caso particular pn = 1 para todo n y f (x) = x, obtenemos la serie xn , de modo que la teor´ıa de series absolutamente convergentes de n´ umeros reales es un caso particular de la integral de RiemannStieltjes.

3.7.

Integrales y L´ımites

Ahora podemos considerar los teoremas sobre la continuidad del operador de integraci´on.

46

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

Teorema 3.3 (Teorema de Convergencia Mon´ otona) Sea Xn : Ω → R+ , n ≥ 1 una sucesi´ on creciente de funciones medibles no-negativas con Xn (ω) → X(ω) para todo ω ∈ Ω, entonces Z Z l´ım Xn dµ = X dµ, n→∞

R R es decir, si X es integrable, las integrales Xn dµ converge a X dµ, mientras que si X no es integrable R o bien Xn es integrable para todo R n y Xn dµ → +∞ cuando n → ∞, o existe un entero N tal que XN no es integrable de modo que Xn dµ = +∞ para n ≥ N . Demostraci´ on. Para cada n = 1, 2, . . . escogemos una sucesi´on creciente Xn,k , k ≥ 1 de funciones simples no-negativas que converge a Xn y definimos Yk = m´axn≤k Xn,k . Entonces (Yk ) es una sucesi´on no-decreciente de funciones simples no-negativas y Y = l´ımk Yk es una funci´on medible no-negativa. Pero Xn,k ≤ Yk ≤ Xk ≤ X

para n ≤ k

(3.5)

de modo que Xn ≤ Y ≤ X, y si hacemos n → ∞ vemos que X = Y . Usando la propiedad (6) del teorema 3.2 y (3.5) obtenemos Z Z Z Xn,k dµ ≤

Yk dµ ≤

Xk dµ

para n ≤ k.

Para n fijo, hacemos k → ∞. Por la definici´on de la integral Z Z Z Xn dµ ≤ Y dµ ≤ l´ım Xk dµ. k→∞

Haciendo ahora n → ∞ obtenemos Z l´ım

n→∞

Z Xn dµ ≤

Z Y dµ ≤ l´ım

k→∞

Xk dµ.

Como los dos extremos de la desigualdad son iguales, tenemos Z Z Z l´ım Xn dµ = Y dµ = X dµ. n→∞

¥

Corolario 3.5 Sea Xn : Ω → R, n ≥ 1 una sucesi´ on de funciones medibles tales que Xn ↑ X y R X1 dµ > −∞. Entonces Z Z Xn dµ ↑ X dµ. Demostraci´ on. Supongamos que X ≤ 0. Sea Yn = −Xn ↓ −X = Y . Entonces para todo n, Z Z 0 ≤ Y dµ ≤ Yn dµ < +∞. Pero 0 ≤ Y1 − Yn ↑ Y1 − Y , y por el teorema anterior Z Z (Y1 − Yn ) dµ ↑ (Y1 − Y ) dµ < +∞. R Como estas integrales son finitas, podemos restarlas de Y1 dµ y obtenemos Z Z Z Z Yn dµ ↓ Y dµ ⇒ Xn dµ ↑ X dµ.

3.7. INTEGRALES Y L´ IMITES

47

R En el caso general tenemos Xn+ ↑ X + y Xn− ↓ X − con X − dµ < +∞, y por lo anterior tenemos Z Z Z Z Xn+ dµ ↑ X + dµ, +∞ > Xn− dµ ↓ X − dµ ≥ 0. En consecuencia

Z

Z Xn dµ ↑

X dµ ¥

Corolario 3.6 Si Xn ≥ 0, n ≥ 1 son funciones medibles no-negativas, entonces Z

∞ ¡X

XZ ¢ Xn dµ = Xn dµ

n=1

n=1

Demostraci´ on. Tenemos Z

∞ ¡X

¢ Xn dµ =

Z

¡

l´ım

k→∞

n=1

= l´ım

k→∞

k X

¢ Xn dµ = l´ım

k→∞

n=1

k Z X n=1

Z

Xn dµ =

∞ Z X

k ¡X

¢ Xn dµ

n=1

Xi dµ

n=1

¥

Corolario 3.7 Si X es integrable entonces, para A ∈ F, Z X dµ → 0 cuando µ(A) → 0. A

Demostraci´ on Definimos

( X Xn = n

si |X| ≤ n, si |X| > n.

Entonces |Xn | es creciente y converge a |Xn | cuando n → ∞. Por el teorema 3.2 |X| es integrable y Z Z |Xn | dµ → |X| dµ cuando n → ∞. Dado ε > 0 escogemos N tal que Z Z 1 |X| dµ < |Xn | dµ + ε 2 para n ≥ N. Entonces si A ∈ F es tal que µ(A) < ε/2N , tenemos, por el teorema 3.2, Z Z ¯Z ¯ Z ¯ ¯ X dµ¯ ≤ |X| dµ = |XN | dµ + (|X| − |XN |) dµ ¯ A A A A Z 1 < ε + (|X| − |XN |) dµ < ε. 2 ¥

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

48

Teorema 3.4 (Fatou) Si (Xn ) es una sucesi´ on de funciones medibles que est´ a acotada inferiormente por una funci´ on integrable, entonces Z Z l´ım inf Xn dµ ≤ l´ım inf Xn dµ. n→∞

n→∞

Demostraci´ on. Como (Xn ) est´a acotada por debajo por una funci´on integrable Y podemos suponer, sin p´erdida de generalidad, que Xn ≥ 0 para todo n. Para Zn = Xn − Y ≥ 0 c.s. y Z Z Z Zn dµ = Xn dµ − Y dµ, l´ım inf Zn = l´ım inf Xn − Y c.s. Ponemos Yn = ´ınf k≥n Xk entonces Yn es una sucesi´on creciente de funciones medibles y l´ım Yn = l´ım inf Xn .

n→∞

n→∞

Como Xn ≥ Yn para todo n Z Z Z Z l´ım inf Xn dµ ≥ l´ım Yn dµ = l´ım Yn dµ = l´ım inf Xn dµ, n→∞

n→∞

n→∞

n→∞

por el teorema 3.3.

¥

Corolario 3.8 Si (Xn ) es una sucesi´ on de funciones medibles que est´ a acotada superiormente por una funci´ on integrable, entonces Z Z l´ım sup Xn dµ ≥ l´ım sup Xn dµ. n→∞

n→∞

Demostraci´ on. Esto se puede demostrar por un m´etodo similar al del teorema anterior, o puede deducirse del teorema anterior poniendo Yn = −Xn . ¥ Como consecuencia de los dos resultados anteriores, si (Xn ) es una sucesi´on de funciones medibles acotada superior e inferiormente por funciones integrables tenemos Z Z Z Z l´ım inf Xn dµ ≤ l´ım inf Xn dµ ≤ l´ım sup Xn dµ ≤ l´ım sup Xn dµ. n→∞

n→∞

n→∞

n→∞

Ejemplo 3.7 Consideremos el espacio de probabilidad ([0, 1], B, λ), donde λ es la medida de Lebesgue y definimos Xn = n2 1(0,1/n) . Para todo ω ∈ [0, 1] se tiene que 1(0,1/n) (ω) → 0, de modo que Xn → 0. Sin embargo E(Xn ) = n2

1 = n → ∞, n

y por lo tanto E(l´ım inf Xn ) = 0 < l´ım inf E(Xn ) = ∞ n→∞

n→∞

y E(l´ım sup Xn ) = 0 < l´ım sup E(Xn ) = ∞. n→∞

n→∞

3.7. INTEGRALES Y L´ IMITES

49

Teorema 3.5 (de Convergencia Dominada, Lebesgue) (i) Si Y : Ω → R+ es integrable, (Xn ) es una sucesi´ on de funciones medibles de Ω en R∗ tal que |Xn | ≤ Y para n ≥ 1, y Xn → X cuando n → ∞, entonces X es integrable y Z Z Xn dµ → X dµ cuando n → ∞. (ii) Supongamos que Y : Ω → R+ es integrable, −∞ ≤ a < b ≤ +∞, y para cada t ∈ (a, b), Xt es medible de Ω en R∗ . Entonces si |Xt | ≤ Y para todo t ∈ (a, b) y Xt → X cuando t → a+ o t → b− , entonces X es integrable y Z Z Xt dµ → X dµ. Demostraci´ on. (i) Primero probamos un caso especial con Xn ≥ 0 y Xn → 0 cuando n → ∞. En este caso podemos usar el teorema 3.4 y el corolario para obtener Z Z Z l´ım sup Xn dµ ≤ l´ım sup Xn dµ = 0 dµ = 0 Z Z Z = l´ım inf Xn dµ ≤ l´ım inf Xn dµ ≤ l´ım sup Xn dµ. Por lo tanto el l´ımite existe y vale 0. En el caso general ponemos Zn = |Xn − X|, entonces 0 ≤ Zn ≤ 2Y , 2Y es integrable y Zn es medible con Zn → 0 cuando n → ∞. Pero entonces Z ¯Z ¯ Z ¯ ¯ ¯ Xn dµ − X dµ¯ ≤ |Xn − X| dµ → 0 cuando n → ∞, y X es integrable por el teorema 3.2. (ii) Supongamos, por ejemplo, que Xt → X cuando t → a+ , entonces podemos aplicar la parte anterior del teorema a Xn = Xtn , donde (tn ) es una sucesi´on en (a, b) que converge a a. Como X = l´ım Xn , tenemos Z Z Xn dµ → X dµ. Pero el lado derecho es independiente de la sucesi´on (tn ), de modo que cuando t → a, t ∈ (a, b).

R

Xt dµ converge al l´ımite

R

X dµ ¥

Como consecuencia de los teoremas sobre l´ımites tenemos las siguiente propiedades Proposici´ on 3.12

1. Si X ≥ 0 y {An , n ≥ 1} es una sucesi´ on de eventos disjuntos Z Z ∞ X X dµ = X dµ. ∪n An

n=1

2. Si X ∈ L1 y {An , n ≥ 1} es una sucesi´ on mon´ otona de eventos con An → A entonces Z Z X dµ → X dµ An

(3.6)

An

(3.7)

A

Demostraci´ on. Para ver (1) tenemos Z Z Z X ∞ X dµ = X1∪n An dµ = X1An dµ ∪ n An

=

∞ Z X n

n

X1An dµ =

∞ Z X n

X dµ.

An

(2) es consecuencia directa del Teorema de Convergencia Mon´otona.

¥

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

50

Teorema 3.6 a) Si X, Y ∈ L2 (Ω, F, P ) entonces X · Y ∈ L1 (Ω, F, P ) y ¡ ¢1/2 | E(XY )| ≤ E(X 2 ) E(Y 2 )

(3.8)

(b) L2 ⊂ L1 y si X ∈ L2 entonces (E(X))2 ≤ E(X 2 ). (c) L2 es un espacio lineal: X, Y ∈ L2 , α, β ∈ R entonces αX + βY ∈ L2 . La desigualdad (3.8) se conoce como la desigualdad de Cauchy-Schwarz. Demostraci´ on. (a) Tenemos |XY | ≤ X 2 + Y 2 de modo que X, Y ∈ L2 ⇒ X · Y ∈ L1 . Para x ∈ R tenemos 0 ≤ E[(αX + Y )2 ] = α2 E[X 2 ] + 2α E[XY ] + E[Y 2 ] (3.9) el discriminante de la ecuaci´on cuadr´atica en α es ¡ ¢1/2 4[(E(XY ))2 − E(X 2 ) E(Y 2 )] y como la ecuaci´on siempre es no-negativa, (E(XY ))2 − E(X 2 ) E(Y 2 ) ≤ 0 (b) Sea X ∈ L2 , como X = X · 1 y 1 ∈ L2 con E(12 ) = 1 se obtiene el resultado por (a). (c) Sean X, Y ∈ L2 . Para α, β constantes (αX + βY )2 ≤ 2α2 X 2 + 2β 2 Y 2 ∈ L1 y por lo tanto αX + βY ∈ L2 y L2 es un espacio vectorial.

3.8.

¥

Cambio de Variables

Teorema 3.7 (Cambio de Variable) Sea X : (Ω, F) → (Ω0 , F 0 ) una funci´ on medible y sea µ una medida en F. Sea µX = µ ◦ X −1 la medida inducida por X en (Ω0 , F 0 ), f : (Ω0 , F 0 ) → (R∗ , B ∗ ) y A ∈ F 0 . Entonces Z Z f (X(ω)) dµ(ω) = f (ω 0 ) dµX (ω 0 ). (3.10) X −1 (A)

A

Esto quiere decir que si alguna de las integrales existe, tambi´en existe la otra y ambas son iguales. Demostraci´ on. Si f es la funci´on indicadora de un conjunto B, la ecuaci´on (3.10) dice que µ(X −1 (A) ∩ X −1 (B)) = µX (A ∩ B) que es cierta por la definici´on de µX . Si f es una funci´on simple no-negativa: f = Z f (X(ω)) dµ(ω) = X −1 (A)

=

n X i=1 n X

Zi=1

Pn 1

ci 1Bi , entonces

Z ci

X −1 (A)

1Bi (X(ω)) dµ(ω)

Z ci A

1Bi (ω 0 ) dµX (ω 0 )

f (ω 0 ) dµX (ω 0 )

= A

Si f es una funci´on medible no-negativa, sea f1 , f2 , . . . una sucesi´on creciente de funciones simples nonegativas que converge a f . Entonces, por lo que hemos probado, Z Z fn (X(ω)) dµ(ω) = fn (ω 0 ) dµX (ω 0 ) X −1 (A)

A

3.8. CAMBIO DE VARIABLES

51

y usando el Teorema de Convergencia Mon´otona obtenemos el resultado. Finalmente, si f = f + − f − esR cualquier funci´on medible, hemos probado R que el resultado es v´alido para f + y f − . Si, por ejemplo, X −1 (A) f + (X(ω)) dµ(ω) < ∞ entonces A f (ω 0 ) dµX (ω 0 ) < ∞, y en consecuencia si una de las integrales existe, tambi´en existe la otra y ambas valen lo mismo. ¥

Sea X una v.a. sobre el espacio de probabilidad (Ω, F, P ). Recordemos que la distribuci´on de X es la medida PX = P ◦ X −1 en (R, B) definida por PX (A) = P ◦ X −1 (A) = P (X ∈ A), para A ∈ B. La funci´on de distribuci´on de X es FX (x) = PX ((−∞, x]) = P (X ≤ x). El teorema de cambio de variables nos permite calcular la integral abstracta Z E(X) = X dP Ω

como

Z E(X) =

x dPX (x). R

que es una integral en R. Corolario 3.9 (i) Si X es una v.a. integrable entonces Z E(X) = x dPX (x) R

(ii) Sea X : (Ω, F) → (Ω0 , F 0 ) una variable aleatoria con distribuci´ on PX y sea g : (Ω0 , F 0 ) → (R+ , (R+ )) una funci´ on medible no-negativa. La esperanza de g(X) es Z Z E(g(X)) = g(X(ω)) dP (ω) = g(ω 0 ) dPX (ω 0 ). Ω0



Demostraci´ on. Para ver (i) basta observar que (Ω0 , F 0 ) = (R, B), f (x) = x, y A = Ω0 . (ii) es inmediato a partir del teorema de cambio de variable. ¥

3.8.1.

Densidades

Sea X : (Ω, F) → (Rk , Bk ) un vector aleatorio con distribuci´on PX . Decimos que X, PX o FX es absolutamente continua si existe una funci´on f : (Rk , Bk ) → (R+ , B(R+ )) tal que Z PX (A) = f (x) dx A

donde dx es la medida de Lebesgue. Proposici´ on 3.13 Sea g : (Rk , Bk ) → (R+ , B(R+ )) una funci´ on medible no-negativa. Sea X un vector aleatorio con f.d. F . Si F es absolutamente continua con densidad f , la esperanza de g(X) es Z E(g(X)) = g(x)f (x) dx. Rk

Demostraci´ on. Ejercicio.

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

52

3.9.

Comparaci´ on con la Integral de Riemann

Vimos en el ejemplo 3.6 que si f es el indicador del conjunto de racionales en [0, 1] entonces f no es integrable seg´ un Riemann pero si lo es seg´ un Lebesgue y su integral vale 0. En este caso existe otra funci´on g que satisface f = g c.s., que es integrable seg´ un Riemann y cuya integral vale lo mismo que la de f . Esta funci´on es g(x) = 0 para todo x ∈ [0, 1]. Veremos a continuaci´on un ejemplo de una funci´on que es integrable seg´ un Lebesgue pero no seg´ un Riemann, a pesar de ser acotada y estar definida en un intervalo acotado, y para la cual no existe ninguna funci´on Riemann integrable g con f = g c.s. Ejemplo 3.8 Comenzamos por construir un conjunto boreliano A ⊂ (0, 1] tal que 0 < λ(A) < 1 y tal que para cualquier subintervalo J de (0, 1] se tiene que λ(A ∩ J) > 0. Para ello sea {r1 , r2 , . . . } una enumeraci´on de los racionales en (0, 1). Sea ε > 0 dado y para cada n escogemos un intervalo In = (an , bn ) tal que rn ∈ In ⊂ (0, 1) y λ(In ) = bn − an < ε2−n . Ponemos A = ∪n≥1 In , entonces 0 < λ(A) < ε. Como A contiene a los racionales de (0, 1), es denso en este conjunto. Por lo tanto A es un conjunto abierto y denso con medida menor que ε. Si J es un subintervalo abierto de (0, 1) entonces J intersecta a alguno de los In y en consecuencia λ(A ∩ I) > 0. Si B = (0, 1) − A entonces 1 − ε < λ(B) < 1. El conjunto B no contiene ning´ un intervalo, de hecho es un conjunto nunca denso (Todo intervalo contiene un subintervalo que no contiene puntos de B). Sin embargo, su medida es casi 1. Tomamos ahora f = 1A y supongamos que g = f c.s. y que Jn es una descomposici´on de (0, 1] en subintervalos. Para ver que g no es integrable seg´ un Riemann basta demostrar que Jn contiene puntos xn , yn tales que X X g(xn )λ(Jn ) ≤ λ(A) < 1 = g(yn )λ(Jn ). (3.11) n

n

Si λ(Jn − A) = 0 escogemos xn en el conjunto Jn ∩ {f = g}, que es un conjunto de medida λ(Jn ) > 0. Entonces g(xn ) = f (xn ) ≤ 1. En el caso contrario, escogemos xn en P el conjunto (Jn − A) ∩ {f = g}, un 0 conjunto de medida λ(Jn − A) > 0. Entonces g(xn ) = f (xn ) = 0. Si denota la suma sobre los ´ındices n para los cuales λ(Jn − A) = 0 entonces la suma de la izquierda en (3.11) es X X X 0 0 0 g(xn )λ(Jn ) ≤ λ(Jn ) = λ(Jn ∩ A) ≤ λ(A). Para hallar los yn observamos que por la construcci´on de A, λ(Jn ∩ A ∩ {f = g}) = λ(Jn ∩ A) > 0. Por lo tanto para alg´ un yn ∈ Jn ∩A se tiene g(yn ) = f (yn ) = 1 y de aqui se obtiene la segunda desigualdad de (3.11). Rb R Usaremos la notaci´on a f (x) dx para la integral de Riemann de f en [a, b] y [a,b] f (x) dλ(x) para la integral de Lebesgue. Para la demostraci´on del pr´oximo teorema vamos a usar la siguiente definici´on para la integral de Riemann, que no es la usual, pero es sencillo demostrar que ambas son equivalentes. Para cualquier entero n dividimos I0 = (a, b] en 2n intervalos semiabiertos In,i = (an,i−1 , an,i ],

i = 1, 2, . . . , 2n .

Definimos mn,i = ´ınf{f (x) : x ∈ In,i }; ( mn,i si x ∈ In,i , gn (x) = 0 si x ∈ / I0 ;

Mn,i = sup{f (x) : x ∈ In,i } ( Mn,i si x ∈ In,i , hn (x) = 0 si x ∈ / I0 .

´ CON LA INTEGRAL DE RIEMANN 3.9. COMPARACION

53

Entonces para todo entero n y x ∈ I0 , gn (x) ≤ f (x) ≤ hn (x). (gn ) es una sucesi´on creciente de funciones simples mientras que (hn ) es decreciente. Si definimos g = l´ım gn ,

h = l´ım hn ,

n

n

entonces g ≤ f ≤ h. Adem´as tenemos Z

Z

2n

Z

Z

2n

b−aX g(x) dλ(x) = l´ım gn (x) dλ(x) = l´ım n mn,i := l´ım sn , n n n 2 i=1 (a,b] (a,b]

b−aX h(x) dλ(x) = l´ım hn (x) dλ(x) = l´ım n Mn,i := l´ım Sn . n n n 2 i=1 (a,b] (a,b]

Decimos que f es integrable seg´ un Riemann en [a, b] si y s´olo si l´ım sn = l´ım Sn n

y en este caso el l´ımite com´ un es

Rb a

n

f (x) dx.

Teorema 3.8 Una funci´ on acotada f : [a, b] → R es integrable seg´ un Riemann si y s´ olo si el conjunto de puntos E ⊂ [a, b] en los cuales X es discontinua tiene medida 0: λ(E) = 0. Cualquier funci´ on f : [a, b] → R que sea integrable seg´ un Riemann, es integrable seg´ un Lebesgue y su integral tiene el mismo valor. Demostraci´ on. Si f es continua en x ∈ (a, b) entonces g(x) = h(x). Rec´ıprocamente si g(x) = h(x) y x no est´a en D, donde D es el conjunto numerable de extremos de los intervalos In,i , entonces f es continua en x. Rb Si a f (x) dx existe, Z

Z

[a,b]

Z

b

g(x) dλ(x) =

f (x) dx = a

h(x) dλ(x). [a,b]

Por el teorema 3.2 (8) y teniendo en cuenta que g ≤ f ≤ h, tenemos que g = h c.s. Como el conjunto E de puntos donde f es discontinua est´a contenido en D ∪ {x : g(x) 6= h(x)}, tenemos que λ(E) = 0. Adem´as, como la medida de Lebesgue es completa, f es M-medible y por las propiedades de la integral de Lebesgue, Z Z Z b f (x) dλ(x) = g(x) dλ(x) = f (x) dx. [a,b]

[a,b]

a

Rec´ıprocamente si el conjunto E satisface λ(E) = 0, esto implica que g(x) = h(x) c.s., y por las propiedades de la integral obtenemos Z Z g(x) dλ(x) = h(x) dλ(x) [a,b]

de modo que f es integrable.

[a,b]

¥

El teorema anterior nos muestra que una funci´on integrable seg´ un Riemann tiene que ser continua c.s., en cambio tenemos ejemplos de funciones que son discontinuas en todo punto y sin embargo son integrables seg´ un Lebesgue. Sin embargo, en cierto sentido estas u ´ltimas pueden ser aproximadas por funciones muy regulares, es decir por funciones que pueden ser diferenciadas infinitas veces.

54

´ CAP´ ITULO 3. FUNCIONES MEDIBLES E INTEGRACION

Teorema 3.9 Dada cualquier funci´ on f : R → R∗ integrable y cualquier ε > 0, existe un intervalo finito (a, b) y una funci´ on acotada g : R → R tal que g(x) se anula fuera de (a, b), es infinitamente diferenciable para todo real x y Z |f (x) − g(x)| dλ(x) < ε. Demostraci´ on. Hacemos la demostraci´on en cuatro etapas. (i) Primero hallamos un intervalo finito [a, b] y una funci´on medible y acotada f1 que se anule fuera de [a, b] tal que Z 1 |f (x) − f1 (x)| dλ(x) < ε. 4 Para hacer esto consideramos la sucesi´on de funciones  f (x) si |x| ≤ n y |f (x)| ≤ n,    n si |x| ≤ n y f (x) > n, gn (x) = −n si |x| ≤ n y f (x) < −n,    0 si |x| > n. Entonces gn (x) → f (x) para todo x y |gn | ≤ |f |. Por el Teorema de Convergencia Dominada tenemos que Z |f (x) − gn (x)| dλ(x) → 0 cuando n → ∞ de modo que podemos fijar N suficientemente grande y poner f1 (x) = gN (x). (ii) El siguiente paso es aproximar f1 por una funci´on simple f2 que se anule fuera de [a, b] y satisfaga Z 1 |f2 (x) − f1 (x)| dλ(x) < ε. 4 Esto es posible porque hemos definido la integral como l´ımite de funciones simples. (iii) Una funci´on simple es la suma finita de multiplos de funciones indicadoras. Si cada funci´on indicadora puede aproximarse por la funci´on indicadora de un n´ umero finito de intervalos disjuntos, tenemos que f2 puede aproximarse por f3 , una funci´on escalera de la forma f3 (x) =

n X

ci 1Ji (x),

i=1

donde cada Ji es un intervalo finito y Z |f2 (x) − f3 (x)| dλ(x) <

1 ε. 4

Para ver que esto es posible comenzamos con un conjunto acotado Lebesgue-medible E y η > 0. Hallamos un conjunto abierto G con E ⊂ G y tal que λ(G − E) < η/2. A partir de la uni´on numerable de intervalos abiertos disjuntos que forman a G escogemos una cantidad finita que forman el conjunto G0 tal que λ(G − G0 ) < η/2. Entonces tenemos que λ(E4G0 ) < η de modo que Z |1E (x) − 1G0 (x)| dλ(x) < η. R

(iv) Finalmente para obtener la funci´on infinitamente diferenciable g tal que Z 1 |g(x) − f3 (x)| dλ(x) < ε. 4

´ 3.10. FUNCIONES DE DISTRIBUCION

55

es suficiente encontrar una funci´on de este tipo para una de las componentes 1Ji (x) de f3 . Supongamos que J = (a, b) y 0 < 2η < b − a. Ponemos ( exp{−1/[(x − a)2 − η 2 ]} para |x − a| < η, φa,η (x) = 0 para |x − a| ≥ η. R∞ Rx acil verificar que h es infinitamente Si c−1 η = −∞ φa,η (x) dx, sea h(x) = cη −∞ [φa,η (t) − φb,η (t)] dt. Es f´ diferenciable y Z |1J (x) − h(x)| dλ(x) < 4η, ya que 0 ≤ h(x) ≤ 1 para todo x y {x : 1J (x) 6= h(x)} est´a contenido en los dos intervalos (a − η, a + η) y (b − η, b + η). ¥ Hemos enunciado el resultado de aproximaci´on para funciones reales, pero un teorema similar es cierto para funciones en Rk , en cuyo caso la funci´on aproximante tiene derivadas parciales de todos los ´ordenes.

3.10.

Funciones de Distribuci´ on

Sea F una funci´on de distribuci´on. Como F es mon´otona sabemos que tiene a lo sumo una cantidad numerable de discontinuidades. Sea {aj } la colecci´on de los puntos donde ocurren los saltos de la funci´on F y sea {bj } el tama˜ no de los saltos respectivos, es decir F (aj ) − F (a− j ) = bj . Consideremos la funci´on Fd (x) =

X

bj δaj (x)

j

que representa la suma de todos los saltos de F en la semirecta (−∞, x]. Esta funci´on es creciente, continua por la derecha con Fd (−∞) = 0, Fd (+∞) ≤ 1. Por lo tanto Fd es una funci´on creciente y acotada. Teorema 3.10 Sea Fc (x) = F (x) − Fd (x). Entonces Fc es positiva, creciente y continua. Demostraci´ on. Sea x < x0 , entonces Fd (x0 ) − Fd (x) =

X x

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.