Diferenciabilidad en espacios vectoriales normados Pedro Gajardo A. Universidad T´ ecnica Federico Santa Mar´ıa E-mail address:
[email protected]
´Indice general Cap´ıtulo 1. Diferenciabilidad en espacios vectoriales normados 1.1. Introducci´on 1.2. Derivada parcial con respecto a un vector 1.3. Diferencial 1.4. Funciones de clase C 1 1.5. Composici´ on de funciones diferenciables 1.6. Diferencial Parcial 1.7. Teoremas de la funci´ on inversa y de la funci´ on impl´ıcita 1.8. Derivadas parciales de orden superior 1.9. Desarrollos limitados
1 1 1 3 10 14 15 16 20 22
Ap´endice. ´Indice alfab´etico
27
v
CAP´ıTULO 1
Diferenciabilidad en espacios vectoriales normados 1.1.
Introducci´ on
En el presente documento abordamos el c´ alculo diferencial de funciones definidas en un espacio vectorial normado (e.v.n.) con valores en otro e.v.n. Las siguientes dos secciones definen las nociones fundamentales de este primer cap´ıtulo. En la pr´oxima secci´ on definimos la derivada parcial de una funci´ on f en un punto ~a de su dominio con respecto a un vector ~v , que denotamos Df (~a; ~v ). En la segunda se define la diferencial de una funci´ on en un punto ~a, que denotamos Df (~a). La diferencial Df (~a) es una funci´ on lineal continua que nos da una aproximaci´ on de primer orden de la funci´ on en el punto ~a (ver Nota 1.14) y la derivada parcial Df (~a; ~v ) es un vector en el espacio donde f toma sus valores, que nos permite calcular en forma efectiva la diferencial mediante la f´ormula Df (~a)(~v ) = Df (~a; ~v ) para todo ~v (f´ ormula (1.12)). En estas secciones se entregan tambi´en algunas f´ormulas para el c´ alculo de la derivada parcial y de la diferencial de la suma de dos funciones, del producto de una funci´ on por un escalar, junto con otras reglas de c´ alculo. El c´ alculo para la composici´ on de funciones (regla de la cadena) es presentado en la Secci´ on 1.5. Por otro lado, se presenta el Teorema del valor medio que es fundamental en c´ alculo diferencial. Este teorema s´ olo es v´alido para funciones con valores en R. Una variante de este teorema, para funciones a valores en un espacio vectorial, esta dado por el Teorema 1.32 llamado de los incrementos finitos. En la Secci´ on 1.4 se introducen las funciones de clase C 1 que constituyen la clase m´as importante de funciones diferenciables. Dos teoremas fundamentales se desarrollan en la Secci´on 1.7: el Teorema de la funci´ on inversa y el de la funci´ on impl´ıcita. Haciendo uso de la noci´ on de derivada de orden superior presentado en la Secci´ on 1.8, se define la noci´ on de desarrollo limitado de orden N de una funci´ on en un punto de su dominio. El resultado fundamental de esta secci´ on est´ a dado por el Teorema 1.73 donde se calcula expl´ıcitamente el desarrollo limitado de orden dos de una funci´ on de clase C 2 . 1.2.
Derivada parcial con respecto a un vector
~ ´ n 1.1. Dada una funci´ Definicio on f definida en un abierto A de un e.v.n. E ~ con valores en un e.v.n. F , se llama derivada parcial de f en ~a ∈ A, con respecto ~ al elemento de F~ definido por: al vector ~v ∈ E, (1.1)
Df (~a; ~v ) := l´ ım t→0 t6=0
f (~a + t~v ) − f (~a) t
cuando el l´ımite existe. 1
2
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
Nota 1.2. Si definimos la funci´ on φ :] − ε, ε[→ F~ por φ(t) = f (~a + t~v ), es f´acil ver que se tiene la f´ ormula Df (~a; ~v ) = φ′ (0) (la derivada de φ en 0) seg´ un el c´ alculo de funciones de una variable real. Con esto vemos que cuando F~ = R y k~v k = 1, la cantidad Df (~a; ~v ) se interpreta como la pendiente de f en ~a en la direcci´ on ~v . ´ n 1.3. La funci´ Definicio on f de la Definici´on 1.1 se dir´ a parcialmente derivable ~ en ~a, si Df (~a; ~v ) existe para todo ~v ∈ E. ~ = Rn y si deno´ n 1.4. Si en la Definici´on 1.1 consideramos que E Definicio n tamos por ~e1 , ..., ~en la base can´onica de R , entonces la derivada parcial Df (~a; ~ei ), ∂f cuando existe, la denotaremos ∂x (~a) ∈ F~ o bien ∂i f (~a) y, la llamaremos derivada i parcial de f en ~a con respecto a xi . Nota 1.5. De la f´ ormula (1.1) observamos que la derivada parcial de f en ~a con respecto a xi ∂f (~a) ∂xi
=
l´ ım t→0 t6=0
=
l´ ım t→0 t6=0
f (~a + t~ei ) − f (~a) t f (a1 , ..., ai + t, ..., an ) − f (a1 , ..., ai , ..., an ) t
corresponde a la derivada de la funci´ on de una variable f (a1 , ..., ai−1 , · , ai+1 , ..., an ) en ai . Nota 1.6. Cuando se habla de la derivada parcial de una funci´ on f con respecto ∂f ~ que a cada ~x ∈ A le hace a xi , se entiende que se trata de la funci´ on ∂x : A → F i corresponder ∂f (~x) ∈ F~ . ∂xi
Teorema 1.7. Si Df (~a; ~v ) existe para la funci´ on f , de la Definici´ on 1.1, Df (~a; λ~v ) tambi´en existir´ a para todo λ ∈ R y se tiene la igualdad
(1.2)
Df (~a; λ~v ) = λDf (~a; ~v ).
´ n. Si λ = 0, la f´ormula es evidente. Si λ 6= 0, hacemos el cambio Demostracio de variable s = λt, y obtenemos Df (~a; λ~v ) = l´ ım λ s →0 λ s 6=0 λ
f (~a + s~v ) − f (~a) f (~a + s~v ) − f (~a) = λ l´ ım = λDf (~a; ~v ). s→0 s s s6=0
´ n 1.8. Dadas dos funciones f y g definidas en un abierto A de un Proposicio ~ ~ tales que e.v.n. E, con valores en un e.v.n. F~ y, dos elementos ~a ∈ A y ~v ∈ E Df (~a; ~v ) y Dg(~a; ~v ) existen, entonces (i) D[f + g](~a; ~v ) existe y se tiene (1.3)
D[f + g](~a; ~v ) = Df (~a; ~v ) + Dg(~a; ~v );
1.3. DIFERENCIAL
(1.4)
3
(ii) Para λ ∈ R, D[λf ](~a; ~v ) existe y se tiene
D[λf ](~a; ~v ) = λDf (~a; ~v );
(iii) Si F~ = R, D[f g](~a; ~v ) existe y se tiene (1.5)
D[f g](~a; ~v ) = g(~a)Df (~a; ~v ) + f (~a)Dg(~a; ~v );
(iv) Si F~ = R y f (~a) 6= 0, D[1/f ](~a; ~v ) existe y se tiene 1 (1.6) D[1/f ](~a; ~v ) = − 2 Df (~a; ~v ). f (~a) ´ n. Las f´ Demostracio ormulas (1.3) y (1.4) son una consecuencia directa de la Definici´ on 1.1 y de las propiedades del l´ımite de funciones. Siguiendo la Nota 1.2, si definimos las funciones φ(t) = f (~a + t~v ) y ξ(t) = g(~a + t~v ), vemos que las f´ormulas (1.5) y (1.6) se escriben ′ 1 φ′ (0) (φξ)′ (0) = φ′ (0)ξ(0) + φ(0)ξ ′ (0) y (0) = − φ φ(0)2 respectivamente. Estas dos f´ ormulas fueron demostradas en el curso de c´ alculo de funciones de una variable real. ~ con Teorema 1.9. Si f es una funci´ on definida en un abierto A de un e.v.n E, valores en Rm y, si denotamos f1 , ..., fm las funciones componentes de f , entonces ~ la derivada parcial Df (~a; ~v ) existe si y s´ para ~a ∈ A y ~v ∈ E, olo si las derivadas parciales Dfi (~a; ~v ) existen para todo i = 1, ..., m y, en tal caso, se tiene que (1.7)
Df (~a; ~v ) = (Df1 (~a; ~v ), ..., Dfm (~a; ~v )) ∈ Rm .
´ n. Es una consecuencia directa de la Definici´on 1.1. Demostracio 1.3.
Diferencial
~ ´ n 1.10. Una funci´ Definicio on f definida en un abierto A de un e.v.n. E, ~ con valores en un e.v.n. F , se dir´ a diferenciable en ~a ∈ A, si existe una funci´ on ~ F~ ) (ℓ lineal y continua de E ~ en F~ ) tal que para todo ~δ ∈ E, ~ con ~a + ~δ ∈ A, ℓ ∈ L(E, se tenga (1.8) f (~a + ~δ) = f (~a) + ℓ(~δ) + o(~δ) ~ en F~ que verifica o(~0) = ~0 y donde o(·) es una funci´ on de E (1.9)
l´ım
~ δ→~ 0 ~ δ6=~ 0
o(~δ) ~ = 0. k~δk
Haciendo el cambio de variable ~x = ~a + ~δ ∈ A, la relaci´on (1.8) toma la forma f (~x) = f (~a) + ℓ(~x − ~a) + o(~x − ~a)
para todo ~x ∈ A.
A la funci´ on lineal continua ℓ (m´ as adelante veremos que es u ´ nica) se le llama ~ F~ ) o bien df (~a). diferencial de f en ~a y se le denota usualmente Df (~a) ∈ L(E, La funci´ on f se dir´ a diferenciable si es diferenciable en todo punto de A y ~ F~ ) que a cada ~x ∈ A le hace llamamos diferencial de f a la funci´ on de A en L(E, ~ ~ corresponder la diferencial Df (~x) ∈ L(E, F ) de f en ~x. A la diferencial de f la denotaremos Df o df .
4
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
Nota 1.11. La igualdad (1.8) junto con (1.9) equivale a (1.10)
l´ım
~ δ→~ 0 ~ δ6=~ 0
f (~a + ~δ) − f (~a) − ℓ(~δ) ~ =0 k~δk
lo que a su vez equivale a decir que: para todo ε > 0 existe η > 0 tal que (1.11) k~δk ≤ η ⇒ kf (~a + ~δ) − f (~a) − ℓ(~δ)k ≤ εk~δk.
~ F~ ) es diferenciable y se tiene Dℓ(~a) = ℓ Ejemplo 1.12. Toda funci´ on ℓ ∈ L(E, ~ Esto es una consecuencia inmediata de (1.10) y de la identidad para todo ~a ∈ E. ~ ℓ(~a + ~δ) − ℓ(~a) − ℓ(~δ) = ~0 para todo ~δ ∈ E. ~ Teorema 1.13. Si f es una funci´ on definida en un abierto A de un e.v.n E, ~ con valores en un e.v.n F , diferenciable en ~a ∈ A, entonces existe una u ´nica funci´ on ~ F~ ) que verifica (1.8). ℓ ∈ L(E, ´ n. Si ℓ1 y ℓ2 verifican (1.8), usando (1.11) que es equivalente a Demostracio (1.8), se obtiene f´ acilmente que para todo ε > 0 existe η > 0 tal que
y como
k k~vηk ~v k
k~δk ≤ η ⇒ kℓ1 (~δ) − ℓ2 (~δ)k ≤ εk~δk
~ no nulo, se tendr´a ≤ η para todo ~v ∈ E η η η ~v ) − ℓ2 ( ~v )k ≤ εk ~v k kℓ1 ( k~v k k~v k k~vk
y simplificando por
η k~ vk
obtenemos
kℓ1 (~v ) − ℓ2 (~v )k ≤ εk~vk
~ para todo ~v ∈ E
y como esto se tiene para todo ε > 0, haciendo tender ε a 0 conclu´ımos que ~ kℓ1 (~v ) − ℓ2 (~v )k = 0 para todo ~v ∈ E
~ es decir, ℓ1 (~v ) = ℓ2 (~v ) para todo ~v ∈ E.
Nota 1.14. La diferencial de f en ~a permite obtener la aproximaci´ on lineal af´ın o aproximaci´ on de primer orden de la funci´ on f en el punto ~a, que est´ a dada ~ → F~ definida por por la funci´ on h : E h(~x) := f (~a) + Df (~a)(~x − ~a)
es decir, la u ´ nica funci´ on lineal af´ın que verifica h(~a + ~δ) − f (~a + ~δ) = o(~δ).
~ con valores en un Dos funciones f y h definidas en un abierto A de un e.v.n. E e.v.n. F~ , se dicen tangentes en ~a ∈ A si f (~a + ~δ) − h(~a + ~δ) = o(~δ) donde o es una ~ en F~ que verifica o(~0) = ~0 y la relaci´on (1.9). funci´ on de E De lo anterior vemos que la aproximaci´ on de primer orden de la funci´ on f en ~a ∈ A corresponde a la funci´ on lineal af´ın que es tangente a la funci´ on f en ~a. ~ × F~ , el subespacio Geom´etricamente, este hecho se expresa diciendo que en E af´ın definido por el grafo de la funci´ on lineal af´ın h, es tangente al grafo de f en (~a, f (~a)). Recordemos que el grafo de una funci´ on f de A en F~ es el conjunto {(~x, ~z) ∈ A × F~ : ~z = f (~x)}. Cuando F~ = R decimos que z = h(~x) es la ecuaci´ on del hiperplano af´ın tangente al grafo de f en (~a, f (~a)).
1.3. DIFERENCIAL
5
~ y F~ por otras Nota 1.15. Si en la Definici´on 1.10 cambiamos las normas en E equivalentes, de (1.11) se desprende f´acilmente que f sigue siendo diferenciable en ~a y, su diferencial en ese punto es la misma. ~ Teorema 1.16. Si f es una funci´ on definida en un abierto A de un e.v.n E, con valores en un e.v.n F~ , diferenciable en ~a ∈ A, entonces ella es continua en ~a, parcialmente derivable en ~a y, se tiene la igualdad ~ (1.12) Df (~a)(~v ) = Df (~a; ~v ) para todo ~v ∈ E. ´ n. Usando la expresi´ Demostracio on (1.11) y haciendo el cambio de variable ~x = ~a + ~δ, obtenemos que para todo ε > 0 existe η > 0 tal que k~x − ~ak ≤ η
⇒ kf (~x) − f (~a) − Df (~a)(~x − ~a)k ≤ εk~x − ~ak
⇒ kf (~x) − f (~a)k − kDf (~a)(~x − ~a)k ≤ εk~x − ~ak
y como Df (~a) es una funci´ on lineal continua (Lipschitz), obtenemos kf (~x) − f (~a)k ≤ (kDf (~a)k + ε)k~x − ~ak ∀~x ∈ B(~a, η)
lo que implica que f es continua en ~a. ~ no nulo, para ~δ = t~v la relaci´on (1.10) implica que Ahora, dado ~v ∈ E l´ ım t→0 t6=0
f (~a + t~v ) − f (~a) − Df (~a)(t~v ) ~ = 0. |t|k~v k
Multiplicando por k~v k y usando la linealidad de Df (~a) se obtiene l´ ım t→0 t6=0
f (~a + t~v ) − f (~a) = Df (~a)(~v ) t
demostrando que f es parcialmente derivable en ~a y la igualdad (1.12). El resultado para ~v = 0 es evidente.
Nota 1.17. La f´ ormula (1.12) nos da la relaci´on que existe entre la diferencial de una funci´ on y su derivada parcial. Su importancia es crucial pues constituye la u ´ nica forma de calcular la diferencial de una funci´ on en un punto. En el teorema tambi´en demostramos que si la diferencial de una funci´ on existe en un punto de su dominio implica que ella es continua y parcialmente derivable en ese punto. Para apreciar cuanto m´as fuerte es la diferenciabilidad que la derivabilidad parcial, en el pr´oximo ejemplo veremos que esta u ´ ltima no implica ni siquiera la continuidad. Ejemplo 1.18. Considere la funci´ on f : R2 → R definida por f (x1 , x2 ) := si (x1 , x2 ) 6= (0, 0) y f (0, 0) := 0. Observe que f no es continua en (0, 0)
x1 x32 x21 +x62
1
−2
pero si es parcialmente derivable. En efecto, f (k −1 , k − 3 ) = k−2k+k−2 = 12 6= f (0, 0) para todo k ∈ N, lo que muestra la discontinuidad de f en (0, 0). Por otra parte t4 v1 v23 tv1 v23 (~0) ~ lo = l´ım t3 v2 +t Df (~0; ~v ) = l´ım f (t~v)−f ım v2 +t v ∈ E, 7 v 6 = l´ 4 v 6 = 0 para todo ~ t t→0
t→0
1
2
t→0
1
2
que muestra que f es parcialmente derivable en (0, 0).
Teorema 1.19. Dadas dos funciones f y g definidas en un abierto A de un ~ con valores en un e.v.n F~ , diferenciables en ~a ∈ A, entonces e.v.n E,
6
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
(i) f + g es diferenciable en ~a y se tiene (1.13)
D[f + g](~a) = Df (~a) + Dg(~a);
(ii) Para λ ∈ R, λf es diferenciable en ~a y se tiene (1.14)
D[λf ](~a) = λDf (~a);
(iii) Si F~ = R, entonces f · g es diferenciable en ~a y se tiene (1.15)
D[f · g](~a) = g(~a)Df (~a) + f (~a)Dg(~a);
(iv) Si F~ = R y f (~a) 6= 0, entonces 1/f es diferenciable en ~a y se tiene 1 1 (1.16) D (~a) = − 2 Df (~a). f f (~a) ´ n. Una forma directa de demostrar este teorema consiste en Demostracio verificar para cada uno de los cuatro casos la igualdad (1.10). De este modo se demuestra simult´ aneamente la diferenciabilidad de cada una de las cuatro funciones y su respectiva f´ ormula. Los casos (i) y (ii) son los m´as f´aciles y los dejamos como ejercicio. (iii) l´ım
~ δ→~ 0 ~ δ6=~ 0
l´ım
+
(f · g)(~a + ~δ) − (f · g)(~a) − [g(~a)Df (~a) + f (~a)Dg(~a)](~δ) = k~δk
f (~a + ~δ)[g(~a + ~δ) − g(~a) − Dg(~a)(~δ)] g(~a)[f (~a + ~δ) − f (~a) − Df (~a)(~δ)] + k~δk k~δk [f (~a + ~δ) − f (~a)]Dg(~a)(~δ) g(~a + ~δ) − g(~a) − Dg(~a)(~δ) = l´ım f (~a + ~δ) l´ım k~δk k~δk
+g(~a) l´ım
Dg(~a)(~δ) f (~a + ~δ) − f (~a) − Df (~a)(~δ) + l´ım[f (~a + ~δ) − f (~a)] = 0. k~δk k~δk
El u ´ ltimo l´ımite de la expresi´ on anterior es nulo debido a que la continuidad de la a)(~ δ) funci´ on lineal Dg(~a) implica que el cuociente Dg(~ es acotado y, la diferenciabilk~ δk idad de f en ~a implica su continuidad. (iv) l´ım ~ δ→~ 0 ~ δ6=~ 0
l´ım
1 f (~ a+~ δ)
−
1 f (~ a)
k~δk
+
Df (~ a)(~ δ) f (~ a)2
= l´ım
f (~a)2 − f (~a + ~δ)f (~a) + f (~a + ~δ)Df (~a)(~δ) = f (~a + ~δ)f (~a)2 k~δk
1 Df (~a)(~δ)[f (~a + ~δ) − f (~a)] − f (~a)[f (~a + ~δ) − f (~a) − Df (~a)(~δ)] · = f (~a + ~δ)f (~a)2 k~δk
1 Df (~a)(~δ) f (~a + ~δ) − f (~a) − Df (~a)(~δ) 1 l´ım[f (~a + ~δ) − f (~a)] l´ım − =0 3 2 f (~a) f (~a) k~δk k~δk
1.3. DIFERENCIAL
7
Teorema 1.20. Si f es una funci´ on definida en un abierto A de un e.v.n ~ con valores en Rm y, si denotamos f1 , ..., fm las funciones componentes de f , E, entonces f es diferenciable en ~a ∈ A si y solo si cada una de las m funciones fi es diferenciable en ~a y, en ese caso se tendr´ a (1.17)
Df (~a) = (Df1 (~a), ..., Dfm (~a)).
´ n. La equivalencia de la diferenciabilidad de f con la de sus Demostracio funciones componentes y la f´ ormula (1.17) se obtienen en forma directa utilizando la igualdad (1.10) y las propiedades del l´ımite. Nota 1.21. Las cinco f´ ormulas que se dan en los dos teoremas anteriores, se pueden obtener f´ acilmente a partir de la f´ormula (1.12) y de las respectivas f´ormulas de los teoremas 1.8 y 1.9. No lo hicimos as´ı debido a que previamente hab´ıa que demostrar la diferenciabilidad de cada funci´ on. Nota 1.22. Dados m e.v.n. F~1 , ..., F~m el teorema anterior se generaliza f´acilmente, gracias a que una sucesi´on converge en el espacio producto s´ı, y s´ olo si, cada componente converge, al caso en que f toma sus valores en el e.v.n. F~1 × ... × F~m . Teorema 1.23. Si f es una funci´ on definida en un abierto A de Rn con valores en un e.v.n F~ , diferenciable en un punto ~a ∈ A, entonces se tiene la f´ ormula (1.18)
Df (~a)(~v ) =
n X i=1
para todo ~v =
n P
i=1
vi
∂f (~a) ∂xi
vi~ei ∈ Rn , donde ~e1 , ..., ~en es la base can´ onica de Rn que usamos
en la Definici´ on 1.4. ´ n. Es una consecuencia inmediata del Teorema 1.16. Demostracio
´ n 1.24. Si f es una funci´ Definicio on definida en un abierto A de Rn con valores en R, diferenciable en un punto ~a ∈ A, se llama gradiente de f en ~a al vector ∂f ∂f (1.19) ∇f (~a) := (~a), ..., (~a) ∈ Rn . ∂x1 ∂xn Nota 1.25. Con la definici´ on anterior, cuando F~ = R, la f´ormula (1.18) se escribe (1.20)
Df (~a)(~v ) = h∇f (~a), ~v i
donde h·, ·i denota al producto interno usual en Rn . De este modo, vemos que el gradiente de una funci´ on f diferenciable en ~a es el vector asociado a la funci´ on lineal Df (~a) ∈ L(Rn , R). Con esta notaci´ on, la aproximaci´ on de primer orden de f en ~a, definida en la Nota 1.14, se escribe (1.21)
h(x) = f (~a) + h∇f (~a), ~x − ~ai
8
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
y la ecuaci´ on del hiperplano af´ın tangente al grafo de f en (~a, f (~a)), ser´ a (1.22)
z = h∇f (~a), ~x − ~ai + f (~a).
Denotando ahora h·, ·i al producto interno en Rn × R, esta ecuaci´ on se escribe h(∇f (~a), −1), (~x, z) − (~a, f (~a))i = 0
lo que muestra que el hiperplano af´ın en cuesti´ on es aquel que pasa por (~a, f (~a)) y es paralelo al hiperplano ortogonal al vector (∇f (~a), −1). Por esta raz´ on, se dice que el vector (∇f (~a), −1), trasladado a (~a, f (~a)), es ortogonal al grafo de f en (~a, f (~a)). Nota 1.26. Observe que la f´ormula (1.20) puede generalizarse a toda funci´ on ~ f definida en un abierto A de un espacio de Hilbert E con valores en R. En efecto, ~ en si f es diferenciable en ~a ∈ A, como Df (~a) es una funci´ on lineal continua de E ~ R, definimos el gradiente de f en ~a como el u ´ nico elemento ∇f (~a) ∈ E que verifica ~ (1.23) Df (~a)(~v ) = h∇f (~a), ~v i para todo ~v ∈ E y con esta definici´ on de gradiente, se deduce f´acilmente del teorema anterior que, ~ = Rn y F~ = R, el gradiente ∇f (~a) est´ cuando E a dado por la igualdad (1.19).
´ n 1.27. Si f es una funci´ Definicio on definida en un abierto A de Rn , con m valores en R , si denotamos f1 , ..., fm sus m funciones componentes y suponemos f diferenciable en ~a ∈ A, entonces llamamos Jacobiano de f en ~a a la matriz de m×n ∂fi (~a) (1.24) Jf (~a) = ∂xj donde 1 ≤ i ≤ m y 1 ≤ j ≤ n. Nota 1.28. Con la definici´ on anterior, cuando F~ = Rm , la f´ormula (1.18) se escribe, usando notaci´ on matricial, (1.25)
Df (~a)(~v ) = Jf (~a)~v .
El Jacobiano de una funci´ on f en ~a es la matriz asociada a la funci´ on lineal Df (~a) ∈ L(Rn , Rm ), seg´ un lo estudiado en el curso de algebra lineal. Con esta notaci´ on, la aproximaci´ on de primer orden de f en ~a, definida en la Nota 1.14 se escribe (1.26) 1.3.1.
h(~x) = f (~a) + Jf (~a)(~x − ~a). Teorema del Valor Medio.
~ Teorema 1.29. Sea f una funci´ on definida en un abierto A de un e.v.n. E ~ con valores en R. Si f es diferenciable en todo punto de un segmento [~a, b] ⊂ A, entonces existe ~c ∈]~a, ~b[ tal que (1.27) f (~b) − f (~a) = Df (~c)(~b − ~a).
´ n. Si definimos la funci´ Demostracio on φ(t) = f (~a + t(~b −~a)) para t ∈ [0, 1] y aplicamos el teorema del valor medio para funciones de una variable real, obtenemos que existe η ∈]0, 1[ tal que φ(1) − φ(0) = φ′ (η) lo que corresponde exactamente a la f´ ormula (1.27) con ~c = ~a + η(~b − ~a).
1.3. DIFERENCIAL
9
~ = Rn , de la f´ormula (1.20) vemos que Nota 1.30. Si en el teorema anterior E (1.27) puede escribirse f (~b) − f (~a) = h∇f (~c), ~b − ~ai. Ejemplo 1.31. Demos un ejemplo que muestre que la f´ormula (1.27) no es en general v´alida si f toma sus valores en un e.v.n. F~ . Sea f : R → R2 definida por f (t) := (cos(t), sen(t)) y sean a := 0 y b := 2π. Es f´acil constatar que f (b) − f (a) = (0, 0) y Df (c)(b − a) = 2π(−sen(c), cos(c)), lo que muestra que no existe c ∈ [0, 2π] tal que se tenga la igualdad (1.27). ~ Teorema 1.32. Sea f una funci´ on definida en un abierto A de un e.v.n. E ~ con valores en un e.v.n. F . Si f es diferenciable en todo punto de un segmento [~a, ~b] ⊂ A y si L es una constante que verifica L ≥ kDf (~x)k para todo ~x ∈ [~a, ~b], entonces se tiene la desigualdad kf (~b) − f (~a)k ≤ Lk~b − ~ak.
(1.28)
´ n. Supongamos lo contrario, es decir, que existe δ > 0 tal quekf (~b)− Demostracio ~b ~ ~ ~ kf (m) ~ − f (~a)k − Lkb − ~ak = δ. Si definimos m ~ = ~a+ 2 , puesto que kf (b) − f (m)k+ ~ ~ ~ f (~a)k ≥ kf (b) − f (~a)k y kb − ~ak = kb − mk ~ + km ~ − ~ak, se tendr´a kf (~b) − f (m)k ~ − Lk~b − mk ~ ≥
δ 2
o bien
δ . 2 Si se tiene la primera de estas desigualdades definimos ~b1 := ~b y ~a1 := m, ~ en ~ caso contrario definimos b1 := m ~ y ~a1 := ~a. Aplicando sucesivamente el mismo procedimiento obtenemos una sucesi´on de intervalos encajonados [~an , ~bn ] con k~bn − kf (m) ~ − f (~a)k − Lkm ~ − ~ak ≥
~an k =
k~b−~ ak 2n
y tales que
kf (~bn ) − f (~an )k − Lk~bn − ~an k ≥
δ . 2n
Puesto que k~an − ~bn k → 0 sabemos que las sucesiones {~an } y {~bn } deben converger a un mismo w ~ ∈ [~a, ~b]. Por otra parte por ser f diferenciable en w, ~ de la desigualdad anterior podemos escribir δ 2n
≤
kf (~bn ) − f (w) ~ − (f (~an ) − f (w))k ~ − Lk~bn − ~an k
=
kDf (w)( ~ ~bn − w) ~ + o(~bn − w) ~ − Df (w)(~ ~ an − w) ~ − o(~an − w)k ~ − Lk~bn − ~an k kDf (w)kk ~ ~bn − ~an k + ko(~bn − w)k ~ + ko(~an − w)k ~ − Lk~bn − ~an k
≤
y como k~bn − wk ~ < k~bn − ~an k y k~an − wk ~ < k~bn − ~an k, dividiendo la desigualdad ~ anterior por kbn − ~an k podemos escribir δ k~b − ~ak
≤ kDf (w)k ~ +
ko(w ~ − ~bn )k ko(w ~ − ~an k + −L kw ~ − ~an k kw ~ − ~bn k
10
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
y tomando l´ımite sobre n obtenemos una contradicci´ on con la hip´otesis kDf (~x)k ≤ L para todo ~x ∈ [~a, ~b]. Nota 1.33. Del teorema anterior se deduce que si f es diferenciable en todo punto de un conjunto convexo C ⊂ A y si L ≥ kDf (~x)k para todo x ∈ C, entonces kf (~x) − f (~y )k ≤ Lk~x − ~y k para todo ~x, ~y ∈ C. ~ se dir´ ´ n 1.34. Un conjunto C en un e.v.n. E Definicio a conexo si no existen ~ conjuntos abiertos no vac´ıos C1 y C2 en E que intersecten C, tales que C1 ∩ C2 = φ y C ⊂ C1 ∪ C2 . Teorema 1.35. Sea f una funci´ on diferenciable definida en un abierto A de ~ con valores en un e.v.n. F~ . Si el diferencial de f es nulo en todo punto un e.v.n. E de un conjunto abierto conexo C ⊂ A, entonces la funci´ on f ser´ a constante en C. ´ n. Demostremos primero que f es constante en toda bola Demostracio B(~x0 , δ) ⊂ C. Sea ~z ∈ B(~x0 , δ), puesto que [~x0 , ~z] ⊂ C y Df (~x) = 0 para todo ~x ∈ [~x0 , ~z], del teorema anterior conclu´ımos que kf (~z) − f (~x0 )k ≤ 0, lo que equivale a decir que f (~z) = f (~x0 ). Sea ahora ~a ∈ C, C1 = {~x ∈ C : f (~x) = f (~a)} y C2 = {~x ∈ C : f (~x) 6= f (~a)}. Puesto que la funci´ on f es continua (ver Teorema 1.16) y C es un conjunto abierto, es f´ acil demostrar que C2 es un conjunto abierto. Mostremos finalmente que C1 es tambi´en un conjunto abierto. Sea ~x0 ∈ C1 y B(~x0 , δ) ⊂ C, de la primera parte de esta demostraci´on conclu´ımos que f es constante en B(~x0 , δ), y se tendr´a entonces f (~x) = f (~a) para todo ~x ∈ B(~x0 , δ), lo que implica que B(~x0 , δ) ⊂ C1 . Lo anterior muestra que C1 es abierto. Como C1 ∩ C2 = φ, como C ⊂ C1 ∪ C2 y como C1 6= φ (en efecto, ~a ∈ C1 ), del hecho que C es conexo conclu´ımos que C2 = φ, es decir, C = C1 . 1.4.
Funciones de clase C 1
´ n 1.36. Una funci´ Definicio on f definida en un abierto A de Rn , con valores 1 ~ en un e.v.n F se dir´ a de clase C si las n derivadas parciales de f con respecto a x1 , ..., xn (ver Nota 1.6) existen y son continuas. Teorema 1.37. Si f es una funci´ on de clase C 1 , definida en un abierto A de R con valores en un e.v.n F~ , entonces ella es diferenciable. n
´ n. Con el u Demostracio ´ nico objeto de simplificar la notaci´ on, haremos la demostraci´on para el caso en que n = 2 y usaremos la norma del m´aximo. Dado un elemento cualquiera ~a := a1~e1 + a2~e2 ∈ A, vamos a demostrar que f es diferenciable en ~a. De acuerdo al Teorema 1.23, debemos probar entonces que la ∂f ∂f (~a) + δ2 ∂x (~a) es la diferencial de f en ~a. funci´ on lineal ℓ(~δ) := δ1 ∂x 1 2 Dado η > 0 tal que B(~a, η) ⊂ A, escribamos para ~δ ∈ R2 con k~δk ≤ η la desigualdad ∂f kf (a1 + δ1 , a2 + δ2 ) − f (a1 , a2 + δ2 ) − δ1 ∂x (~a)k kf (~a + ~δ) − f (~a) − ℓ(~δ)k 1 ≤ k~δk k~δk
1.4. FUNCIONES DE CLASE C 1
+
11
∂f kf (a1 , a2 + δ2 ) − f (a1 , a2 ) − δ2 ∂x (~a)k 2 . ~ kδk
Para concluir debemos probar que el l´ımite cuando ~δ → ~0 de cada uno de los dos sumandos de la derecha de esta desigualdad es cero. La desigualdad ∂f kf (a1 , a2 + δ2 ) − f (a1 , a2 ) − δ2 ∂x (~a)k ∂f f (~a + δ2~e2 ) − f (~a) 2 − (~a)k ≤k δ2 ∂x2 k~δk
∂f y la definici´ on de ∂x (~a), nos muestra que el segundo de estos l´ımites, es cero. 2 ∂f (~a). Definamos ahora la funci´ on φ(t) := f (a1 + t, a2 + δ2 ) − f (a1 , a2 + δ2 ) − t ∂x 1 1 Como f es de clase C , es claro que φ es diferenciable en todo punto del intervalo J ∂f (a1 + t, a2 + δ2 ) − (donde J = [0, δ1 ] si δ1 > 0 , = [δ1 , 0] si δ1 < 0) y Dφ(t)(v) = [ ∂x 1 ∂f a)]v. Escribiendo entonces para la funci´ on φ la desigualdad kφ(δ1 ) − φ(0)k ≤ ∂x1 (~ L|δ1 | con L = m´ax kDφ(t)k, dada por el Teorema 1.32, obtenemos t∈J
∂f ∂f ∂f (~a)k ≤ |δ1 | m´ax k (a1 +t, a2 +δ2 )− (~a)k. t∈J ∂x1 ∂x1 ∂x1 ∂f 1| Puesto que ∂x es una funci´ on continua en ~a y que |δ ≤ 1, dividiendo por k~δk 1 k~ δk esta desigualdad, vemos que el lado derecho tiende a cero cuando ~δ → ~0, lo que nos permite concluir nuestra demostraci´on.
kf (a1 +δ1 , a2 +δ2 )−f (a1 , a2 +δ2 )−δ1
Teorema 1.38. Si f es una funci´ on de clase C 1 , definida en un abierto A de ~ R con valores en un e.v.n. F , entonces f es continua. n
´ n. Es una consecuencia inmediata del teorema anterior y del Demostracio Teorema 1.16. ~ con ´ n 1.39. Una funci´ Definicio on definida en un abierto A de un e.v.n E, ~ valores en un e.v.n F se dir´ a continuamente diferenciable si ella es diferenciable en ~ F~ ) es continua. todo punto de A y si la funci´ on Df : A → L(E, Teorema 1.40. Si f es una funci´ on de clase C 1 , definida en un abierto A de R con valores en un e.v.n F~ , entonces ella es continuamente diferenciable. n
´ n. Del Teorema 1.37 sabemos que f es diferenciable en ~a. VeriDemostracio fiquemos ahora la continuidad de Df en ~a ∈ A. De (1.18) se tiene kDf (~a) − Df (~x)k
= sup ~ v 6=~0
= sup ~ v 6=~0
≤ sup ~ v 6=~0
≤ k
k[Df (~a) − Df (~x)](~v )k = k~v k ∂f k[ ∂x (~a) − 1
∂f x)]v1 ∂x1 (~
∂f k( ∂x (~a) 1
∂f x))v1 k ∂x1 (~
−
k~vk
∂f + ... + [ ∂x (~a) − n
k~vk
+ ... + sup ~ v 6=~0
∂f x)]vn k ∂xn (~
∂f k( ∂x (~a) − n
∂f ∂f ∂f ∂f (~a) − (~x)k + ... + k (~a) − (~x)k ∂x1 ∂x1 ∂xn ∂xn
∂f x))vn k ∂xn (~
k~v k
12
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
por lo tanto, haciendo tender ~x a ~a y puesto que las funciones en ~a, obtenemos l´ım kDf (~a) − Df (~x)k = 0
∂f ∂xi (·)
son continuas
~ x→~ a
lo que es equivalente a l´ım Df (~x) = Df (~a) mostrando as´ı la continuidad de Df en ~ x→~ a
~a.
Teorema 1.41. Si f es una funci´ on continuamente diferenciable, definida en un abierto A de Rn con valores en un e.v.n. F~ , entonces f es de clase C 1 . ´ n. Vamos a demostrar la continuidad de la funci´ Demostracio on en un punto ~a ∈ A. Del Teorema 1.16 deducimos que ∂f ∂f (~x) − (~a) = Df (~x)(~ei ) − Df (~a)(~ei ) ∂xi ∂xi = [Df (~x) − Df (~a)](~ei )
∂f ∂xi
: A → F~
y de la desigualdad kℓ(~x)kF~ ≤ kℓkL(E, xkE~ para lineales continuas, aplicada a ~ F ~ ) k~ la funci´ on lineal continua [Df (~x) − Df (~a)], vemos que
∂f ∂f (~x) − (~a)k ≤ kDf (~x) − Df (~a)kk~ei k. ∂xi ∂xi Como por hip´ otesis la funci´ on Df : A → L(Rn , F ) es continua en ~a ∈ A, obtenemos l´ım Df (~x) = Df (~a), lo que implica a partir de (*) que (*)
k
~ x→~ a
∂f ∂f (~x) = (~a) ~ x→~ a ∂xi ∂xi l´ım
concluyendo la continuidad de
∂f ∂xi
en ~a.
Nota 1.42. Si f es una funci´ on definida en un abierto A de Rn con valores en ~ un e.v.n. F , entonces los teoremas 1.16, 1.37, 1.40 y 1.41 se resumen en el siguiente diagrama f es de clase C 1
⇔ f es continuamente diferenciable
⇒ f es diferenciable
⇒ f es parc. derivable ⇒ f es continua. Teorema 1.43. Si f y g son dos funciones continuamente diferenciables definidas ~ con valores en un e.v.n. F~ , entonces en un abierto A de un e.v.n. E (i) f + g es continuamente diferenciable. (ii) Si λ ∈ R, λf es continuamente diferenciable. (iii) Si F~ = R, f · g es continuamente diferenciable. (iv) Si F~ = R y f (~x) 6= 0 para todo ~x ∈ A, 1/f es continuamente diferenciable. ´ n. Del Teorema 1.19 vemos que las cuatro funciones del enunDemostracio ciado ser´ an diferenciables. Por otra parte las f´ormulas (1.13) a (1.16) muestran que para todo ~x ∈ A (i) D[f + g](~x) = Df (~x) + Dg(~x)
1.4. FUNCIONES DE CLASE C 1
13
(ii) D[λf ](~x) = λDf (~x) (iii) D[f · g](~x) = g(~x)Df (~x) + f (~x)Dg(~x). (iv) D[1/f ](~x) = − f (~1x)2 Df (~x). Dado que por hip´ otesis las funciones f, Df, g y Dg son continuas, de las f´ormulas anteriores deducimos que D[f + g], D[λf ], D[f · g] y D[ f1 ] son continuas. Lo anterior nos permite concluir que f + g, λf, f · g y 1/f son continuamente diferenciables. ~ con Teorema 1.44. Si f es una funci´ on definida en un abierto A de un e.v.n E valores en Rm y, si denotamos f1 , ..., fm las funciones componentes de f , entonces ella ser´ a continuamente diferenciable si y solo si sus m funciones componentes son continuamente diferenciables. ´ n. Del Teorema 1.20 vemos que f es diferenciable si y solo si Demostracio sus m funciones componentes lo son. Por otra parte la f´ormula (1.17) muestra que Df (~x) = (Df1 (~x), ..., Dfm (~x)) lo que significa que Df es continua si y solo si las funciones Df1 , ..., Dfm son continuas. Lo anterior nos permite concluir que f es continuamente diferenciable si y solo si las funciones f1 , ..., fm tambi´en lo son. Nota 1.45. Dados m e.v.n. F~1 , ..., F~m , el teorema anterior se generaliza f´acilmente, de acuerdo a la nota 1.22, al caso en que f toma sus valores en el e.v.n. producto F~1 × ... × F~m . Teorema 1.46. Si f es una funci´ on continuamente diferenciable, definida en ~ con valores en un e.v.n. F~ , entonces para todo ~a ∈ A un abierto A de un e.v.n. E y todo ε > 0 existe δ > 0 tal que (1.29)
~x, ~y ∈ B(~a, δ) ⇒ kf (~x) − f (~y )k ≤ (kDf (~a)k + ε)k~x − ~yk.
La funci´ on f se dice entonces localmente Lipschitziana en A. ´ n. Sea ~a ∈ A y ε > 0. Como Df es una funci´ Demostracio on continua en ~a, existir´ a δ > 0 tal que kDf (~z)k ≤ kDf (~a)k + ε para todo ~z ∈ B(~a, δ). Como para todo ~x, ~y ∈ B(~a, δ) se tiene que [~x, ~y] ⊂ B(~a, δ), del Teorema 1.32 obtenemos la desigualdad (1.29). Teorema 1.47. Sea f una funci´ on continuamente diferenciable, definida en un abierto A de Rn con valores en un e.v.n. F~ . Entonces ella es Lipschitziana en toda bola B(~a,r) ⊂ A, con constante de Lipschitz L := m´ax kDf (~z)k. z ~∈B(~ a,r)
´ n. Dado que una funci´ Demostracio on continua definida sobre un conjunto compacto a valores en R alcanza su m´aximo, aplicando a Df en B(~a, r), conclu´ımos que L est´ a bien definido. El Teorema 1.32 nos permite entonces concluir.
14
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
1.5.
Composici´ on de funciones diferenciables
~ en un e.v.n. Teorema 1.48. Sea f una funci´ on de un abierto A de un e.v.n. E ~ ~ ~ F y sea g una funci´ on de un abierto B del e.v.n. F , en un e.v.n. G (suponemos que f (A) ⊂ B). Entonces si f y g son diferenciables en ~a ∈ A y f (~a) ∈ B respectivamente, la funci´ on h := g o f es diferenciable en ~a y se tiene la f´ ormula (1.30)
Dh(~a) = Dg(f (~a)) ◦ Df (~a).
´ n. De acuerdo a la relaci´on (1.11) debemos probar que dado Demostracio ε > 0 existe η > 0 tal que (*) k~δk ≤ η ⇒ k(g ◦ f )(~a + ~δ) − (g ◦ f )(~a) − [Dg(f (~a)) ◦ Df (~a)](~δ)k ≤ εk~δk.
Para simplificar la notaci´ on escribamos h := g ◦ f , ~b := f (~a) y ~v := f (~a + ~δ) − f (~a). Entonces kh(~a + ~δ) − h(~a) − [Dg(~b) ◦ Df (~a)](~δ)k ≤ kg(~b + ~v ) − g(~b) − Dg(~b)(~v )k + kDg(~b)(~v ) − [Dg(~b) ◦ Df (~a)](~δ)k y adem´as
kDg(~b)(~v ) − [Dg(~b) ◦ Df (~a)](~δ)k
= ≤
kDg(~b)(~v − Df (~a)(~δ))k kDg(~b)k kf (a + ~δ) − f (~a) − Df (~a)(~δ)k
obtenemos la desigualdad (1.31)
kh(~a + ~δ) − h(~a) − [Dg(~b) ◦ Df (~a)](~δ)k ≤ kg(~b + ~v ) − g(~b) − Dg(~b)(~v )k + kDg(~b)k kf (~a + ~δ) − f (~a) − Df (~a)(~δ)k.
Sea ε > 0. Como f es diferenciable en ~a, de acuerdo al Teorema 1.16 (ver su demostraci´on), ella ser´ a tambi´en Lipschitziana en ~a. Existir´a entonces η1 > 0 tal que ε k~δk (1.32) k~δk ≤ η1 ⇒ kf (~a + ~δ) − f (~a) − Df (~a)(~δ)k ≤ 2kDg(~b)k y (1.33)
k~δk ≤ η1 ⇒ kf (~a + ~δ) − f (~a)k ≤ Lk~δk.
Por otra parte, como g es diferenciable en ~b, existir´a η2 > 0 tal que ε (1.34) k~v k ≤ η2 ⇒ kg(~b + ~v ) − g(~b) − Dg(~b)(~v )k ≤ k~v k. 2L De las relaciones (1.31), (1.32), (1.33) y (1.34) definiendo η = m´ın{η1 , ηL2 } obtenemos directamente la desigualdad (*). Nota 1.49. De acuerdo a la Definici´on 1.24 y a la Nota 1.28 vemos que si en ~ = Rn , F~ = Rm y G ~ = Rp , entonces el jacobiano de la funci´ el teorema anterior E on h = g ◦ f en ~a, ser´ a igual al producto de los jacobianos de las funciones g y f , esto es (1.35)
Jh (~a) = Jg (f (~a)) · Jf (~a)
que corresponde a la f´ ormula (1.30) escrita matricialmente. Se verifica f´acilmente m P que el elemento (i, j) de la matriz Jh (~a) (de p filas y n columnas) es ∂k gi (f (~a))∂j fk (~a) k=1
donde ∂j fk (~a) representa la derivada parcial en ~a de la funci´ on componente fk con
1.6. DIFERENCIAL PARCIAL
15
respecto a la j-´esima variable y, ∂k gi (f (~a)) representa la derivada parcial en f (~a) de la funci´ on componente gi con respecto a la k-´esima variable. De (1.35) y (1.25) vemos que para todo ~v ∈ Rn se tendr´a Dh(~a)(~v ) = Jg (f (~a))Jf (~a)t~v t
(1.36)
que tambi´en se escribe n X m X Dh(~a)(~v ) = ( vj ∂j fk (~a)∂k g1 (f (~a)),
... ,
j=1 k=1
n X m X
vj ∂j fk (~a)∂k gp (f (~a))).
j=1 k=1
En particular, para ~v = ~ej ∈ Rn , se tendr´a para todo j = 1, ..., n e i = 1, ..., p la f´ ormula m X (1.37) ∂j hi (~a) = ∂j fk (~a)∂k gi (f (~a)). k=1
Esta f´ ormula se llama usualmente regla de la cadena para el c´ alculo de las derivadas parciales de la funci´ on h = g ◦ f . Teorema 1.50. Si suponemos que las funciones f y g del teorema anterior son continuamente diferenciables, entonces h := f o g tambi´en ser´ a continuamente diferenciable. ´ n. Es una consecuencia inmediata de la f´ormula (1.30) y del Demostracio Teorema ??, del que se deduce que por ser Dg, f y Df funciones continuas, entonces la funci´ on compuesta Dh tambi´en ser´ a continua. 1.6.
Diferencial Parcial
En esta secci´ on vamos a introducir la noci´on de diferencial parcial de una funci´ on, que en cierto sentido generaliza la noci´on de derivada parcial y, daremos despu´es un resultado que generaliza el Teorema 1.23. ~ 1 , ..., E ~ n , F~ , una funci´ ´ n 1.51. Dados n+1 e.v.n. E Definicio on f definida en un ~ 1 × ... × E ~ n con valores en F~ y ~a ∈ A, denotaremos por Dj f (~a) abierto A del e.v.n. E ~ j (~a = (~a1 , ..., ~an ) ∈ E ~ 1 × ... × E ~ n ) de la (para j = 1, ..., n) al diferencial en ~aj ∈ E funci´ on f (~a1 , ..., ~aj−1 , ·, ~aj+1 , ..., ~an ), cuando existe. Se tiene entonces que Dj f (~a) ∈ ~ j , F~ ). L(E Al diferencial Dj f (~a) lo llamamos diferencial parcial de f en ~a respecto a la variable j. Nota 1.52. Con los datos de la definici´ on anterior definimos las tres funciones ~ 1 × ... × E ~n → E ~ j , ij : E ~j → E ~ 1 × ... × E ~ n e Ij : E ~j → E ~ 1 × ... × E ~ n por pj : E (1.38)
pj (~x1 , ..., ~xn ) := ~xj
(1.39)
ij (~xj ) := (~0, ..., ~0, ~xj , ~0, ..., ~0)
(1.40)
Ij (~xj ) := ~a + ij (~xj − ~aj ).
Se deduce entonces f´ acilmente que (1.41)
Dj f (~a) = D[f ◦ Ij ](pj (~a)).
16
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
~ 1 , ..., E ~ n , F~ , un abierto A en el e.v.n. Teorema 1.53. Dados n + 1 e.v.n. E ~ 1 × ... × E ~ n , un elemento ~a ∈ A y una funci´ E on f : A → F~ diferenciable en ~a ∈ A, ~ 1 × ... × E ~ n se tiene la f´ entonces para todo ~v ∈ E ormula n X Dj f (~a)(~vj ) (1.42) Df (~a)(~v ) = j=1
donde ~vj := pj (~v ) (ver (1.38)). ´ n. De la igualdad (1.41), usando el Teorema 1.48 y el Ejemplo Demostracio 1.12 que nos muestra que DIj (pj (~a)) = ij , vemos que Dj f (~a) = D[f ◦ Ij ](pj (~a)) (*)
= Df (Ij (pj (~a))) ◦ DIj (pj (~a)) = Df (~a) ◦ ij .
Si componemos la igualdad (*) con pj y sumamos sobre j, obtenemos n X j=1
y como Df (~a) es lineal y
Dj f (~a) ◦ pj =
n P
j=1
n X j=1
Df (~a) ◦ ij ◦ pj
~ 1 × ... × E ~ n , concluimos que ij ◦ pj es la identidad en E n X j=1
Dj f (~a) ◦ pj = Df (~a)
que corresponde exactamente a la igualdad (1.42).
~ j := Nota 1.54. Si en la Definici´on 1.51 se tiene para todo j ∈ {1, ..., n} que E m R , F~ = R y si f1 , ..., fm son las funciones componentes de f , entonces la f´ormula (1.42) se escribe, usando notaci´ on matricial kj
(1.43)
Df (~a)(~v ) =
n X
Jj (~a)v~j t
j=1
donde Jj (~a) es el jacobiano asociado al diferencial Dj f (~a), esto es la matriz de coeficientes ∂ℓ fi (~a) donde el indice i = 1, ...., m indica la fila y ℓ : nj , ..., nj+1 − 1 j P indica la columna (nj = kp ). p=1
1.7.
Teoremas de la funci´ on inversa y de la funci´ on impl´ıcita
Nota 1.55. Sea f : R → R una funci´ on continuamente derivable y tal que f ′ (a) 6= 0. Del curso de c´ alculo de funciones de una variable sabemos que existe un intervalo I :=]a − ε, a + ε[, tal que la restricci´ on f˜ : I → f (I) de la funci´ on f es −1 ˜ biyectiva y su funci´ on inversa f es continuamente derivable. Se tiene adem´as que (f˜−1 )′ (f (~a)) = 1/f ′ (~a). En el teorema que sigue vamos a generalizar este resultado al caso en que f es una funci´ on continuamente diferenciable, definida en un abierto ~ A de un espacio de Banach E.
´ INVERSA Y DE LA FUNCION ´ IMPL´ICITA 1.7. TEOREMAS DE LA FUNCION
17
Antes de enunciar el teorema vamos a demostrar en el Lema 1.57 una propiedad importante de las funciones continuas. Ejemplo 1.56. En este ejemplo mostraremos una funci´ on f : R → R que es derivable, con derivada no nula en 0 y, que sin embargo no existe un intervalo I =] − ε, ε[ tal que la restricci´ on de f a I sea inyectiva. Esta funci´ on est´ a definida por la f´ ormula x 1 2 si x 6= 0 2 + x sen( x ) f (x) = 0 si x = 0. Que no exista ε > 0 tal que f sea inyectiva en ] − ε, ε[ es equivalente a decir que en todo intervalo de la forma ] − ε, ε[ la funci´ on f no es estrictamente creciente (o decreciente) lo que equivale a decir que en todo intervalo ] − ε, ε[ la derivada f ′ cambia de signo. Este hecho es evidente puesto que 1 1 1 si x 6= 0 2 + 2xsen( x ) − cos( x ) f ′ (x) = 1 si x = 0. 2 Lema 1.57. Sea f una funci´ on continua definida en un abierto A de un e.v.n. ~ con valores en un e.v.n. F~ . Entonces, la imagen rec´ıproca f −1 [O] de un conjunto E ~ abierto O ⊂ F~ es un conjunto abierto de E.
´ n. Debemos probar que para todo ~x ∈ f −1 [O] existe δ > 0 tal Demostracio −1 que B(~x, δ) ⊂ f [O]. Dado ~x ∈ f −1 [O], se tiene que f (~x) ∈ O y como O es abierto, debe existir ε > 0 tal que B(f (~x), ε) ⊂ O. Por otra parte, como f es continua en ~x, debe existir B(~x, δ) ⊂ A tal que f [B(~x, δ)] ⊂ B(f (~x), ε). Lo anterior nos muestra que f [B(~x, δ)] ⊂ O y por lo tanto B(~x, δ) ⊂ f −1 [O]. Teorema 1.58. Sea f una funci´ on continuamente diferenciable, definida en ~ con valores en E. ~ Si Df (~a) ∈ L(E, ~ E) ~ un abierto A de un espacio de Banach E ~ es biyectiva, entonces existe un abierto V en E que contiene a ~a y, tal que la restricci´ on f˜ : V → f (V ) de la funci´ on f es biyectiva y su funci´ on inversa f˜−1 es continuamente diferenciable. Se tendr´ a adem´ as para ~b := f (~a) que (1.44) Df˜−1 (~b) = [Df (~a)]−1 .
´ n. Haremos la demostraci´on en cuatro etapas. En la primera Demostracio veremos que sin perder generalidad podemos suponer que ~a = ~0, f (~a) = ~0 y Df (~a) = ~ con lo cual la demostraci´on se simplifica notablemente. I (funci´on identidad en E), Luego, en la segunda parte, encontraremos δ > 0 tal que la restricci´ on f˜, de la ′ −1 ′ ~ δ funci´ on f al conjunto abierto V := f [B (0, 2 )] ∩ B (0, δ), (ver lema anterior), es una biyecci´on de ese conjunto en f (V ). En la tercera etapa mostraremos que f˜−1 es Lipschitziana con constante de Lipschitz 2. Finalmente probaremos que f˜−1 es continuamente diferenciable. 1a. Parte. Por razones pedag´ ogicas la desarrollaremos al final. 2a. Parte. De acuerdo a la primera parte, podemos suponer ~a = ~0, f (~0) = ~0 y ~ Definamos entonces la funci´ ~ Df (~0) = I (funci´on identidad en E). on g de A en E ~ por g(~x) = ~x − f (~x). Como g es continuamente diferenciable y Dg(0) = 0 (funci´on ~ igual a ~0), del Teorema 1.46 vemos que existe δ > 0 tal que constante en E 1 (*) ~x, ~y ∈ B(~0, δ) ⇒ kg(~x) − g(~y )k ≤ k~x − ~y k 3
18
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
y como g(~0) = ~0, si hacemos ~ y = ~0 en (*) vemos que g(B(~0, δ)) ⊂ B(~0, δ3 ) ⊂ B ′ (~0, 2δ ). ´ nico ~x ∈ B(0, δ) Vamos ahora a demostrar que para todo ~u ∈ B ′ (~0, 2δ ) existe un u ˜ tal que ~u = f (~x), lo que implica que la restricci´ on f de la funci´ on f al conjunto V := f −1 (B ′ (~0, 2δ )) ∩ B ′ (~0, δ) es biyectiva de V en f (V ). Para esto definamos ~ por ℓ(~y) := g(~y ) + ~u. Como ℓ tambi´en verifica la la funci´ on ℓ de B(~0, δ) en E desigualdad (*), vemos por una parte que k~yk ≤ δ ⇒ kℓ(~y)k ≤ 31 k~y k + k~uk ≤ δ lo que significa que ℓ es una funci´ on de B(0, δ) en B(0, δ) y por otra parte (*) nos muestra que ℓ es contractante. Estos dos hechos nos permiten concluir de acuerdo al teorema del punto fijo, que existe un u ´ nico ~x ∈ B(0, δ) tal que ℓ(~x) = ~x, lo que equivale a decir ~u = f (~x). El Lema 1.57 garantiza que el conjunto V es abierto. 3a. Parte. Mostremos que ~u, ~v ∈ f (V ) ⇒ kf˜−1 (~u) − f˜−1 (~v )k ≤ 2k~u − ~v k. Dados ~u, ~v ∈ f (V ), sean ~x, ~y ∈ f (V ) tales que ~x = f˜−1 (~u) y ~y = f˜−1 (~v ), puesto que de la segunda parte sabemos que f + g = i y que g verifica (*), concluimos que k~x − ~yk
= k(f + g)(~x) − (f + g)(~y )k
≤ kg(~x) − g(~y )k + kf (~x) − f (~y )k 1 k~x − ~yk + kf (~x) − f (~y)k ≤ 2 lo que muestra k~x − ~ y k ≤ 2kf (~x) − f (~y )k que equivale a escribir kf˜−1 (~u) − f˜−1 (~v )k ≤ 2k~u − ~v k.
4a. Parte. Demostremos ahora que f˜−1 es diferenciable. Dado ~b ∈ B ′ (~0, 2δ ) probemos que Df˜−1 (~b) = [Df (~a)]−1 , donde ~a = f˜−1 (~b). Dados ~b y ~b+ ~k ∈ B ′ (~0, δ2 ), definiendo ~h := f˜−1 (~b+~k)− f˜−1 (~b) vemos que, de acuerdo a la tercera parte de la demostraci´on k~hk = kf˜−1 (~b + ~k) − f˜−1 (~b)k ≤ 2k~kk
por lo tanto kf˜−1 (~b + ~k) − f˜−1 (~b) − Df (~a)−1 (~k)k k~kk
≤2
≤
2k~h − Df (~a)−1 (f (~a + ~h) − f (~a))k k~hk
kDf (~a)−1 [Df (~a)(~h) − (f (~a + ~h) − f (~a))]k k~hk
≤ 2kDf (~a)−1 k
kf (~a + ~h) − f (~a) − Df (~a)(~h)k . k~hk
Como f es diferenciable y como cuando ~k → ~0 se tiene que ~h → ~0, obtenemos f˜−1 (~b + ~k) − f˜−1 (~b) − Df (~a)−1 (~k) ~ =0 l´ım ~ k→~ 0 k~kk ~ k6=~ 0 que muestra que f˜−1 es diferenciable y que Df˜−1 (~b) = Df (~a)−1 . ~ por h(~x) := Df (~a)−1 [f (~a + 1a. Parte. Si definimos la funci´ on h : A − ~a → E ~x) − f (~a)] vemos que h(~0) = ~0 y que h es continuamente diferenciable si y solo si f es continuamente diferenciable, en efecto Dh(~x) = Df (~a)−1 ◦ Df (~a + ~x) y ~ que en particular Dh(~0) = I. Vemos tambi´en que si existen abiertos B1 , B2 ⊂ E ˜ ~ contienen a 0 tales que la restricci´ on h, de h a B1 sea una biyecci´on de B1 en B2 ,
´ INVERSA Y DE LA FUNCION ´ IMPL´ICITA 1.7. TEOREMAS DE LA FUNCION
19
entonces la restricci´ on f˜, de f a A1 := B1 + ~a, ser´ a una biyecci´on de A1 en A2 := Df (~a)(B2 ) + f (~a), en efecto f˜−1 (~u) = ˜h−1 (Df (~a)−1 (~u − f (~a))) +~a. Finalmente, de ˜ −1 es continuamente diferenciable, entonces la u ´ ltima igualdad queda claro que si h −1 f˜ tambi´en lo ser´ a y se tiene ˜ −1 (Df (~a)−1 (~u − f (~a))) ◦ Df (~a)−1 . Df˜(~u) = Dh Nota 1.59. Dada una funci´ on f : R × R → R nos preguntamos si es posible despejar la variable y (en funci´ on de la variable x) en la ecuaci´ on (1.45)
f (x, y) = 0
es decir, ¿existe una funci´ on φ : R → R tal que “f (x, φ(x)) = 0 para todo x ∈ R”, o lo que es equivalente, tal que “f (x, y) = 0 ⇔ y = φ(x)”? Es f´ acil ver que “globalmente” esto no es posible, en general no existe φ que verifique f (x, φ(x)) = 0 para todo x ∈ R. Sin embargo, cuando f es continuamente diferenciable, dado (a, b) ∈ R × R que verifica la ecuaci´ on (1.45), es decir f (a, b) = 0, si ∂2 f (a, b) 6= 0, entonces existe ε > 0 y una funci´ on continuamente derivable φ : [a − ε, a + ε] → R tal que (1.46)
b = φ(a) y f (x, φ(x)) = 0 para todo x ∈ [a − ε, a + ε].
Aplicando la regla de la cadena para derivar la funci´ on nula x ∈ [a − ε, a + ε] → f (x, φ(x)), se tendr´a (1.47)
φ′ (a) = −
∂1 f (a, b) . ∂2 f (a, b)
Desarrollemos esta idea para la ecuaci´ on f (x, y) = 0 definida por la funci´ on√de clase C 1 f (x, y) := (x− 1)2 + (y − 1)2 − 1. Consideremos entonces (a, b) := ( 21 , 1 − 23 ), que √ evidentemente verifica f (a, b) = 0 y adem´as ∂2 f (a, b) = − 3 6= 0. De acuerdo a lo que dec´ıamos, debe entonces existir una funci´ on φ : [a−ε, a+ε] → R continuamente derivable tal que φ(a) = b y f (x, φ(x)) = 0 para todo x ∈ [a −pε, a + ε]. No es dif´ıcil deducir que la funci´ on φ : [ 41 , 43 ] → R definida por φ(x) = 1 − 1 − (x − 1)2 cumple √ ∂1 f ( 12 ,1− 23 ) √ . con este requerimiento. Se tiene adem´as φ′ ( 12 ) = √13 = − 3 1 ∂2 f ( 2 ,1−
2
)
Este mismo razonamiento lo podemos hacer para cualquier punto (a, b) ∈ R × R p de la forma (a, 1 ± 1 − (a − 1)2 ) con a ∈]0, 2[, pues todos esos puntos verifican la ecuaci´ on f (x, y) = 0 y adem´as la derivada parcial de f con respecto a la segunda variable, en esos puntos, no se anula. Esto no ser´ıa posible sin embargo, en (0, 1) y (2, 1) donde ∂2 f se anula, hecho que en este ejemplo es f´acil de evaluar directamente. El teorema de la funci´ on impl´ıcita que daremos a continuaci´ on generaliza este problema a la ecuaci´ on f (~x, ~y) = ~0, definida por una funci´ on continuamente diferenciable ~ 2 , donde A es un abierto en el e.v.n. E ~1 × E ~ 2 , siendo E ~1 y E ~ 2 dos espacios f :A→E de Banach. ~1 y E ~ 2 , un abierto A ⊂ E ~1 × Teorema 1.60. Dados dos espacios de Banach E ~ 2 y una funci´ ~ 2 , definimos la ecuaci´ E on continuamente diferenciable f : A → E on (1.48)
f (~x1 , ~x2 ) = ~0.
20
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
Entonces, si ~a = (~a1 , ~a2 ) ∈ A verifica la ecuaci´ on (1.48) y si D2 f (~a) (ver Definici´ on ~ 2 , se tiene que existe una bola B(~a1 , ε) ⊂ E ~ 1 y una funci´ 1.51) es biyectiva en E on ~ continuamente diferenciable φ : B(~a1 , ε) → E2 tales que (1.49) ~a2 = φ(~a1 ) y f (~x, φ(~x)) = ~0 para todo ~x ∈ B(~a1 , ε). Se tiene adem´ as la f´ ormula
Dφ(~a1 ) = D2 f (~a)−1 ◦ D1 f (~a).
(1.50)
~1 ×E ~2 → E ~1 ×E ~ 2 por ϕ(~x) := ´ n. Definamos la funci´ Demostracio on ϕ : A ⊂ E (~x1 , f (~x)), es decir, ϕ := (p1 , f ) (ver (1.38) para la definici´ on de p1 ). Entonces, de la Nota 1.45, concluimos que ϕ es continuamente diferenciable y Dϕ(~a) = (p1 , Df (~a)). Por otra parte, del Teorema 1.53 sabemos que Df (~a)(~v ) = D1 f (~a)(~v1 )+D2 f (~a)(~v2 ) ~1 × E ~ 2 , lo que muestra que Dϕ(~a) es biyectiva y para todo ~v ∈ E
Dϕ(~a)−1 (~u1 , ~u2 ) = (~u1 , [−D2 f (~a)−1 ◦ D1 f (~a)](~u1 ) + D2 f (~a)−1 (~u2 )). ~1 × E ~ 2 que Concluimos entonces, del Teorema 1.58 que existe un abierto V ⊂ E contiene a ~a tal que la restricci´ on ϕ˜ : V → ϕ(V ) de la funci´ on ϕ, es biyectiva y ϕ˜−1 : ϕ(V ) → V es continuamente diferenciable. Adem´as se tiene que Dϕ˜−1 (~b) = Dϕ(~a)−1
~ 2 definida donde ~b := ϕ(~a). Es f´ acil entonces verificar que la funci´ on φ : B(~a1 , ε) → E −1 −1 −1 ~ 2 (es por φ(~u1 ) := ϕ˜2 (~u1 , ~0), donde ϕ˜2 es la funci´ on componente de ϕ˜ en E −1 −1 −1 ~ decir ϕ˜ = (ϕ˜1 , ϕ˜2 )) y donde ε > 0 es tal que B(~a1 , ε) × {0} ⊂ ϕ(V ), verifica (1.49) y (1.50). 1.8.
Derivadas parciales de orden superior
´ n 1.61. Una funci´ Definicio on f definida en un abierto A de Rn con valores ∂f ∂f en un e.v.n. F~ , se dir´ a de clase C 2 si ella y sus derivadas parciales ∂x , ..., ∂x son 1 n ∂f 1 de clase C . La derivada parcial de la funci´ on ∂xi con respecto a la variable xj la 2
f 2 o bien ∂j,i f . Estas funciones se llaman derivadas parciales de denotaremos ∂x∂j ∂x i segundo orden de la funci´ on f . Por recurrencia sobre k, diremos que f es de clase C k si ella es de clase C k−1 y sus derivadas parciales de orden k − 1, que denotaremos por
(1.51)
∂ k−1 f ∂xik−1 ...∂xi1
para todo i1 , ..., ik−1 ∈ {1, ..., n},
son de clase C 1 . Las derivadas parciales de orden k de f las denotaremos
∂kf ∂xik ∂xik−1 ...∂xi1
o bien ∂ikk ,ik−1 ,...,i1 f .
Nota 1.62. Es una consecuencia casi inmediata de la definici´ on anterior que si f y g son dos funciones de clase C k , definidas en un abierto A de Rn con valores en un e.v.n. F~ , entonces : (i) las funciones f + g y λf tambi´en son de clase C k y se tiene
(1.52)
(1.53)
∂ikk ,...,i1 (f + g)(~a) = ∂ikk ,...,i1 f (~a) + ∂ikk ,...,i1 g(~a) ∂ikk ,...,i1 (λf )(~a) = λ∂ikk ,....,i1 f (~a)
para todo ~a ∈ A
para todo ~a ∈ A.
1.8. DERIVADAS PARCIALES DE ORDEN SUPERIOR
21
(ii) Cuando F~ = R la funci´ on f · g tambi´en es de clase C k . m Cuando F~ = R se tendr´a que f es de clase C k si y solo si cada una de sus m funciones componentes es de clase C k , y en ese caso (1.54)
∂ikk ,...,i1 f (~a) = (∂ikk ,...,i1 f1 (~a), ..., ∂ikk ,...,i1 fm (~a))
Teorema 1.63. Sea f una funci´ on de clase C 2 , definida en un abierto A de ~ R con valores en un e.v.n. F . Entonces se tendr´ a para todo ~a ∈ A, la f´ ormula 2
∂ 2f ∂2f (~a) = (~a). ∂x1 ∂x2 ∂x2 ∂x1
(1.55)
´ n. Sean ~a ∈ A y ε > 0. Por continuidad de las derivadas parDemostracio ciales de orden dos, existir´ a η > 0 tal que 2 2 2 2 (1.56) k~xk∞ ≤ η ⇒ k∂2,1 f (~a +~x)−∂2,1 f (~a)k ≤ ε y k∂1,2 f (~a +~x)−∂1,2 f (~a)k ≤ ε.
Si ~e1 y ~e2 son los vectores de la base can´onica en R2 y ~x = x1~e1 + x2~e2 , denotemos ∆2 f (~x) := f (~a + x1~e1 + x2~e2 ) − f (~a + x1~e1 ) − f (~a + x2~e2 ) + f (~a) y demostremos que (1.57)
2 f (~a)k ≤ ε|x1 ||x2 |. k~xk∞ ≤ η ⇒ k∆2 f (~x) − x1 x2 ∂2,1
2 Si definimos ϕ(t) := f (a+t~e1 +x2~e2 )−f (~a +t~e1 )−tx2 ∂2,1 f (~a), aplicando el teorema del valor medio (t.v.m.) a esta funci´ on, vemos que existe t¯ ∈ [0, x1 ] tal que 2 ∆2 f (~x) − x1 x2 ∂2,1 f (~a) =
=
ϕ(x1 ) − ϕ(0) = ϕ′ (t¯)x1 2 [∂1 f (~a + t¯e1 + x2~e2 ) − ∂1 f (~a + t¯~e1 ) − ∂2,1 f (~a)x2 ]x1
2 y si definimos θ(τ ) := ∂1 f (~a + t¯~e1 + τ~e2 ) − τ ∂2,1 f (~a) aplicando el t.v.m. a esta funci´ on, vemos que existe τ¯ ∈ [0, x2 ] tal que 2 ∆2 f (~x) − x1 x2 ∂2,1 f (~a) = [θ(x2 ) − θ(0)]x1 = θ′ (¯ τ )x2 x1 2 2 ¯ = [∂2,1 f (~a + t~e1 + τ¯~e2 ) − ∂2,1 f (~a)]x2 x1 .
De esta u ´ ltima igualdad, usando la primera desigualdad en (1.56), obtenemos f´acilmente la implicaci´ on (1.57). Del mismo modo se puede obtener la implicaci´ on (1.58)
2 k~xk∞ ≤ η ⇒ k∆2 f (~x) − x1 x2 ∂1,2 f (~a)k ≤ ε|x1 ||x2 |.
De (1.57) y (1.58), sumando se obtiene que 2 2 k∂2,1 f (~a) − ∂1,2 f (~a)k ≤ 2ε 2 2 y como ε es cualquiera, concluimos que ∂2,1 f (~a) = ∂1,2 f (~a).
22
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
Teorema 1.64. Sea f una funci´ on de clase C k , definida en un abierto A de R con valores en un e.v.n. F~ . Entonces para toda k-tupla (i1 , ..., ik ) ∈ {1, ..., n}k y toda biyecci´ on σ en {1, ..., k} se tendr´ a para todo ~a ∈ A la f´ ormula n
∂kf ∂kf (~a). (~a) = ∂xi1 ...∂xik ∂xiσ(1) ...∂xiσ(k)
´ n. Si k = 2 es una consecuencia inmediata del teorema anterior. Demostracio Si k ≥ 3, se deduce del teorema anterior por inducci´ on sobre k. 1.9.
Desarrollos limitados
´ n 1.65. Se llama polinomio de grado N ∈ N∗ (conjunto de los natuDefinicio rales incluyendo el 0) en Rn con coeficientes en R a toda funci´ on P : Rn → R de la forma (1.59)
P (δ1 , ..., δn ) =
X
α~i δ1i1 δ2i2 ... δnin
|~i|≤N
donde ~i := (i1 , ..., in ) ∈ Nn∗ es una n-tupla de componentes naturales, |~i| = α~i ∈ R.
n P
ij y
j=1
´ n 1.66. Sea A un conjunto abierto en Rn y f una funci´ Definicio on de A en R. Se llama desarrollo limitado de orden N de la funci´ on f en un punto ~a ∈ A a todo polinomio P : Rn → R de grado N tal que para todo ~δ ∈ Rn con ~a + ~δ ∈ A se tiene (1.60) f (~a + ~δ) − P (~δ) = oN (~δ) donde oN es una funci´ on de Rn en R que verifica oN (~0) = 0 y
(1.61)
l´ım
~ δ→~ 0 ~ δ6=0
oN (~δ) = 0. k~δkN
Nota 1.67. De la definici´ on anterior es evidente que en (1.61) se puede usar cualquier norma en Rn y por lo tanto el desarrollo limitado de una funci´ on f no depende de la norma. Adem´as es f´acil ver que P es un desarrollo limitado de orden N de f en ~a, entonces P (~0) = f (~a) deduciendo as´ı que f es continua en ~a. Nota 1.68. De la Definici´on 1.10 se desprende de inmediato que f tiene un desarrollo limitado de orden 1 en un punto ~a ∈ A si y solo si es diferenciable en ~a. En este caso se tendr´a (1.62) P (~δ) = f (~a) + Df (~a)(~δ) que de acuerdo a la f´ ormula (1.20), podemos escribir (1.63)
P (~δ) = f (~a) + h∇f (~a), ~δi
que efectivamente es un polinomio de grado 1 en Rn .
1.9. DESARROLLOS LIMITADOS
23
Nota 1.69. De la Nota 1.14 vemos que el desarrollo limitado de orden 1 en ~a de una funci´ on f , dado por (1.63), define la aproximaci´ on de primer orden de f en ~a, mediante la f´ ormula h(~x) = P (~x − ~a). Del Teorema 1.13 concluimos que el desarrollo limitado de orden 1 de una funci´ on en un punto (que est´ a dado por (1.62)) es siempre u ´ nico. Nota 1.70. Dada una funci´ on f definida en un abierto A de Rn con valores en R, su desarrollo limitado de orden N en ~a ∈ A define la llamada aproximaci´ on de orden N de f en ~a que est´ a dada por la funci´ on h(~x) := PN (~x − ~a). Dos funciones f y h definida en un abierto A de Rn con valores en R, se dicen tangentes de orden N en un punto ~a ∈ A, si f (~a + ~δ) − h(~a + ~δ) = oN (~δ) donde oN es una funci´ on de Rn en R que verifica oN (~0) = 0 y la relaci´on (1.61). De lo anterior vemos que la aproximaci´ on de orden N de la funci´ on f en ~a ∈ A, corresponde al polinomio de grado N que es tangente de orden N a la funci´ on f en ~a. Teorema 1.71. Sea f una funci´ on definida en un abierto A de Rn con valores en R. Si el polinomio X PN (~δ) := α~i δ1i1 δ2i2 ... δnin |~i|≤N
es un desarrollo limitado de orden N de la funci´ on f en ~a ∈ A, entonces para todo K < N , el polinomio X PK (~δ) = α~i δ1i1 δ2i2 ... δnin |~i|≤K
es un desarrollo limitado de orden K de la funci´ on f en ~a. ´ n. Puesto que Demostracio P f (~ a+~ δ)−
|~ i|≤K
i
in α~i δ11 ... δn
k~ δkK
l´ım
~ δ→~0
K+1≤|~i|≤N
~ δ→~0
deducimos que f (~a + ~δ) − l´ım
~ δ→~0
lo que equivale a decir que PK f en ~a.
i
K+1≤|~ i|≤N
k~δkN −K
y tambi´en (usando la norma infinito) P l´ım
−
P
in α~i δ11 ... δn
k~ δkK
=0
α~i δ1i1 ... δnin
k~δkK P
|~i|≤K
=0
α~i δ1i1 ... δnin
=0 k~δkK es un desarrollo limitado de orden K de la funci´ on
Teorema 1.72. Si una funci´ on f definida en un abierto A de Rn con valores en R, admite un desarrollo limitado PN de orden N en ~a ∈ A, entonces ´este es u ´nico.
24
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
´ n. Hagamos la demostraci´on por inducci´ Demostracio on. En la Nota 1.69 vimos que la unicidad se tiene cuando N = 1. Supongamos ahora que f admite un desarrollo limitado PN de orden N y que su desarrollo limitado PN −1 de orden N − 1 es u ´ nico. Demostremos entonces la unicidad de PN . Si denotamos PN y PN′ dos desarrollos limitados de orden N de f en ~a, del Teorema 1.71 y del hecho que el desarrollo limitado de orden N −1 es u ´ nico, podemos escribir X PN (~δ) = PN −1 (~δ) + α~i ~δ1i1 ... δnin |~i|=N
PN′ (~δ) =
PN −1 (~δ) +
X
α~′i ~δ1i1 ... δnin
|~i|=N
y aplicando a PN y PN′ la igualdad (1.60) y luego restando, se obtiene X (*) φ(~δ) := (α~i − α~′i ) δ1i1 ... δnin = oN (~δ). |~i|=N
De este modo para todo ~δ ∈ Rn y todo λ ∈ R se tiene φ(λ~δ) = λN φ(~δ), es decir ~ φ(~δ) = φ(λNδ) . De la igualdad (*) se obtiene entonces λ
l´ım
λ→0
φ(λ~δ) φ(λ~δ) = 0. = k~δkN l´ım N λ→0 kλ~ λ δkN
Esto implica que φ(~δ) = 0 para todo ~δ ∈ Rn y por lo tanto todos los coeficientes del polinomio φ deben ser nulos, esto es α~i − α~′i = 0 para todo ~i ∈ Nn∗ con |~i| = N . Todo esto nos permite concluir que PN = PN′ . Teorema 1.73. Sea f una funci´ on de clase C 2 definida en un abierto A de Rn con valores en R. Entonces para todo ~a ∈ A, f tiene un desarrollo limitado P2 de orden dos en ~a. Se tiene adem´ as que (1.64)
1 P2 (~δ) = f (~a) + h∇f (~a), ~δi + ~δt H(~a)t~δ 2
donde H(~a) es la matriz de n × n, llamada matriz Hessiana de f en ~a, cuyos coeficientes son las derivadas parciales de orden dos de f en ~a, esto es ∂2f 2 f ∂2 f a)... ∂x∂1 ∂x (~a) (~a) ∂x1 ∂x2 (~ ∂x21 n ∂2f 2 f ∂2f (~a) ... ∂x∂2 ∂x (~a) ∂x2 ∂x1 (~a) ∂x22 n (1.65) H(~a) = .. .. .. . . . 2 2 2 f ∂ f ∂ f a) ∂x∂n ∂x (~a)... a) ∂xn ∂x1 (~ ∂x2 (~ 2 n
´ n. Sea r > 0 tal que B(~a; r) ⊂ A. Sea ~δ ∈ Rn tal que k~δk ≤ r. Demostracio Definamos entonces la funci´ on ϕ : [0, 1] → R por ϕ(t) := f (~a + t~δ). Esta funci´ on es 1 de clase C y de acuerdo al teorema fundamental del calculo se tiene (*)
ϕ(1) = ϕ(0) +
Z1 0
ϕ′ (t)dt
1.9. DESARROLLOS LIMITADOS
donde ϕ′ (t) =
n P
i=1
∂f a ∂xi (~
+ t~δ)δi . Como las funciones
25
∂f ∂xi
son de clase C 1 , ellas son
diferenciables y por lo tanto, para cada i ∈ {1, ..., n} se tiene
n X ∂ ∂f ∂f ∂f (~a + t~δ) = (~a) + ( )(~a)tδj + oi (t~δ) ∂xi ∂xi ∂x ∂x j i j=1
y reemplazando en (*) obtenemos Z1 X n n 2 X ∂ f ∂f (~a) + (~a)δj t + oi (t~δ) δi dt f (~a + ~δ) = f (~a) + ∂x ∂x ∂x i j i j=1 i=1 0
=
1
Z X n n n n X ∂f 1 X X ∂2f f (~a) + oi (t~δ)δi dt (~a)δi + (~a)δj δi + ∂xi 2 i=1 j=1 ∂xj ∂xi i=1 i=1 0
=
1 f (~a) + h∇f (~a), ~δi + ~δt H(~a)t~δ + 2
Z1 X n 0
oi (t~δ)δi dt.
i=1
De acuerdo a la Definici´ on 1.66. Para terminar la demostraci´on debemos probar que la funci´ on Z1 X n ~ oi (t~δ)δi dt σ(δ) := 0
verifica l´ım ~ δ→~ 0 ~ δ6=~ 0
σ(~ δ) k~ δk2
i=1
= 0.
Por definici´ on de oi (·), para todo ε > 0 existe η > 0 tal que k~δk < η ⇒ |oi (~δ)| ≤ εk~δk
para todo
i ∈ {1, ..., n}
entonces, con η˜ := m´ın{η, r} obtenemos, usando como ha sido habitual la norma ∞ en Rn , Z1 X n 1 ~ ~ |δi | ε k~δk t dt ≤ ε nk~δk2 kδk ≤ η˜ ⇒ |σ(δ)| ≤ 2 i=1 0
lo que demuestra que l´ım ~ δ→~ 0 ~ δ6=~ 0
l´ımite es 0.
σ(~ δ) k~ δk2
≤ ε n2 y, como ε es cualquiera, concluimos que el
Nota 1.74. Del teorema anterior vemos que si f es una funci´ on de clase C 2 n definida en un abierto A de R con valores en R, su aproximaci´ on de orden 2 o aproximaci´ on cuadr´atica en ~a ∈ A, definida en la Nota 1.70, est´ a dada por la f´ ormula 1 (1.66) h(~x) = f (~a) + h∇f (~a), ~x − ~ai + (~x − ~a)t H(~x)(~x − ~a). 2 Nota 1.75. Es f´ acil verificar que la aproximaci´ on cuadr´atica de una funci´ on cuadr´atica definida en Rn con valores R es, en todo punto de Rn , ella misma.
26
1. DIFERENCIABILIDAD EN ESPACIOS VECTORIALES NORMADOS
Teorema 1.76. Sea f una funci´ on de clase C 2 definida en un abierto A de Rn con valores en R. Entonces la funci´ on ∇f definida en A con valores en Rn es de 1 clase C y D[∇f ](~x)(~v ) = H(~x)~v t .
(1.67)
´ n. Si f es de clase C 2 se tendr´a que las funciones ∂1 f, ..., ∂n f Demostracio 1 son de clase C , lo que es equivalente de acuerdo a los teoremas 1.37 y 1.40, a decir que ellas son continuamente diferenciables. Aplicando entonces el Teorema 1.44 a la funci´ on ∇f := (∂1 f, ..., ∂n f ) concluimos que ella es continuamente diferenciable y de la f´ ormula (1.17) vemos que D[∇f ](~x) = (D[∂1 f ](~x), ..., D[∂n f ](~x)). Aplicando ahora el Teorema 1.23 a las funciones ∂i f , obtenemos para cada i = 1, ..., n n X ∂j,i f (~x)vj D[∂i f ](~x)(~v ) = j=1
= (∂1,i f (~x), ..., ∂n,i f (~x))~v t que no es otra que la f´ ormula (1.67) escrita componente a componente.
Nota 1.77. Terminaremos esta secci´ on enunciando el teorema que generaliza la f´ ormula (1.64) al caso en que la funci´ on f es de clase C N . Teorema 1.78. Sea f una funci´ on de clase C N definida en un abierto A de R con valores en R. Entonces para todo ~a ∈ A, f tiene un desarrollo limitado de orden N en ~a, dado por el polinomio X (1.68) PN (~δ) = α~i δ1i1 δ2i2 ....δnin n
|~i|≤N
donde (1.69)
α~i =
1 i1 !...in !
~
∂ |i| f (~a), ∂xi11 ...∂xinn
α~0 = f (~a)
con la convenci´ on 0! = 1. Nota 1.79. Del Teorema anterior vemos que si f es una funci´ on de clase C N n definida en un abierto A de R con valores en R, su aproximaci´ on de orden N en ~a ∈ A, definida en la Nota 1.70, est´ a dada por la f´ormula X (1.70) h(~x) = α~i (x1 − a1 )i1 (x2 − a2 )i2 ...(xn − an )in |~i|≤N
donde los coeficientes α~i est´ an definidos por (1.69). El polinomio (1.70) con los coeficientes definidos por (1.69) se llama tambi´en desarrollo de Taylor de orden N de la funci´ on f en ~a.
´Indice alfab´ etico
base can´ onica, 2 conjunto conexo, 10 derivada parcial, 1 derivadas de orden superior, 20 desarrollo de Taylor, 26 diferenciabilidad, 3 diferencial parcial, 15 espacio de Banach, 17 espacio de Hilbert, 8 espacio producto, 7, 13 hiperplano, 8 interpretaci´ on geom´ etrica, 4 lineales continuas, 3 Lipschitz, 9 matriz Hessiana, 24 matriz Jacobiana, 16 normas equivalentes, 5 pendiente, 2 teorema teorema teorema teorema
de la funci´ on impl´ıcita, 19 de la funci´ on inversa, 17 de los incrementos finitos, 9 del valor medio, 8
unicidad, 4
27