ANÁLISIS MATEMÁTICO (40008) y (40015)

ANÁLISIS MATEMÁTICO (40008) y (40015) RESUMEN DE TEORÍA Y ENUNCIADOS DE LOS EJERCICIOS GRADO DE MATEMÁTICAS (394) Luis A. Tristán Vega D PTO . DE

Author: Mariano Olivera Sáez

0 downloads 191 Views 3MB Size

Report

DOWNLOAD PDF

Recommend Stories

modelos aditivos y multiplicativos en el anlisis de matrices multitrazos-multimtodos de cuestionarios de intereses profesionales

´ tica: Teor´ıa y Aplicaciones 1998 5(1) : 49–56 Revista de Matema cimpa – ucr – ccss issn: 1409-2433 modelos aditivos y multiplicativos en el anlis

; -y

_,. -~ ,._.._ :y

1 4 5 6 7 8 9 10 11 12 13 14 15 16 12 19 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 11 y 12 35 36 37 38 39 40 41 42 43 44 45 46 47

Regional Distrito Capital La Regional Distrito Capital del Servicio Nacional de Aprendizaje SENA, de conformidad con los principios de transparencia

Shakespeare y Romeo y Julieta

DESUSO Y VENTA Y REEMPLAZO

DESUSO Y VENTA Y REEMPLAZO Bienes muebles amortizables fuera de uso. Tratamiento impositivo: cuando alguno de los bienes amortizables, salvo los inmu

73 y las leyes , , , y )

Ley Nº 17.671 Registro Nacional de las Personas (Con las reformas del decreto-ley 1301/73 y las leyes 20.974, 21.807, 22.435, 22.863 y 23.023) Identif

y = 2x + 8x 7, y = x 4. y = 4 x, y = x + 2, x = 2, x = 3. x = 16 y, x = 6 y. y = a x, y = x, x y = a. (1 x)dx. y = 9 x, y = 0

Story Transcript

ANÁLISIS MATEMÁTICO (40008) y (40015)

RESUMEN DE TEORÍA Y ENUNCIADOS DE LOS EJERCICIOS

GRADO DE MATEMÁTICAS (394)

Luis A. Tristán Vega D PTO .

DE

Á LGEBRA , A NÁLISIS M ATEMÁTICO , G EOMETRÍA

Y

T OPOLOGÍA

40008 V ERSIÓN R EVISADA

Y

VALLADOLID , M AYO

C ORREGIDA DE

2013 LATV

40015 2 A . E DICIÓN

DEL

T EMARIO A MPLIADO

VALLADOLID , F EBRERO

DE

2013 LATV

Última compilación: 3 de junio de 2014 Incluye fe de erratas de la edición de septiembre de 2013 LATV

Ilustración de portada: edición original en latín de la obra “Introductio in Analysin Infinitorum” de Leonhard Euler, del año 1748 (cita [56] de la bibliografía).

Lisez Euler, lisez Euler, c’est notre maître à tous Leed a Euler, leed a Euler, él es el maestro de todos nosotros (Pierre Simon Laplace)

Contenido Prólogo a Análisis Matemático

V

Prólogo a Ampliación de Análisis Matemático

VII

1. Espacios euclídeos 1.1. Topología de Rn . . . . . . . . . . . . . . . . . 1.2. Límites . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Límites iterados . . . . . . . . . . . . . . 1.3. Continuidad . . . . . . . . . . . . . . . . . . . 1.3.1. Aplicaciones lineales y bilineales . . . . 1.4. Compacidad . . . . . . . . . . . . . . . . . . . 1.4.1. Comentarios sobre espacios normados 1.5. Conexión . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

1 1 6 9 9 11 12 13 14 16

2. Cálculo diferencial 2.1. Derivabilidad y diferenciabilidad 2.2. Derivadas de orden superior . . 2.3. Fórmula de Taylor . . . . . . . . 2.4. Extremos relativos . . . . . . . . 2.4.1. Formas cuadráticas . . . Ejercicios . . . . . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

23 23 28 30 32 33 34

3. Aplicaciones diferenciables 3.1. Aplicaciones contractivas. Teorema del punto fijo . . . . . . . . . . . . . . . 3.2. Funciones inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Notas sobre la demostración del teorema de las funciones inversas . 3.2.2. Cambios de variables. Aplicación a las ecuaciones diferenciales . . . 3.3. Funciones implícitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1. Teoremas de rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

41 41 42 43 44 45 47 47

4. Sucesiones y series funcionales 4.1. Sucesiones de funciones. Modos de convergencia . . . . . . . . . . . . . 4.2. Series de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Sucesiones y series de funciones de variable real . . . . . . . . . . . . . 4.4. Aproximación de funciones continuas . . . . . . . . . . . . . . . . . . . 4.4.1. Comentarios sobre la generalización del teorema de Weierstrass Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

53 53 55 58 59 60 61

5. Fundamentos de la integral 5.1. Intervalos en Rd . . . . . . . . . . . . 5.1.1. Conjuntos elementales . . . . . 5.2. Conjuntos de medida nula . . . . . . 5.2.1. La locución “casi siempre” . . . 5.3. Funciones escalonadas y su integral Ejercicios . . . . . . . . . . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

69 69 70 71 72 73 75

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . . I

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

6. Integral de Lebesgue 6.1. Definiciones y primeras propiedades . . . 6.2. Sucesiones de funciones integrables . . . 6.2.1. Comentarios sobre la generalización 6.3. Integración en intervalos de la recta . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

79 79 81 82 83 85

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

91 91 94 95 97 98 100 102

8. Integración por cambio de variables 8.1. Nociones previas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1. Cambios de variable en una dimensión . . . . . . . . . . . . . . . 8.1.2. Representación y descomposición de isomorfismos lineales . . . 8.2. Teorema del cambio de variables . . . . . . . . . . . . . . . . . . . . . . 8.2.1. Notas sobre la demostración del teorema del cambio de variables 8.3. Cambios de variables usuales . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1. Cambios de referencia afín . . . . . . . . . . . . . . . . . . . . . . 8.3.2. Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.3. Coordenadas cilíndricas . . . . . . . . . . . . . . . . . . . . . . . . 8.3.4. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.5. Coordenadas esféricas generalizadas . . . . . . . . . . . . . . . . 8.3.6. Transformación de símplices en cubos . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

109 109 110 110 111 111 112 112 113 113 114 115 116 117

9. Integrales paramétricas 9.1. Continuidad y derivación de integrales paramétricas . . . . . . . . . 9.1.1. Integrales flechadas dependientes de parámetros . . . . . . . 9.2. Integrales eulerianas . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3. Convolución de funciones. Aplicaciones . . . . . . . . . . . . . . . . 9.3.1. Producto de convolución . . . . . . . . . . . . . . . . . . . . . . 9.3.2. Aproximaciones de la identidad. Regularización de funciones 9.4. Transformadas integrales . . . . . . . . . . . . . . . . . . . . . . . . . 9.4.1. Transformación de Fourier . . . . . . . . . . . . . . . . . . . . 9.4.2. Transformación de Laplace . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

123 123 125 126 128 129 130 132 132 133 135

10. Extremos condicionados 10.1. Variedades diferenciables en Rn . . . . . . . 10.1.1. Variedades definidas implícitamente . 10.2. Extremos sujetos a condiciones de ligadura 10.2.1. El método de Kuhn-Tucker . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

141 141 144 145 147 148

11. Teoría de campos 11.1. Curvas paramétricas . . . . . . . . . . . . 11.2. Campos escalares y vectoriales . . . . . . 11.3. Operadores diferenciales . . . . . . . . . 11.3.1. Gradiente de un campo escalar . . 11.3.2. Rotacional de un campo vectorial . 11.3.3. Divergencia de un campo vectorial 11.3.4. Laplaciano de un campo escalar . Ejercicios . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

153 153 155 156 157 160 161 163 164

. . . . . . . . . . . . . . . . . . . . . . . . del teorema de Levi . . . . . . . . . . . . . . . . . . . . . . . .

7. Medibilidad. Integración iterada 7.1. Funciones medibles y conjuntos medibles . . . 7.2. Integración en conjuntos medibles . . . . . . . 7.2.1. Comentarios sobre espacios de medida . 7.2.2. Conceptos físicos definidos por integrales 7.3. Integración iterada . . . . . . . . . . . . . . . . . 7.3.1. Ejemplos notables de aplicación . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . .

II

. . . . . . . .

. . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

12. Integrales de línea 12.1. Integración de campos escalares . . . . . . . . . . . . . . . . . . . . . 12.2. Integración de campos vectoriales . . . . . . . . . . . . . . . . . . . . 12.3. Fórmula de Riemann-Green . . . . . . . . . . . . . . . . . . . . . . . 12.3.1. Notas sobre la demostración del teorema de Riemann-Green . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13. Integración en superficies 13.1. Superficies paramétricas en R3 . . . . . . . . . . 13.2. Integración de campos escalares . . . . . . . . . 13.3. Integración de campos vectoriales . . . . . . . . 13.4. Superficies con borde. Teorema de Stokes . . . 13.5. Teorema de Gauss-Ostrogradski . . . . . . . . . 13.5.1. Comentarios sobre formas diferenciales y Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . el teorema general de . . . . . . . . . . . . .

. . . . .

. . . . .

167 167 170 174 177 179

. . . . . . . . . . . . . . . . . . . . . . . . . Stokes . . . . .

. . . . . . .

185 185 188 190 192 196 198 202

. . . . .

. . . . .

. . . . .

. . . . .

A. Cónicas y Cuádricas 209 A.1. Cónicas en R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 A.2. Cuádricas en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Bibliografía

213

Índice de notación

217

Índice alfabético

219

III

Prólogo a Análisis Matemático Este manual no tiene otra pretensión que la de proporcionar un guión, ajustado al temario de la asignatura, que ayude tanto al desarrollo cotidiano de las lecciones magistrales, como al estudio particular del alumno. Con esto en mente, la estructura es sencilla: en cada uno de los temas en que se divide la materia se relatan los conceptos, propiedades y teoremas correspondientes, de forma concisa, pero sin renunciar a la presentación de ejemplos, observaciones aclaratorias, e incluso referencias a temas avanzados, continuación natural de los que conforman el currículo de la asignatura. Finalmente se proporciona una nutrida colección de enunciados de ejercicios, de dificultad variada, desde simples aplicaciones de fórmulas hasta problemas que requieren un planteamiento más concienzudo o una aportación intelectual que implique una visión general de la materia expuesta en la parte teórica. Los ejercicios se han elegido de manera que, salvo los prerrequisitos obvios del Cálculo en una variable y el Álgebra Lineal, no precisen de otra materia que la contemplada en la asignatura, e intentando que abarquen todas las facetas que ésta presenta. No obstante, al igual que en la parte teórica, son inevitables algunas referencias a disciplinas afines (Topología, Ecuaciones Diferenciales, etc.). Algunos ejercicios o problemas serán tratados en las clases prácticas, que girarán en torno a ellos. En general, para el uso de estas notas de la manera más provechosa, recomendamos que el alumno se anticipe a la presentación de la teoría en las lecciones magistrales, dedicando unos pocos minutos a la lectura somera de la materia que corresponda de forma inminente; esto servirá, al menos, para adquirir un primer contacto con la terminología y notación, y en muchos casos, en los que se generalizan nociones ya presentadas en un primer curso de Cálculo Infinitesimal, preparará al lector para una mejor comprensión de las explicaciones del profesor. Es necesario en este punto hacer énfasis en que el documento que presentamos dista mucho de ser un libro de texto, y que la correcta asimilación de los conceptos teóricos y la adquisición de la destreza en los métodos de Cálculo requiere del trabajo personal del alumno: primero, mediante la documentación entre la bibliografía citada, afianzando o puliendo aquellos aspectos teóricos que pudieran no haber quedado claros, y después, pero no menos importante, mediante la resolución de ejercicios y problemas. Los momentáneos intentos infructuosos no son necesariamente indicios de fracaso global, al contrario, sirven para enfocar de una forma más eficiente futuros problemas similares. Un ejemplo muy significativo: nadie puede aprender a montar en bicicleta viendo en televisión las grandes competiciones, solamente cuando se ha experimentado lo suficiente (seguramente sufriendo varias caídas) se puede alcanzar la destreza; lo mismo que en el desarrollo de cualquier actividad física o intelectual. En relación con lo expuesto arriba, se incluye una abundante lista de referencias bibliográficas, incluyendo tanto de libros de texto como manuales prácticos. Además, aunque no sea imprescindible, se citan algunas obras de carácter divulgativo o histórico, así como las direcciones URL de algunas páginas Web interesantes. Destacaremos luego una pequeña colección de textos que pensamos son los más adecuados al currículo de la asignatura. Entre estas obras, algunas que se pueden considerar ya clásicas y otras de factura más moderna, se encuentra información más que suficiente para abordar con éxito el estudio de esta asignatura, y únicamente el autor de estas notas aporta sus gustos o preferencias personales en cuanto a la organización secuencial del temario y el nivel de profundización. A tenor de lo dicho cabe preguntarse ¿qué sentido tiene elaborar este material didáctico si ya está todo escrito? En primer lugar, no hay un texto que se ajuste exactamente al contenido de la asignatura, de manera que tener un guión establecido ayudará al alumno en V

la programación de su estudio y en la tarea de documentación. También, el tener a mano los enunciados fundamentales, permitirá al alumno acudir a las lecciones con una actitud alejada de la del mero amanuense que transcribe la verborrea del profesor, y a éste a lo que, a mi modo de entender, debe ser su primordial función: transmitir el entusiasmo por lo que se enseña, fomentar la capacidad de que el alumno adquiera herramientas y hábitos de trabajo y aprendizaje individual, y sembrar el espíritu crítico que debe acompañar a toda actividad intelectual; a esta convicción he llegado con los años, independientemente de las sucesivas reformas de la enseñanza universitaria, o la vana grandilocuencia con que en nuestro país se han interpretado los acuerdos de Bolonia. Además, he de confesar, la obligación que me impongo de elaborar por adelantado este material me sirve de ayuda en mi labor docente en la primera andadura de la asignatura, entre otras cosas, para decidir de una manera más eficiente (y por tanto beneficiosa para sus destinatarios, supongo) qué incluir, cómo y en qué orden, optimizando el tiempo que se dedicará a cada tema y sin tener que sacrificar nada importante. Volviendo a las referencias bibliográficas, de forma más explícita: ⊲ El texto de Apostol [2] es una excelente referencia general para la asignatura, a excepción de una pequeña parte: lo que atañe a la construcción de la integral de Lebesgue, que presenta mediante el método de las funciones superiores, un ligera variante del método que se expone en estas notas. ⊲ El libro de Marsden y Hoffman [32] es otra buena referencia para la primera mitad de la asignatura y responde casi fielmente a la exposición que hacemos del tema 3 (funciones inversas e implícitas). ⊲ La colección de Fernández Viña, [14], [15] y [16], es otra excelente referencia general. En particular, en [16] se desarrolla la construcción de la integral de Lebesgue mediante el método de sucesiones fundamentales, que será el que seguiremos. ⊲ Los textos de Bombal, Rodríguez y Vera, [5], [6] y [7], cubren casi por completo todos los aspectos prácticos de la asignatura. ⊲ También los suplementos de “Ejercicios y complementos” de Fernández Viña y Sánchez Mañes, [17], [18] y [19], que acompañan los textos teóricos de Fernández Viña, son una buena referencia general en lo tocante a la práctica. ⊲ El texto de Galindo, Sanz y Tristán [23], aunque concebido de forma generalista hacia las enseñanzas técnicas, por lo que adolece de escasez de problemas de índole más teórica, contiene una abundante colección de ejercicios de cálculo. Las sucesiones y series funcionales están contempladas en el tomo dedicado a funciones de una variable [22]. La edición de este documento pretende ser lo más cuidada posible, utilizando el compilador de LATEX 2e, con formato “libro” (documentclass[book]), y preparado para imprimir a doble cara (de ahí la posible aparición de páginas en blanco). En particular, para facilitar su uso se incluyen: la tabla de contenidos, las referencias bibliográficas, el índice de notación y el índice alfabético. En éste último se recogen también los nombres de los personajes que han contribuido de alguna forma al desarrollo del Análisis Matemático, y que se citan en el texto, bien sea indirectamente, o por haber prestado su nombre a algún teorema. No puedo dejar de mencionar (es de bien nacidos ser agradecidos) que el contenido de estas notas y su posible valía no son sólo fruto de mi trabajo personal; las enseñanzas primero, y los consejos y colaboración luego, por parte de mis maestros y compañeros del Área de Análisis Matemático de la Universidad de Valladolid son mucho más trascendentes que el simple trabajo de teclear. Si algún defecto se encuentra se deberá sin duda a mis limitaciones o despistes. Finalmente quiero señalar que, aunque este material está dirigido a mis alumnos, cualquier persona que desee usarlo para fines no comerciales tiene mi expreso permiso de reproducción. En este sentido son bienvenidas toda critica o sugerencia, tanto en el aspecto literario como en el matemático, que ayuden a mejorar este modesto fruto de mi esfuerzo (contactar en e-mail: [email protected]). Valladolid, Junio de 2012

Luis A. Tristán Vega

VI

Prólogo a Ampliación de Análisis Matemático M ηδǫ´ις αγǫωµ´ǫτ ρητ oς ǫισ´ιτ ω µoι τ ην θ´ υ ραν (No entre aquí quien no sepa Geometría) Tras meditarlo profundamente me he decidido a continuar en este documento la parte relativa a esta asignatura de tercer curso. Es decir los 8 primeros temas corresponden a la asignatura (40008)-Análisis Matemático mientras que los temas 9 a 13 constituyen la materia de (40015)-Ampliación de Análisis Matemático. Esta decisión se debe, por una parte, a la necesidad de hacer continuas referencias en ésta de tercer curso a la de segundo curso; además, el hecho de que la materia tradicional de un curso de Análisis Matemático en varias variables reales se haya dividido en dos asignaturas, se debe sólo a que el plan de estudios se articula en asignaturas de 6, 9 o 12 créditos (no veo impedimento a que pudiesen ser de 15 o 18, ni le encuentro la ventaja a esa limitación, pero tampoco es este el sitio para discutirlo). También por este motivo mantengo el título, aunque sólo se corresponda con el de la primera asignatura. Además, todas las consideraciones y sugerencias hechas antes sirven, exactamente igual, en este caso. Como novedad, mencionaré las referencias bibliográficas específicas para los nuevos temas: ⊲ Para el primer tema de la asignatura (secciones 9.1 y 9.2 de este documento) son recomendables las mismas referencias que para los temas 6, 7 y 8. ⊲ El texto de Mazón [34] nos servirá para el tema 10. De hecho, si no fuese por las ligeras diferencias en la notación podríamos adoptarlo, tal cual, en estas notas. ⊲ También resultan útiles para el tema 10 los textos [2], [15], [18] y [32]. ⊲ En general, la colección de Fernández Viña y Sánchez Mañes es una buena referencia para todos los temas. No obstante, el cálculo vectorial se presenta del modo más formal en el contexto de las formas diferenciales. ⊲ Para los temas de Análisis Vectorial [33] y [39] son dos referencias clásicas. Como recomendación para lecturas posteriores o avanzadas, mencionaremos otros textos excelentes, alguno con una merecida reputación internacional, como [11], [36] o [43], pero en ellos la integración en variedades se presenta mediante formas diferenciales, lo que excede las aspiraciones de nuestro temario. ⊲ El texto de Galindo, Sanz y Tristán [23], cubre la parte práctica de todos los temas, tanto la parte de Extremos Condicionados como las de Cálculo Integral y Análisis Vectorial. Además, he añadido un apéndice resumiendo los aspectos básicos de las cónicas y las cuádricas afines. No sólo resultará útil a la hora de trabajar con los teoremas del Análisis Vectorial (circulaciones o flujos de campos, etc.), también aportará una buena herramienta en el manejo y estudio de los conjuntos que aparecen con frecuencia en el Cálculo Diferencial y en el Cálculo Integral. Es evidente que la destreza a la hora de tratar los aspectos geométricos allana muchas dificultades en trabajos como la búsqueda de las secciones de conjuntos en la integración iterada, la detección de cambios de variables ad hoc para problemas concretos, etc. De ahí la cita, obviamente sin ánimo prohibitivo, a la frase que la tradición (o la leyenda) cuenta que rezaba inscrita en la entrada a la Academia de Platón, en el siglo IV a. de C. Valladolid, Junio de 2013

Luis A. Tristán Vega VII

Tema 1

Espacios euclídeos Hablando en rigor, un espacio euclídeo, generalizando los conceptos de la Geometría clásica contemplada en los Elementos de Euclides, es un espacio vectorial real de dimensión finita dotado de un producto interno, en el que se tienen, por tanto, aparte de las nociones lineales generales, las relativas a ángulos (ortogonalidad, paralelismo). Ahora bien, eligiendo una base ortonormal de uno de tales espacios (el método de Gram-Schmidt permite construirla partiendo de una base cualquiera) esa fácil establecer un isomorfismo entre él y Rn , siendo n la dimensión del espacio. Por esta razón nos limitamos al estudio de estos espacios. El objetivo del presente capítulo es introducir aquellas propiedades topológicas de los espacios euclídeos que serán necesarias para abordar posteriormente el Cálculo Diferencial en varias variables. El punto de partida en el desarrollo de esta materia es el concepto de norma, que generaliza el de valor absoluto de los números reales y permite establecer un argumento para medir la proximidad de los puntos de un espacio vectorial. De hecho, la recta real es el caso más simple de los espacios normados que nos ocupan. El lector observará que los resultados que se exponen aquí son generalizaciones, o convenientes adaptaciones, de los que se presentan, con el mismo objetivo, en el estudio de la continuidad de funciones de una variable real.

1.1. Topología de Rn Definición 1.1. Para cada número natural n, sea Rn el conjunto de todas las n-uplas ordenadas de números reales x = (x1 , x2 , . . . , xn ). A xk se le denomina coordenada k-ésima de x. Se definen la suma de elementos de Rn y el producto de un escalar por un elemento de Rn como sigue: Para x = (x1 , x2 , . . . , xn ), y = (y1 , y2 , . . . , yn ) ∈ Rn se define su suma x + y por x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn ).

Para x = (x1 , x2 , . . . , xn ) ∈ Rn y α ∈ R, se define su producto α x por α x = (α x1 , α x2 , . . . , α xn ).

Proposición 1.2. El conjunto Rn con estas operaciones es un espacio vectorial sobre el cuerpo de los números reales. Observaciones 1.3. I)

II )

Usamos, por comodidad, la notación de vectores fila. En Álgebra Lineal, atendiendo a la representación matricial de aplicaciones y ecuaciones lineales, es usual considerar vectores columna. Cuando se requiera denotaremos por xt al vector traspuesto de x:   x1 ..  t t  . x = (x1 , x2 , . . . , xn ) = . xn

Es habitual confundir la estructura vectorial así obtenida con la estructura geométrica que se obtiene al considerar un espacio afín con espacio vectorial asociado Rn y, abusando de la notación, referirse a “puntos” de Rn en lugar de vectores, y a x1 , x2 , . . . , xn como las coordenadas (cartesianas, en honor a R. Descartes) del punto x = (x1 , x2 , . . . , xn ) ∈ Rn . Este será el criterio que seguiremos en adelante. 1

2

Tema 1. Espacios euclídeos

Definición 1.4. Si x = (x1 , x2 , . . . , xn ), y = (y1 , y2 , . . . , yn ) ∈ Rn se define su producto escalar o interno, que se representa por x · y o hx, yi , como x · y = x 1 y1 + x 2 y2 + . . . + x n yn .

Para cada x = (x1 , x2 , . . . , xn ) de Rn se define su norma euclídea kxk por n X 1/2 √ kxk = x · x = . |xi |2 i=1

El espacio vectorial Rn dotado del producto interno arriba definido se conoce como el espacio euclídeo n-dimensional. Proposición 1.5 (Desigualdad de Cauchy-Schwarz). Si x, y ∈ Rn , entonces |x · y| ≤ kxk kyk .

Además, la igualdad se alcanza si, y sólo si, x e y son linealmente dependientes. Proposición 1.6. La aplicación x ∈ Rn 7→ kxk ∈ R verifica las siguientes propiedades: I)

II ) III) IV )

kxk ≥ 0 para todo x ∈ Rn .

kxk = 0 si, y sólo si, x = 0.

kα xk = |α| kxk para todos x ∈ Rn , α ∈ R.

kx + yk ≤ kxk + kyk para todos x, y ∈ Rn . (Desigualdad triangular)

Corolario 1.7. Si x, y ∈ Rn entonces

kx − yk ≥ kxk − kyk .

(Segunda desigualdad triangular)

Corolario 1.8. La aplicación d: Rn × Rn → R, definida por d(x, y) = kx − yk , verifica las siguientes propiedades: I) II ) III) IV )

d(x, y) ≥ 0 para todos x, y ∈ Rn .

d(x, y) = 0 si, y sólo si, x = y.

d(x, y) = d(y, x) para todos x, y ∈ Rn .

d(x, z) ≤ d(x, y) + d(y, z) para todos x, y, z ∈ Rn .

Observación 1.9. Cualquier aplicación definida sobre un espacio vectorial V con valores en R que verifique las propiedades I) a IV) de la proposición 1.6 se denomina norma sobre V . Otras normas notables en Rn se definen para x = (x1 , x2 , . . . , xn ) por kxk1 =

n X i=1

|xi |

o

kxk∞ = sup |xi | : i = 1, 2, . . . , n .

Cuando n = 1 las tres normas definidas coinciden con el valor absoluto. Asimismo, si X es un conjunto no vacío, cualquier aplicación d definida en el producto cartesiano X × X con valores en R que verifique las propiedades I) a IV) del corolario 1.8 se dice que es una distancia o métrica sobre X, y se dice que el par (X, d) es un espacio métrico. Definición 1.10. Sean x ∈ Rn y r > 0. Se definen la bola abierta de centro x y radio r como el conjunto B(x, r) = {y ∈ Rn : d(x, y) = kx − yk < r} ;

la bola cerrada de centro x y radio r como el conjunto

B(x, r) = {y ∈ Rn : d(x, y) = kx − yk ≤ r} ;

la esfera de centro x y radio r como el conjunto

S(x, r) = B(x, r) \ B(x, r) = {y ∈ Rn : d(x, y) = kx − yk = r} ,

donde “\” denota la diferencia conjuntista.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

1.1. Topología de Rn

3

Lema 1.11. Sean x, y ∈ Rn . I)

II ) III )

Si dado r > 0 se tiene que y ∈ B(x, r) , existe s > 0 tal que B(y, s) ⊂ B(x, r) .

Si y 6= x existen r, s > 0 tales que B(x, r) ∩ B(y, s) = Ø .

Si la sucesión de números reales positivos {rn }∞ n=1 converge hacia 0 (o lo hace alguna subsucesión suya), entonces

∞

∩ B(x, rn ) = {x} .

n=1

Definición 1.12. Si A es un subconjunto no vacío de Rn se denomina diámetro de A , denotado “δ(A)” o “diam(A)” a δ(A) = sup d(x, y) : x, y ∈ A

(nótese que el diámetro de A puede ser un número real no negativo o ∞ , dependiendo de que el conjunto {d(x, y) : x, y ∈ A} ⊂ R esté acotado o no). Se dice que un subconjunto de Rn es acotado si es vacío o si tiene diámetro finito. Proposición 1.13. I) II )

III ) IV )

Si Ø 6= B ⊂ A ⊂ Rn entonces δ(B) ≤ δ(A) . Toda bola en Rn es acotada, de hecho,

δ B(x, r) = δ B(x, r) = 2 r .

Un conjunto A ⊂ Rn es acotado si, y sólo si, está contenido en alguna bola.

Un conjunto A ⊂ Rn es acotado si, y sólo si, está contenido en una bola centrada en 0, o lo que es lo mismo, si existe una constante M > 0 tal que kxk ≤ M

para todo x ∈ E.

Definición 1.14. Sean A , B subconjuntos no vacíos de Rn . Se define la distancia entre A y B como el número real d(A, B) = ´ınf d(x, y) : x ∈ A , y ∈ B .

Si A = {a} es un conjunto unipuntual la distancia entre A y B se denota también d(a, B) y se denomina distancia de a a B .

Proposición 1.15. Sean A, B subconjuntos de Rn . I)

Si A y B son acotados entonces A ∪ B es acotado. Más aún, si además A y B son no vacíos, entonces δ(A ∪ B) ≤ δ(A) + δ(B) + d(A, B) . II ) Si A 6= Ø y x, y ∈ Rn entonces d(x, A) − d(y, A) ≤ d(x, y) .

Definición 1.16. Sea E un subconjunto de Rn . Se dice que un punto x ∈ Rn es interior a E, o que E es un entorno de x, si existe una bola abierta de centro x contenida en E. El conjunto de todos los puntos interiores de E se denomina interior de E y se representa ◦

◦

por E ó int(E) (es inmediato comprobar que E⊂ E). Se dice que el conjunto E es abierto si es entorno de todos sus puntos, es decir, si todos ◦

sus puntos son interiores, lo que equivale a que E =E. Propiedades 1.17. Sean A, B y {Ai }i∈I subconjuntos de Rn . I) II ) III )

◦

◦

Si A ⊂ B entonces A⊂B .

int(int(A)) = int(A) . ◦

A es el mayor conjunto abierto contenido en A . ◦ ◦ IV ) ∪ Ai ⊆ ∪ Ai . i∈I

V)

∩ Ai

i∈I

i∈I

◦

◦

⊆ ∩ Ai , además, si I es finito se verifica la igualdad. i∈I

U NIVERSIDAD DE VALLADOLID

4

Tema 1. Espacios euclídeos

Ejemplos 1.18. I) II ) III)

Toda bola abierta es un conjunto abierto. Las bolas cerradas no son conjuntos abiertos. Los intervalos abiertos de Rn , esto es, productos cartesianos de la forma (a1 , b1 ) × (a2 , b2 ) × . . . × (an , bn ) ,

son conjuntos abiertos.

Proposición 1.19. Se verifican las siguientes propiedades: I) II )

El conjunto vacío Ø y el conjunto total Rn son abiertos. Si {Gi }i∈I es una familia de conjuntos abiertos, entonces la unión ∪ Gi es un conjunto i∈I

abierto.

III)

Si G1 , G2 , . . . , Gk son conjuntos abiertos, entonces la intersección G1 ∩ G2 ∩ . . . ∩ Gk es un conjunto abierto.

Observaciones 1.20. I)

El lector que posea nociones de Topología puede reconocer en la proposición anterior la afirmación siguiente: si denotamos por τ a la familia de todos los conjuntos abiertos de Rn , el par (Rn , τ ) es un espacio topológico.

II )

La intersección de una familia arbitraria de abiertos puede no ser un conjunto abierto, como queda patente con el siguiente ejemplo: si Gn = B(0, 1/n), n ∈ N, se tiene que ∞

∩ Gn = {0}.

n=1

Definición 1.21. Sea E un subconjunto de Rn . Se dice que un punto x de Rn es un punto adherente a E si cada bola abierta centrada en x tiene intersección no vacía con E. El conjunto de todos los puntos adherentes a E se denomina adherencia o clausura de E y se representa por E , cl(E) ó adh(E) (es muy sencillo comprobar que E ⊂ E). Se dice que un conjunto E de Rn es cerrado si todos sus puntos adherentes están en E, es decir, si E = E. Ejemplos 1.22. I) II ) III)

Toda bola cerrada es un conjunto cerrado. Es más B(x, r) = B(x, r) . Las bolas abiertas no son conjuntos cerrados. Los intervalos cerrados de Rn , de la forma [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ], son conjuntos cerrados.

Proposición 1.23. Sea A un subconjunto de Rn . Se tiene que ◦

Rn \ A= Rn \ A

y

Rn \ A = (Rn \ A)◦ .

Corolario 1.24. Un subconjunto E de Rn es abierto (resp. cerrado) si, y sólo si, su complementario Rn \ E es cerrado (resp. abierto). Observaciones 1.25. I)

En la Topología General suele utilizarse la propiedad anterior para definir la familia de cerrados, y luego caracterizar equivalentemente estos conjuntos en términos de la adherencia. En este contexto (en general, en los espacios métricos) el adjetivo adherente cobra un significado más intuitivo gracias a la noción de distancia: x ∈ A si, y sólo si, d(x, A) = 0.

II )

Pueden existir conjuntos que no sean ni abiertos ni cerrados (basta pensar en el intervalo [0, 1) de R con la métrica usual). Aunque la terminología usada pretende ser lo más descriptiva posible, no nos debemos dejar influir por el significado etimológico de las palabras.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

5

1.1. Topología de Rn

Propiedades 1.26. Sean A, B y {Ai }i∈I subconjuntos de Rn . I)

II ) III ) IV ) V)

Si A ⊂ B entonces A ⊂ B . A = A.

A es el cerrado más pequeño que contiene a A. ∪ Ai ⊆ ∪ Ai , además, si I es finito se verifica la igualdad.

i∈I

i∈I

∩ Ai ⊆ ∩ Ai .

i∈I

i∈I

Proposición 1.27. Se verifican las siguientes propiedades: I) II )

El conjunto vacío Ø y el conjunto total Rn son cerrados. Si {Fi }i∈I es una familia de conjuntos cerrados, entonces la intersección ∩ Fi es un i∈I

conjunto cerrado.

III )

Si F1 , F2 , . . . , Fk son conjuntos cerrados, entonces la unión F1 ∪ F2 ∪ . . . ∪ Fk es un conjunto cerrado.

Definición 1.28. Sea E un subconjunto de Rn . Se dice que un punto x de Rn es un punto de acumulación de E si para cada bola abierta B(x, r) centrada en x, la intersección B(x, r) ∩ E contiene al menos un punto de E distinto de x, es decir, si para cada r > 0 se tiene que B(x, r) ∩ (A \ {x}) 6= Ø .

El conjunto de todos los puntos de acumulación se denomina conjunto derivado de E y se representa por E ′ . Se dice que un punto x ∈ E es un punto aislado de E si no es un punto de acumulación de E. Se dice que un conjunto E es discreto si todos sus puntos son aislados en él. Proposición 1.29. Sea E un subconjunto de Rn . Entonces: I) II )

E = E ∪ E′.

E es cerrado si, y sólo si, E ′ ⊂ E.

III )

Si x es un punto de acumulación de E, entonces cualquier bola abierta B(x, r) de centro x contiene infinitos puntos de E.

IV )

Si x ∈ E es un punto aislado de E, entonces existe una bola abierta B(x, r) de centro x tal que B(x, r) ∩ E = {x}.

Definición 1.30. Sea A un subconjunto de Rn . Se dice que un punto x ∈ Rn es exterior a A si es un punto interior al complementario de A , es decir, si existe una bola abierta B(x, r) de centro x tal que B(x, r) ∩ A = Ø . El conjunto de puntos exteriores a A se denomina exterior de A .

Se dice que x ∈ Rn es un punto frontera de A si es adherente a A y a Rn \ A simultáneamente. El conjunto de tales puntos se denomina frontera de A y se denota Fr(A) : Fr(A) = A ∩ Rn \ A . Observaciones 1.31. Sea A un subconjunto de Rn . I) II )

Es obvio que Fr(A) es un conjunto cerrado, y que si A es cerrado, entonces Fr(A) ⊆ A. Igualmente evidente es que Fr(A) = Fr(Rn \ A).

El espacio Rn se expresa, respecto al conjunto A, como unión de tres conjuntos disjuntos (alguno posiblemente vacío): la frontera de A, un cerrado; y dos abiertos, a saber, el interior y el exterior de A.

Definición 1.32. Sean E y D ⊆ E subconjuntos de Rn . Se dice que D es denso en E si E ⊆ D. U NIVERSIDAD DE VALLADOLID

6

Tema 1. Espacios euclídeos

1.2. Límites n Definición 1.33. Se dice que una sucesión {xk }∞ k=1 de elementos de R es convergente si n existe un punto x ∈ R tal que para cada número real ε > 0 existe un número natural k0 (que depende de ε) de manera que

para cada número natural k ≥ k0 .

kxk − xk < ε

∞ En este caso, diremos que {xk }∞ k=1 converge hacia x o que x es el límite de la sucesión {xk }k=1 , y escribiremos l´ım xk = x o xk −→ x. k→∞

k→∞

El límite de una sucesión, si existe, es único. Observación 1.34. Es sencillo comprobar a partir de la definición que una sucesión {xk }∞ k=1 converge hacia x si, y sólo si, l´ım kxk − xk = 0. k→∞

Definición 1.35. El conjunto {xk : k ∈ N} se denomina rango o conjunto de términos de la sucesión {xk }∞ k=1 . El rango de una sucesión puede ser finito o infinito. Se dice que la sucesión está acotada si lo está su rango. Proposición 1.36. Toda sucesión convergente está acotada. Si x = (x1 , x2 , . . . , xn ) ∈ Rn es inmediato comprobar que se verifica |xi | ≤ kxk ,

i = 1, 2, . . . , n ,

desigualdad también válida para las otras dos normas que hemos destacado: k k1 y k k∞ . A partir de las propiedades de sucesiones de números reales se obtienen fácilmente los siguientes resultados. n Proposición 1.37. Sea {xk }∞ k=1 una sucesión de elementos de R . Escribamos

xk = (x1,k , x2,k , . . . , xn,k ), La sucesión {xk }∞ k=1 converge hacia convergen hacia xj , reales {xj,k }∞ k=1

k ∈ N.

x = (x1 , x2 , . . . , xn ) si, y sólo si, las sucesiones de números para j = 1, 2, . . . , n.

Corolario 1.38. Toda sucesión acotada de Rn tiene una subsucesión convergente. ∞ n ∞ Corolario 1.39. Sean {xk }∞ k=1 , {y k }k=1 dos sucesiones de elementos de R y {αk }k=1 una su∞ n ∞ cesión de números reales. Supongamos que {xk }k=1 converge hacia x ∈ R , {y k }k=1 converge hacia y ∈ Rn y {αk }∞ k=1 converge hacia α ∈ R. Entonces:

I)

II ) III) IV )

l´ım (xk + y k ) = x + y.

k→∞

l´ım αk xk = αx.

k→∞

l´ım (xk · y k ) = x · y.

k→∞

l´ım kxk k = kxk.

k→∞

Proposición 1.40 (Caracterización secuencial de la topología). Sean E un conjunto de Rn y x un punto de Rn . I)

n x es interior a E si, y sólo si, toda sucesión {xk }∞ k=1 de elementos de R que converge hacia x tiene todos sus términos en E, a partir de uno en adelante.

II )

x es un punto adherente a E si, y sólo si, existe una sucesión {xk }∞ k=1 de elementos de E que converge hacia x.

III)

x es un punto de acumulación de E si, y sólo si, existe una sucesión {xk }∞ k=1 de elementos de E, distintos todos ellos de x, que converge hacia x.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

7

1.2. Límites

Como sucede para sucesiones de números reales, el carácter convergente de una sucesión en Rn puede ser determinado sin conocer previamente el valor de su límite. n Definición 1.41. Se dice que una sucesión {xk }∞ k=1 de elementos de R es de Cauchy si para cada número real ε > 0 existe un número natural k0 tal que

kxk − xj k < ε,

para cada par de números naturales j, k ≥ k0 .

Teorema 1.42 (Completitud de Rn ). Una sucesión de puntos de Rn es convergente si, y sólo si, es de Cauchy. Definición 1.43. Sean E un conjunto de Rn , a un punto de acumulación de E y f una aplicación de E en Rm . Se dice que l ∈ Rm es el límite de la función f en a si para cada número real ε > 0 existe δ > 0 tal que para cada x ∈ E con 0 < kx − ak < δ.

kf (x) − lk < ε

Observación 1.44. En la definición anterior intervienen dos normas, una definida en Rn y otra en Rm . La distinción entre ambas viene dada por el contexto. Proposición 1.45. Si la aplicación f tiene límite en el punto a, éste es único. Notación: Si la aplicación f tiene límite l en el punto a se escribe l´ım f (x) = l

x→a

o

f (x) → l, cuando x → a

o

f (x) −→ l. x→a

La noción de límite restringida a subconjuntos de uno dado tiene exactamente la misma aplicación en este caso que en el de funciones de una variable. Definición 1.46. Sean A un subconjunto de Rn , a un punto de acumulación de A y f una aplicación de A en Rm . Si B ⊂ A y a es también punto de acumulación de B, el límite l´ım f | (x) , si existe, se denomina límite de la aplicación f en el punto a siguiendo (o a través x→a

B

de) el subespacio B y se denota por

l´ım f (x) .

x→a x∈B

Teorema 1.47. Sean A un conjunto de Rn , a un punto de acumulación de A y f una aplicación de A en Rm . Son equivalentes: a) f tiene límite l en el punto a. b) Para cada subconjunto B ⊂ A tal que a ∈ B ′ , f tiene límite en a a través de B, y éste es precisamente l. Proposición 1.48 (Criterio secuencial del límite). Sean A un conjunto de Rn , a un punto de acumulación de A y f una aplicación de A en Rm . Son equivalentes: a) f tiene límite en a. b) Para cada sucesión {xk }∞ ım xk = a, la k=1 de puntos de A con xk 6= a, k = 1, 2, . . ., y l´ k→∞

sucesión {f (xk )}∞ k=1 es convergente. Además, si l´ım f (x) = l, se tiene que l´ım f (xk ) = l para toda sucesión {xk }∞ k=1 de puntos de x→a

k→∞

A, distintos de a, y convergente hacia a.

Proposición 1.49. Sean E un conjunto de Rn , a un punto de acumulación de E. Sean f1 , f2 , . . . , fm funciones reales definidas en E y f la aplicación de E en Rm definida por f (x) = f1 (x), f2 (x), . . . , fm (x) , x ∈ E. Entonces

l´ım f (x) = l = (l1 , l2 , . . . , lm ) ∈ Rm

x→a

si, y sólo si, l´ım fi (x) = li ∈ R,

x→a

U NIVERSIDAD DE VALLADOLID

i = 1, 2, . . . , m.

8

Tema 1. Espacios euclídeos

Observación 1.50. Este último resultado permite simplificar el estudio de límites y los conceptos que de éste se derivan, considerando únicamente funciones reales, es decir, aplicaciones de la forma f : E → R, donde E es un subconjunto de Rn . Definición 1.51. Sean A un conjunto de Rn y f una aplicación de A en Rm . Dado B ⊆ A, se dice que f es acotada en B si lo es el conjunto imagen f (B), es decir, si existe una constante M ≥ 0 tal que kf (x)k ≤ M para todo x ∈ B . Cuando f es una función real (es decir, cuando m = 1) y acotada, los valores reales m = ´ınf{f (x) : x ∈ A}

y

M = sup{f (x) : x ∈ A}

se denominan, respectivamente, el extremo inferior absoluto y el extremo superior absoluto de f en A. Si dichos valores se alcanzan, es decir, si existe x1 ∈ A (resp. x2 ∈ A) tal que para todo x ∈ A

m = f (x1 ) ≤ f (x)

(resp. f (x) ≤ f (x2 ) = M

para todo x ∈ A),

se dice que f tiene mínimo absoluto en A igual a m, y que éste se alcanza en x1 (resp. f tiene máximo absoluto en A igual a M , y éste se alcanza en x2 ). Proposición 1.52. Sean A un conjunto de Rn , a un punto de acumulación de A y f una aplicación de A en Rm . Si f tiene límite en a, existe un número real δ > 0 tal que f está acotada en A ∩ B(a, δ). Proposición 1.53. Sean A un subconjunto de Rn y a un punto de acumulación de A. Si f : A → R y g: A → Rm son aplicaciones tales que l´ım f (x) = 0 y g está acotada en A ∩ B(a, δ) x→a para algún número real δ > 0, entonces l´ım f (x) g(x) = 0 .

x→a

Proposición 1.54. Sean E un conjunto de Rn y a un punto de acumulación de E. Supongamos que f , g son dos aplicaciones de E en Rm y λ es una función de E en R tales que l´ım f (x) = α,

x→a

l´ım g(x) = β

x→a

y

l´ım λ(x) = ℓ.

x→a

Entonces: I) II ) III) IV )

l´ım (f + g)(x) = α + β.

x→a

l´ım (λf )(x) = ℓα.

x→a

l´ım (f · g)(x) = α · β.

x→a

l´ım

x→a

1 1 = , si ℓ 6= 0 y λ(x) 6= 0 para todo x. λ(x) ℓ

Aparte de las propiedades aritméticas, las funciones reales verifican, respecto al orden, propiedades similares a las de las funciones de una variable. Suponemos al lector familiarizado con éstas y para no abundar en detalles enunciaremos una de ellas, dejándole que adapte el resto (como el criterio del Sándwich) al caso de funciones de varias variables. Proposición 1.55. Sean A un conjunto de Rn , a un punto de acumulación de A y f una función de A en R. Si existe l´ım f (x) = ℓ 6= 0, se tiene que: x→a

I) II )

Si ℓ > 0, dados números reales α y β con 0 < α < ℓ < β, existe un número real δ > 0 tal que para cada x ∈ A ∩ B(a, δ) con x 6= a, se verifica que α < f (x) < β.

Si ℓ < 0, dados números reales α y β con α < ℓ < β < 0, existe un número real δ > 0 tal que para cada x ∈ A ∩ B(a, δ) con x 6= a, se verifica que α < f (x) < β.

Es decir, f toma valores con el mismo signo que el del límite en los puntos de un entorno adecuado de a distintos de él. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

1.3. Continuidad

9

1.2.1. Límites iterados A la hora de abordar el estudio de la existencia de límites para funciones definidas en conjuntos de Rn , con n ≥ 2, puede parecer tentador proceder reduciendo el problema al estudio de límites en una sola variable, concretamente: fijando n − 1 coordenadas en un primer paso, se pasa al límite en la restante, obteniendo valores que dependen de n − 1 variables; se fijan ahora n − 2 de ellas, y se reitera el proceso, obteniendo los denominados límites iterados. Lamentablemente, la existencia de dichos límites no garantiza la existencia del límite; ahora bien, en caso de que existan todos los límites, deben coincidir. Para fijar ideas y atendiendo a una mayor simplicidad, enunciaremos el resultado para el caso de una función real definida en un subconjunto de R2 . Teorema 1.56. Sean f una función real definida en un conjunto A de R2 y (α, β) ∈ A′ . Se supone que existe l´ım f (x, y) = ℓ , (x,y)→(α,β)

y que, para cada x fijo, existe l´ım f (x, y) = ϕ(x) . y→β

Si existe el límite iterado l´ım ϕ(x) = l´ım

x→α

x→α

l´ım f (x, y) ,

y→β

su valor coincide con ℓ. En consecuencia, si existen los dos límites iterados, pero l´ım l´ım f (x, y) 6= l´ım l´ım f (x, y) , x→α

y→β

y→β

x→α

la función f no puede tener límite en el punto (α, β). Observaciones 1.57. I)

La existencia del límite de una función en un punto no garantiza que existan los límites iterados, como pone de manifiesto el ejercicio 1.19.V.

II )

Puede ocurrir que alguno de los límites iterados sea infinito, en este caso no es difícil probar que el límite de la función no existe.

1.3. Continuidad Definición 1.58. Sean E un conjunto de Rn , a un punto de E y f una aplicación de E en Rm . Se dice que f es continua en a si para cada número real ε > 0 existe δ > 0 tal que kf (x) − f (a)k < ε para cada x ∈ E con kx − ak < δ. Si f es continua en todos los puntos de E, se dice que f es continua en E. Proposición 1.59. Sean E un conjunto de Rn , a un punto de E y f una aplicación de E en Rm . I) II )

Si a es un punto aislado de E, entonces f es continua en a. Si a es un punto de acumulación de E, entonces f es continua en a si, y sólo si, existe l´ım f (x) y es igual a f (a). x→a

Corolario 1.60 (Criterio secuencial de la continuidad). Sean E un conjunto de Rn , a un punto de E y f una aplicación de E en Rm . Son equivalentes: a) f es continua en a. ∞ b) Para cada sucesión {xk }∞ k=1 de puntos de E que converge hacia a, la sucesión {f (xk )}k=1 converge hacia f (a) .

U NIVERSIDAD DE VALLADOLID

10

Tema 1. Espacios euclídeos

Teorema 1.61. Sean E un subconjunto de Rn y a un punto de E. Sean f1 , f2 , . . . , fm , funciones reales definidas en E y f la aplicación de E en Rm dada por f (x) = f1 (x), f2 (x), . . . , fm (x) , x ∈ E.

Entonces f es continua en a si, y sólo si, cada una de las funciones f1 , f2 , . . . , fm , es continua en a. Proposición 1.62. Sean E un conjunto de Rn y a un punto de E. Sean f , g aplicaciones de E en Rm y λ una función de E en R. Supongamos que f , g y λ son continuas en a. Entonces las funciones 1 , si λ(x) 6= 0 para todo x ∈ E; f + g; λf ; f · g; λ son continuas en a. Teorema 1.63. Sean E y F subconjuntos de Rn y Rm , respectivamente. Sean f : E → F continua en a ∈ E y g: F → Rp continua en f (a) ∈ F , respectivamente. Entonces la función compuesta g ◦ f es continua en a ∈ E. Definición 1.64 (Topología de subespacio). Sea E un conjunto de Rn . Se dice que un subconjunto A de E es abierto (resp. cerrado) en E si existe un conjunto U abierto (resp. cerrado) en Rn tal que A = E ∩ U. Observación 1.65. Cuando E es abierto los abiertos en E son abiertos de Rn , y cuando E es cerrado los cerrados en E son cerrados en Rn . Proposición 1.66 (Caracterización topológica de la continuidad). Sean E un conjunto de Rn y f una aplicación de E en Rm . Son equivalentes las siguientes afirmaciones: a) La aplicación f es continua en E. b) Para cualquier abierto A de Rm , el conjunto f −1 (A) es abierto en E. c) Para cualquier cerrado C de Rm , el conjunto f −1 (C) es cerrado en E. Ejemplos 1.67. I) II )

La norma euclídea es una función continua en Rn . La proyección i-ésima πi : Rn → R, definida por

πi (x1 , x2 , . . . , xn ) = xi ,

n

es una función continua en R . III)

En general, cualquier aplicación lineal L: Rn → Rm es continua (sobre este punto se volverá más adelante).

IV )

El conjunto {(x, y) ∈ R2 : x sen(y) > 0} es abierto en R2 , pues es la imagen inversa del intervalo (0, ∞), abierto de R, por la función f : R2 → R dada por f (x, y) = x sen(y), que es continua.

V)

El conjunto {(x, y, z) ∈ R3 : x2 + y 2 − z 2 = 0} es cerrado en R3 .

Definición 1.68. Sean E un conjunto de Rn y f una aplicación de E en Rm . Se dice que f es uniformemente continua en E si para cada número real ε > 0 existe δ > 0 tal que para todos x, y ∈ E con kx − yk < δ.

kf (x) − f (y)k < ε

Observación 1.69. Es claro que cualquier aplicación uniformemente continua en un conjunto E es continua en E, pero no recíprocamente. Proposición 1.70. Sean E un subconjunto de Rn y f : E → Rm uniformemente continua. ∞ Entonces, para cada sucesión {xk }∞ k=1 de Cauchy en E , la sucesión {f (xk )}k=1 es de Cauchy m en R . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

1.3. Continuidad

11

1.3.1. Aplicaciones lineales y bilineales En el Cálculo Diferencial juegan un papel fundamental el tipo de aplicaciones de cuya continuidad nos ocupamos ahora; las primeras, en la propia definición de diferenciabilidad, y las segundas, a la hora de estudiar los problemas de extremos relativos. Definición 1.71. Se dice que una aplicación L: Rn → Rm es lineal si

para todos x, y ∈ Rn y λ, µ ∈ R .

L(λ x + µy) = λ L(x) + µ L(y) Observaciones 1.72. I) II )

Las proyecciones πj , j = 1, 2, . . . , n, son aplicaciones lineales en Rn . Fijadas las bases estándar en Rn y Rm , respectivamente, toda aplicación lineal L: Rn → Rm se representa respecto a dichas bases, de forma única, mediante una matriz A ∈ Mm,n (R), donde Mm,n (R) representa el espacio de las matrices de números reales formadas por m filas y n columnas. Concretamente, si y = L(x), entonces      y1 a11 a12 · · · a1n x1 a a · · · a x   y2     21 22 2n  .  = y t = A xt =  .  .2  . .. ..  ..  .   ..   ..  . . . . am1 am2 · · · amn xn ym

Teorema 1.73. Sea L: Rn → Rm una aplicación lineal. Existe una constante M ≥ 0 tal que para todo x ∈ Rn .

kL(x)k ≤ M kxk

En particular, L es uniformemente continua en todo Rn .

Definición 1.74. Se dice que una aplicación B: Rn × Rn → Rm es bilineal si es lineal en cada componente, es decir, si B(λ x1 + µ x2 , y) B(x, λ y 1 + µ y 2 )

= =

λ B(x1 , y) + µ B(x2 , y) λ B(x, y 1 ) + µ B(x, y 2 )

Una aplicación bilineal B se dice simétrica si B(x, y) = B(y, x)

para todos x1 , x2 , y ∈ Rn y λ, µ ∈ R , para todos x, y 1 , y 2 ∈ Rn y λ, µ ∈ R .

para todos x, y ∈ Rn .

Observaciones 1.75. I) II )

El producto interno en Rn , B(x, y) = hx, yi, es una aplicación bilineal simétrica.

Fijada la base estándar de Rn , toda aplicación bilineal B: Rn × Rn → R se representa de forma única mediante una matriz A ∈ Mn,n (R), concretamente B(x, y) = x A y t .

Teorema 1.76. Sea B: Rn × Rn → Rm una aplicación bilineal. Existe una constante M ≥ 0 tal que kB(x, y)k ≤ M kxk kyk para todos x, y ∈ Rn . En particular, B es continua en todo Rn × Rn .

Observación 1.77. Una forma cuadrática en Rn , que es una función definida por un polinomio homogéneo de grado 2, es decir, de la forma X Q(x1 , x2 , . . . , xn ) = cij xi xj , cij ∈ R , 1≤i≤j≤n

se puede interpretar como la actuación de una aplicación bilineal simétrica B sobre el punto (x, x) ∈ Rn × Rn : Q(x) = B(x, x) = x A xt . Los coeficientes de la matriz A = aij 1≤i,j≤n vienen dados por aii = cii y aij = aji = cij/2 si i < j . U NIVERSIDAD DE VALLADOLID

12

Tema 1. Espacios euclídeos

1.4. Compacidad Definición 1.78. Una familia {Ai }i∈I de subconjuntos de Rn se denomina recubrimiento de un conjunto E de Rn si E ⊂ ∪ Ai . i∈I

Si todos los conjuntos Ai , i ∈ I , son abiertos se dice que {Ai }i∈I es un recubrimiento abierto de E . Se dice que un conjunto K de Rn es compacto si todo recubrimiento abierto de K admite un subrecubrimiento finito, es decir, si para cada recubrimiento abierto {Gi }i∈I de K existe una subfamilia finita {Gi1 , Gi2 , . . . , Gim } tal que K ⊂ Gi1 ∪ Gi2 ∪ . . . ∪ Gim . Ejemplos 1.79. I) II )

Los conjuntos finitos son conjuntos compactos. Si {xk }∞ k=1 converge hacia x , el conjunto {xk : k ∈ N} ∪ {x} es compacto.

Proposición 1.80. Sean F, K dos conjuntos de Rn . Supongamos que F es cerrado, K es compacto y F ⊂ K. Entonces F es compacto. En otras palabras, los subconjuntos cerrados de conjuntos compactos son compactos. Proposición 1.81. Todo intervalo cerrado y acotado de Rn es compacto. Teorema 1.82. Sea K un subconjunto de Rn . Son equivalentes las siguientes propiedades: a) K es cerrado y acotado. b) K es compacto. c) Todo subconjunto infinito de K tiene un punto de acumulación en K . ∞ d) Cada sucesión {xk }∞ k=1 de elementos de K admite una subsucesión {xkj }j=1 que converge hacia un punto de K .

Observación 1.83. La equivalencia de los asertos a) y b) en el teorema anterior se conoce con el nombre de teorema de Heine-Borel. La implicación a)⇒c) se conoce como teorema de Bolzano-Weierstrass. Teorema 1.84 (de Weierstrass, versión general). Sean E un conjunto de Rn y f una aplicación continua de E en Rm . Si K es un subconjunto compacto de E, entonces f (K) es compacto. Teorema 1.85 (de Weierstrass para funciones escalares). Sea f una función real definida y continua en un conjunto compacto K de Rn . Entonces f es acotada y alcanza sus extremos absolutos, es decir, existen dos puntos x e y de K tales que f (x) ≤ f (z) ≤ f (y)

para todo z ∈ K.

Proposición 1.86. Sea K un conjunto compacto de Rn . Supongamos que f es una aplicación inyectiva y continua de K en Rm . Entonces la aplicación inversa f −1 definida en f (K) es continua. Observación 1.87. Dados A ⊂ Rn y B ⊂ Rm , si f : A → B es biyectiva y continua, y también f −1 : B → A es continua, se dice que f es un homeomorfismo. Esta es una noción topológica, es decir, se puede establecer únicamente en términos de conjuntos abiertos: la condición necesaria y suficiente para que una biyección f : A ↔ B sea homeomorfismo es que verifique la siguiente propiedad: “V ⊂ A es abierto en A si, y sólo si, f (V ) es abierto en B”. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

1.4. Compacidad

13

Teorema 1.88 (de Heine-Cantor). Sean K un conjunto compacto de Rn y f una aplicación continua de K en Rm . Entonces f es uniformemente continua en K. Proposición 1.89 (Propiedades de separación). Sea A, B subconjuntos no vacíos de Rn . I) II )

x ∈ A si, y sólo si, d(x, A) = 0 .

La función g(x) = d(x, A) es uniformemente continua en Rn .

Si A, B son ambos cerrados y disjuntos entre sí, entonces la función f : Rn → R dada por d(x, A) es continua en Rn , f (x) = 0 si x ∈ A , y f (x) = 1 si x ∈ B. f (x) = d(x, A) + d(x, B) IV ) Si A, B son cerrados y disjuntos entre sí, entonces existen dos abiertos disjuntos U, V de Rn tales que A ⊂ U y B ⊂ V .

III )

V)

VI )

Más general, si A ∩ B = A ∩ B = Ø , existen entonces dos abiertos U y V tales que A ⊆ U , B ⊆ V y U ∩ V = Ø.

Si A, B son disjuntos, A cerrado y B compacto, entonces d(A, B) > 0. De hecho, existe un punto b ∈ B tal que d(B, A) = d(b, A) .

Observaciones 1.90. I)

La propiedad enunciada en 1.89.III, de separación de cerrados por funciones continuas, se conoce como Lema de Urysohn en el contexto de la Topología General.

II )

En Topología se denomina espacio normal al que verifica la propiedad de separación de cerrados 1.89.IV. En consecuencia, los espacios euclídeos (y, en general, los espacios métricos) son normales.

1.4.1. Comentarios sobre espacios normados Los siguientes resultados se presentan como una llamada de atención, para prevenir al lector de la tentación de generalizar a espacios métricos cualesquiera las propiedades topológicas de Rn . Esta materia es propia de un curso de Análisis Funcional, por lo que nos limitamos a señalar unos pocos puntos significativos. Como se puede ver, las diferencias son motivadas por la dimensión algebraica (infinita) del espacio vectorial. Definición 1.91. Se dice que dos normas ̺1 , ̺2 definidas sobre el mismo espacio vectorial V son equivalentes si existen constantes N, M > 0 tales que N ̺1 (x) ≤ ̺2 (x) ≤ M ̺1 (x)

para todo x ∈ V.

Teorema 1.92. En Rn (en general, en cualquier espacio vectorial de dimensión finita) todas las normas son equivalentes. Teorema 1.93 (de Riesz). Un espacio vectorial normado es de dimensión finita si, y sólo si, todo bola cerrada es compacta. Observaciones 1.94. I)

El teorema 1.92 implica en particular que las topologías asociadas a las distintas normas coinciden, y permite utilizar a todos los efectos, en el estudio de las propiedades topológicas (abiertos, cerrados, etc.) y métricas (acotación, sucesiones de Cauchy, etc.), cualquier norma; es decir, en todos los resultados enunciados anteriormente la norma euclídea puede ser sustituida por otra cualquiera (ver ejercicio 1.9).

II )

De hecho esta propiedad caracteriza los espacios de dimensión finita; es decir, en un espacio normado de dimensión infinita es posible definir una nueva norma no equivalente a la original.

III )

Es inmediato que si toda bola cerrada es compacta también lo es todo cerrado y acotado. El teorema de Riesz establece que en un espacio normado de dimensión infinita existen conjuntos cerrados y acotados, pero no compactos.

IV )

El teorema 1.73 no es válido en espacios normados X de dimensión infinita; esto es, existen aplicaciones lineales Λ: X → R no continuas.

U NIVERSIDAD DE VALLADOLID

14

Tema 1. Espacios euclídeos

1.5. Conexión El concepto que tratamos ahora generaliza la noción de intervalo en el sentido de conjunto “sin componentes aisladas”. Para ilustrar su importancia haremos notar que el hecho de que una función real de variable real tenga derivada nula en todo punto de un abierto no implica que la función sea constante, a menos que su dominio de definición sea un intervalo. En el caso de la recta este concepto tiene una fácil interpretación geométrica a partir de la relación de orden allí definida, pero si n > 1, la imposibilidad de definir una relación de orden en Rn que goce de las mismas propiedades hace necesario un tratamiento más minucioso. En todo caso, en las aplicaciones usuales, es suficiente considerar conjuntos convexos o estrellados, que definimos más adelante. Definición 1.95. Se dice que un conjunto A de Rn es no conexo si existen dos conjuntos abiertos U y V que verifican las siguientes propiedades: I) II ) III)

A⊂U ∪V.

A ∩ U 6= Ø, A ∩ V 6= Ø.

A ∩ U ∩ V = Ø.

En caso contrario, se dice que A es conexo. Proposición 1.96. Un conjunto A de Rn es no conexo si, y sólo si, existen dos conjuntos cerrados E y F que verifican las siguientes propiedades: I) II ) III)

A ⊂ E ∪ F.

A ∩ E 6= Ø, A ∩ F 6= Ø. A ∩ E ∩ F = Ø.

Ejemplo 1.97. Los intervalos (incluyendo en este concepto al conjunto vacío y a los conjuntos unipuntuales) son los únicos conjuntos conexos de R. En este sentido, es útil convenir que un intervalo de la recta es un conjunto I ⊂ R que verifica la siguiente propiedad: “Si x, y ∈ I y x ≤ z ≤ y , entonces también z ∈ I”, o dicho de forma más coloquial, si I contiene a dos puntos, también contiene a todos los puntos intermedios a ellos. Proposición 1.98. Sean E un conjunto de Rn y f una aplicación continua de E en Rm . Si A es un subconjunto conexo de E, entonces f (A) es conexo. Observación 1.99. Cuando el resultado anterior se aplica a funciones reales de variable real lo que se obtiene no es otra cosa que la propiedad de Darboux. Proposición 1.100. Sea {Ai }i∈I una familia de conjuntos conexos de Rn tales que Ai ∩Aj 6= Ø para cada par de índices i, j ∈ I . Entonces la unión ∪ Ai es un conjunto conexo. i∈I

Corolario 1.101. Sea {Ai }i∈I una familia de conjuntos conexos de Rn tal que la intersección ∩ Ai es no vacía. Entonces la unión ∪ Ai es un conjunto conexo. i∈I

i∈I

Corolario 1.102. Sean A ⊂ Rn y a ∈ A . Si para cada x ∈ A existe un conexo Cx tal que {a, x} ⊂ Cx ⊂ A , entonces A es conexo. n Corolario 1.103. Sea {Ak }∞ k=1 una sucesión de conjuntos conexos de R tales que ∞

Ak ∩ Ak+1 6= Ø

para todo k ∈ N .

Entonces la unión ∪ Ak es un conjunto conexo. k=1

Proposición 1.104. Sea A un conjunto conexo de Rn . Si B es un conjunto de Rn tal que A ⊂ B ⊂ A,

entonces B es conexo. Por tanto, A es conexo si lo es A. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

1.5. Conexión

15

Definición 1.105. Sean E un conjunto de Rn y x un punto de E. Llamaremos componente conexa de E que contiene a x a la unión de todos los subconjuntos conexos de E que contienen a x. En otras palabras, la componente conexa de E que contiene a x es el mayor conjunto conexo contenido en E y que contiene a x. Si A es una componente conexa de E que contiene a algún punto de E, diremos que A es una componente conexa de E. Proposición 1.106. Todo conjunto E ⊂ Rn es unión disjunta de sus componentes conexas. Proposición 1.107. Si A es un subconjunto abierto de Rn las componentes conexas de A son conjuntos abiertos. Observación 1.108. Los dos resultados anteriores tienen una lectura muy sencilla en R: cada abierto de la recta real es unión disjunta de intervalos abiertos. Definición 1.109. Se dice que un subconjunto A de Rn es arco-conexo o conexo por caminos si para cada par de puntos x, y de A, existe una aplicación continua de un intervalo compacto de R en A, γ: [a, b] → A, tal que γ(a) = x

y

γ(b) = y.

En las condiciones anteriores, la aplicación γ recibe el nombre de arco o camino, los puntos γ(a) y γ(b) se denominan extremos del arco, y se dice que γ une los puntos x e y. Ejemplos 1.110. I)

Se dice que un conjunto A ⊂ Rn es estrellado respecto de un punto a ∈ A si para cada x de A el segmento de extremos a y x está totalmente contenido en A , es decir, si se tiene que t a + (1 − t) x ∈ A para todo t ∈ [0, 1] . Los conjuntos estrellados son arco-conexos.

II )

Se dice que un conjunto A ⊂ Rn es convexo si para cada par de puntos x, y de A el segmento de extremos x e y está totalmente contenido en A , es decir, si se tiene que t x + (1 − t) y ∈ A para todo t ∈ [0, 1] . Los conjuntos convexos son estrellados respecto de cada uno de sus puntos y, por tanto, arco-conexos. En particular, los siguientes conjuntos son arco-conexos: Rn , los subespacios afines de Rn (como rectas y planos), las bolas abiertas y las bolas cerradas (relativas a cualquier norma).

Proposición 1.111. Todo subconjunto arco-conexo de Rn es conexo. Observación 1.112. El recíproco de la proposición anterior no es cierto. Por ejemplo, el grafo de la función f : R → R dada por sen 1/x , x > 0, f (x) = 0, x ≤ 0, es un conjunto conexo de R2 que no es arco-conexo.

No obstante, cuando se consideran conjuntos abiertos, se verifica la equivalencia de ambos conceptos, lo que proporciona una herramienta deductiva muy útil: Proposición 1.113. Si A es un conjunto abierto y conexo de Rn , entonces A es arco-conexo.

U NIVERSIDAD DE VALLADOLID

16

Tema 1. Espacios euclídeos

Ejercicios 1.1 Determinar los subconjuntos de R2 tales que las relaciones: y I ) z = log x2 + y 2 − 1 II ) z = log(1 − x y) p III) z = x cos(y) q sen x2 + y 2 IV ) z = 2 V ) z = log x + y p VI ) z = 1 − (x2 + y 2 )

definen funciones (x, y) 7→ z de dichos conjuntos en R (es decir, determinar los dominios más generales de las funciones definidas por estas expresiones). 1.2 Demostrar que el conjunto A = {(x, y, z) ∈ R3 : y 2 − z 2 ≥ 9, x2 + y 2 ≤ 25} es acotado. ¿Lo es el conjunto B = {(x, y, z) ∈ R3 : y 2 − z 2 ≥ 9}? 1.3 Probar que: I) II ) III)

El conjunto A = {(x, y) ∈ R2 : x y > 1} es un abierto de R2 .

El conjunto B = {(x, y) ∈ R2 : x y ≤ 1} es un cerrado de R2 .

El conjunto C = {(x, y, z) ∈ R3 : 0 ≤ z ≤ x2 + y 2 ≤ 4} es un cerrado y acotado de R3 .

1.4 Sea M un subespacio lineal de Rn . Probar que: I) II )

Si M 6= {0}, entonces M es un conjunto no acotado.

Si M tiene interior no vacío, entonces M = Rn .

1.5 Determinar el interior, la adherencia, el derivado y la frontera de los siguientes subconjuntos de R3 : I) II )

A = {(x, y, z) ∈ R3 : x + y + z = 0}.

B = {(x, y, z) ∈ R3 : z > 0 , x2 + y 2 < 1 , x2 + y 2 + z 2 ≤ 5}.

1.6 Sea A un subconjunto numerable de Rn . I) II )

Probar que el interior de A es vacío. ¿Es cierto que la adherencia de A es numerable?

1.7 Sean n un número natural y α un número real estrictamente positivo. Para cada k ∈ N se considera el conjunto n n X α2 o 1 2 ≤ 2 . xj − Ak = (x1 , x2 , . . . , xn ) ∈ Rn : k k j=1 I) II )

Probar que, si

√ n ≤ α, entonces para cada k = 1, 2, . . . se tiene que Ak ⊂ A1 .

Determinar los valores de α para los cuales el conjunto

∞

∪ Ak no es un cerrado de Rn .

k=1

1.8 Sean A ⊂ Rn , B ⊂ Rm . Probar que la frontera de A × B en Rn × Rm es Fr(A × B) = Fr(A) × B ∪ A × Fr(B) . 1.9 Determinar las mínimas constantes A, B, C y D para las que se verifican las siguientes desigualdades para todo x ∈ Rn : kxk ≤ A kxk1 ,

LATV

kxk1 ≤ B kxk ,

kxk ≤ C kxk∞ ,

kxk∞ ≤ D kxk .

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

17

Ejercicios

1.10 Sea BQ la familia de todas las bolas abiertas de Rn centradas en puntos de coordenadas racionales y de radio racional. I)

Probar que para todo abierto A de Rn , existe una subfamilia {Bi : i ∈ IA } de elementos de BQ tal que A = ∪ Bi . i∈IA

II ) III ) IV )

Deducir que todo conjunto E ⊂ Rn posee un subconjunto D numerable y denso en E. Deducir que todo subconjunto discreto de Rn es numerable.

Sea {Uλ : λ ∈ L} una familia de abiertos no vacíos de Rn tales que Uλ ∩ Uµ = Ø si λ 6= µ . Probar que L es numerable.

1.11 Sea F un subconjunto cerrado de Rn . Demostrar que existe un conjunto K tal que Fr(K) = F . Sugerencia: Considerar un subconjunto numerable y denso en F .

1.12 Sean E ⊂ Rn y f : E → R . Demostrar que el conjunto de puntos donde f alcanza un máximo relativo estricto es numerable. Nota: Se dice que f tiene en x0 ∈ E un máximo relativo estricto si existe un entorno V de x0 tal que f (x) < f (x0 ) para cada x ∈ V ∩ E con x 6= x0 .

1.13 Sea A un subconjunto no numerable de Rn . Mediante un razonamiento secuencial, probar que A tiene al menos un punto de acumulación. Sugerencia: Para algún k ∈ N ha de ser infinita la intersección A ∩ B(0, k).

1.14 Sea f una función real definida en una bola B(x0 , r) ⊂ R2 . Probar que f tiene límite ℓ en el punto x0 = (x0 , y0 ) si, y sólo si, existe un número real R, 0 < R < r, tal que para todo ρ ∈ (0, R) se tiene que n o g(ρ) = sup f x0 + ρ cos(θ), y0 + ρ sen(θ) − ℓ : θ ∈ [0, 2 π] < ∞ , y la función g: (0, R) → [0, ∞) así definida verifica que l´ım g(ρ) = 0 . ρ→0

1.15 Determinar, si existen, los límites de las siguientes aplicaciones en los puntos que se indican: (x − 1) + y , (x, y) 6= (1, 1), en el punto (1, 1). I ) f (x, y) = (x − 1)2 + (y − 1)2 II )

f (x, y) =

(1 + x2 + y 2 ) sen(y) , y 6= 0, en el punto (0, 0). y

|y| −|y|/x2 e , x 6= 0, en el punto (0, 0). x2 √ 1 − cos x y IV ) f (x, y) = , x, y > 0, en el punto (0, 0). y p 1 − cos x2 + y 2 V ) f (x, y) = , (x, y) 6= (0, 0), en el punto (0, 0). x2 + y 2

III )

f (x, y) =

e−|x+y| − 1 , x + y 6= 0, en el punto (0, 0). |x + y| 2 2 2 2 x y , (x, y) 6= (0, 0), en el punto (0, 0). VII ) f (x, y) = x + y VI )

f (x, y) =

xy , (x, y) 6= (0, 0), en el punto (0, 0). |x| + |y| x2 y , cos(x + y) , (x, y) 6= (0, 0), en el punto (0, 0). IX ) f (x, y) = x2 + y 2 (x − 1)(y − 1) y−1 , (x, y) 6= (1, 1), en el punto (1, 1). , X ) f (x, y) = 1 + (x − 1)2 + (y − 1)2 (x − 1)2 + (y − 1)2 xy 1 + xy e −1 , x, y > 0, en el punto (0, 0). XI ) f (x, y) = , log x x

VIII)

f (x, y) =

U NIVERSIDAD DE VALLADOLID

18

Tema 1. Espacios euclídeos

1.16 Estudiar la existencia del límite en 0 ∈ Rn de las siguientes funciones: sen(kxk)2 , x 6= 0. I ) f (x) = 2 kxk log(1 − kxk) II ) f (x) = , 0 < kxk < 1. 2 kxk log(1 + x1 x2 · · · xn ) III) f (x) = , xi > 0, i = 1, 2, . . . , n. x1 x2 · · · xn

1.17 Para cada uno de los siguientes subconjuntos S ⊆ R2 : a) S = (x, y) : y = ax , b) S = (x, y) : y = ax2 , c) S = {(x, y) : y 2 = ax},

d) S = R2 ,

hállense los siguientes límites a través del subespacio S: l´ım

(x,y)→(0,0) (x,y)∈S

xy , 2 x + y2

l´ım

(x,y)→(0,0) (x,y)∈S

x2 − y 2 . x2 + y 2

1.18 Si una función de Rn en R tiene el mismo límite en un punto a lo largo de cada recta que pasa por él, ¿tiene la función límite en dicho punto? 1.19 Para las siguientes funciones f : R2 \ {(0, 0)} → R: x2 + y 2 I ) f (x, y) = 2 x + y 2 + (x − y)2 II )

f (x, y) =

x2 y 2 x2 + y 2 + (x − y)2

x2 y 2 x2 y 2 + (x − y)2   sen(xy) si x 6= 0, IV ) f (x, y) = x  y si x = 0 ( (x + y) sen(1/x) sen(1/y ) si x 6= 0 e y 6= 0, V ) f (x, y) = 0 si x = 0 o y = 0   sen(x) − sen(y) si tg(x) 6= tg(y), tg(x) − tg(y) VI ) f (x, y) =  0 si tg(x) = tg(y)

III)

f (x, y) =

x2 + y 2 , x2 + y 4 p  x2 log(1 + y 2 ) si x 6= 0, VIII) f (x, y) = x  0 si x = 0 determinar si existen los siguientes límites, y calcular su valor cuando proceda: l´ım f (x, y). l´ım l´ım f (x, y) , l´ım l´ım f (x, y) , VII)

f (x, y) =

x→0 y→0

y→0 x→0

(x,y)→(0,0)

1.20 Estudiar la continuidad en (0, 0) de la función f : R2 → R definida por   x4 + y 4 si x 6= 0, f (x, y) = x  0 si x = 0.

1.21 Determinar para qué valores de p es continua en (0, 0) la función f : R2 → R definida por   x2 y 2  si (x, y) 6= (0, 0), f (x, y) = (x2 + y 2 )p   0 si (x, y) = (0, 0). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

19

Ejercicios

1.22 Estudiar la continuidad en R3 de la función definida por  x2 y 2 z  si (x, y, z) 6= (0, 0, 0); 6 6 4 f (x, y, z) = x + y + z  0 si (x, y, z) = (0, 0, 0).

1.23 Una función f : Rn → R se dice que es separadamente continua si para cada i = 1, 2, . . . , n, al fijar (a1 , a2 , . . . , an−1 ) ∈ Rn−1 , la función i)

t 7−→ f (a1 , . . . , ai−1 , t , ai , . . . , an−1 )

es continua en R. Pruébese que la función f : R2 → R, dada por   xy si (x, y) 6= (0, 0), f (x, y) = x2 + y 2  0 si (x, y) = (0, 0), es separadamente continua pero no es continua.

1.24 Estudiar la continuidad en Rn de las siguientes funciones:  n+1 x2 · . . . · xn  x1 si x 6= 0; I ) f (x) = f (x1 , x2 , . . . , xn ) = kxk2n  0 si x = 0.  x x · · · x  1 2 n si x 6= 0; kxkn−1 II ) f (x) = f (x1 , x2 , . . . , xn ) =  0 si x = 0.  n  (x1 + x2 + · · · + xn ) si x 6= 0; n−1 kxk III ) f (x) = f (x1 , x2 , . . . , xn ) =  0 si x = 0.

1.25 Sean b ∈ R y f : R2 → R la función dada por  3 2 x −y 2 x −y f (x, y) =  b I)

si x2 6= y; si x2 = y.

¿En qué puntos es discontinua f ?

II )

Determinar el valor que debe atribuirse a b para que la restricción de f a la recta de ecuación x + y = 2 tenga el menor número de discontinuidades.

III )

Si g denota la restricción de f al segmento que une los puntos (0, 2) y (2, 0), para el valor de b hallado en ii), ¿es g una función acotada?

1.26 Demostrar que, si f = (f1 , f2 , . . . , fm ) es una aplicación continua de un conjunto A ⊂ Rn en Rm , entonces la función g: A → R definida por g(x) = m´ın f1 (x), f2 (x), . . . , fm (x) es continua en A.

1.27 Sean E un subconjunto de Rn , x0 ∈ Rn y B1 , B2 , . . . , Bm subespacios de E tales que m

∪ Bi = E y el punto x0 es de acumulación de todos los Bi , 1 ≤ i ≤ m. Sea también f : E → R.

i=1

Se supone que existe y0 ∈ R tal que

l´ım f (x) = y0

x→x0 x∈Bi

Demostrar que

para cada i = 1, 2, . . . , m .

l´ım f (x) = y0 .

x→x0

Comprobar con un contraejemplo que la conclusión del apartado anterior es falsa si se aplica a una familia infinita de subespacios {Bi : i ∈ I} que recubra E. U NIVERSIDAD DE VALLADOLID

20

Tema 1. Espacios euclídeos

1.28 Sea K un compacto de Rn contenido en la bola abierta B(0, 1). Probar que existe un número real r, con 0 < r < 1, tal que K ⊆ B(0, r). 1.29 Sea K un compacto de Rn . Se supone que existe un número real r > 0 tal que para cada par de elementos distintos, x e y, de K se tiene que Demostrar que K es un conjunto finito.

kx − yk ≥ r.

1.30 Demostrar que, si B es un subconjunto no compacto de Rn , existe una función continua y no acotada f : B → R. 1.31 Sean A compacto de Rn , r > 0 y B = ∪ B(x, r). x∈A

Demostrar que B es compacto. 1.32 Sea A un subconjunto abierto de Rn , A 6= Rn . Fijada cualquier norma k k en Rn , y la métrica d asociada, se considera, para cada m ∈ N, el conjunto Km = x ∈ A : kxk ≤ m, d(x, Rn \ A) ≥ 1/m .

Probar que {Km }∞ m=1 es una sucesión expansiva de compactos para A, es decir, que verifica las siguientes propiedades: I) II ) III)

Km es compacto. ◦

Km ⊂K m+1 para todo m ∈ N. ∞

∪ Km = A.

m=1

1.33 ¿Es la intersección de dos conexos de Rn un conjunto conexo? 1.34 Sean A un subconjunto no vacío de Rn con A 6= Rn , a un elemento de A y b un elemento de Rn \ A. Si γ es una aplicación continua de [0, 1] en Rn con γ(0) = a y γ(1) = b, probar que existe un elemento t ∈ [0, 1] tal que γ(t) ∈ Fr(A). 1.35 Sea f : R2 → R una función continua tal que f (−1, 0) > 0 y f (1, 0) < 0. Demostrar que existen infinitos puntos de R2 donde la función se anula. 1.36 Sea f una función continua de [0, 1] en Rn tal que kf (0)k = 1 y kf (1)k = 3. Probar que existe un punto ξ ∈ (0, 1) tal que kf (ξ)k = 2. 1.37 Sea γ : [0, 1] → R2 , γ = (γ1 , γ2 ), continua y tal que γ(0) ∈ B (−5, 0), 1 y γ(1) ∈ B (5, 0), 1 .

Probar que existe un punto t0 ∈ [0, 1] tal que γ1 (t0 ) = γ2 (t0 ).

1.38 Demostrar que el conjunto de componentes conexas de un abierto de Rn es numerable. 1.39 Sea n ≥ 2. I)

II )

Probar que un hiperplano de Rn es cerrado y conexo, pero no compacto.

Demostrar que los subespacios vectoriales de Rn son cerrados y conexos. Sugerencia: Escribir el subespacio como intersección finita de hiperplanos.

1.40 Sea f : Rn → Rm una aplicación continua. Demostrar que su grafo G(f ) = x, f (x) ∈ Rn+m : x ∈ Rn

es un subconjunto cerrado y conexo de Rn+m . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

21

Ejercicios

1.41 Sea L una aplicación lineal de Rn en R no idénticamente nula. I) II )

Probar que no es conexo el conjunto Rn \ Ker(L).

¿Cuántas componentes conexas tiene este conjunto?

1.42 Sean A un conjunto conexo de Rn y a, b dos elementos distintos de A. Si r = ka − bk, demostrar que para cada número real δ, con 0 < δ < r, el conjunto A ∩ {x ∈ Rn : kx − ak = δ}

es no vacío. Deducir que los subconjuntos conexos de Rn que constan de más de un punto son no numerables. 1.43 Sea rx x∈R una familia de números reales estrictamente positivos. Demostrar que el conjunto A = ∪ B (x, 0), rx x∈R

es conexo en R2 . ¿Es compacto?

Estúdiese la misma cuestión para el conjunto B = ∪ B (n, 0), rn . n∈Z

1.44 Sea f un homeomorfismo de [0, 1] en sí mismo. Probar que f , o bien deja fijos los extremos, o bien los intercambia. 1.45 Sean A ( Rn , B ( Rm . Probar que el complementario de A × B en Rn × Rm es conexo. 1.46 Sea A un subconjunto denso de la recta real. Probar que el conjunto B = {(x, y) ∈ R2 : x ∈ A ó y ∈ A}

es un subconjunto denso y conexo de R2 .

1.47 Demostrar que no son homeomorfos entre sí dos cualesquiera de los siguientes conjuntos (en todos que se considera la topología usual): 1) R

2) [0, 1]

4) R2

5) [0, 1] × [0, 1] .

3) {(x, y) ∈ R2 : x2 + y 2 = 1}

Sugerencia: Comparar las propiedades de compacidad y conexión de estos conjuntos o de alguno de sus subconjuntos.

1.48 Sean A ⊂ Rn , B ⊂ Rm conjuntos no vacíos. Probar que es condición necesaria y suficiente para que A × B sea, respectivamente: I)

abierto,

II )

cerrado,

III )

acotado,

IV )

compacto,

V)

conexo,

en Rn × Rm ≃ Rm+n , que así lo sean cada uno de los factores A y B. 1.49 Sean A ⊂ Rn , B ⊂ Rm conjuntos no vacíos, f : A → R, g: B → R . El producto tensorial de las funciones f y g es la función, denotada por f ⊗ g, y definida en A × B por f ⊗ g x1 , x2 , . . . , xn , y1 , y2 , . . . , ym = f (x1 , x2 , . . . , xn ) g(y1 , y2 , . . . , ym ) ,

Si f es continua en a ∈ A y g es continua en b ∈ B, probar que f ⊗ g es continua en el punto c = a1 , a2 , . . . , an , b1 , b2 , . . . , bm ) ∈ A × B. U NIVERSIDAD DE VALLADOLID

22

Tema 1. Espacios euclídeos

Nota: Análogamente se define el producto tensorial de una cantidad finita funciones. Así, por ejemplo, si para cada i = 1, 2, . . . , n se tiene definida fi : Ai → R, donde Ai es un subconjunto de R, el producto tensorial de las funciones fi es la función g = f1 ⊗ f2 ⊗ · · · ⊗ fn , definida en A1 × A2 × · · · × An por g(x1 , x2 , . . . , xn ) = f1 (x1 ) f2 (x2 ) · · · fn (xn ), i.e., (f1 ⊗ f2 ⊗ · · · ⊗ fn )(x) =

n Y

i=1

(fi ◦ πi )(x)

(en esta situación también se dice que la función g es de variables separadas). Aplicando recurrentemente el resultado anterior se deduce que si fi es continua en ci ∈ Ai , i = 1, 2, . . . , n, entonces g es continua en el punto c = (c1 , c2 , . . . , cn ) ∈ A. 1.50 Sean A ⊂ Rn , B ⊂ Rm conjuntos no vacíos, f : A → R, g: B → R . I)

II ) III)

Si f y g son uniformemente continuas en sus respectivos dominios ¿se puede asegurar que f ⊗ g es uniformemente continua en A × B? Pongamos que f y g alcanzan un extremo local en x0 ∈ A, y 0 ∈ B, respectivamente. ¿se puede asegurar que f ⊗ g alcanza un extremo local en (x0 , y 0 )?

Supongamos que A y B son compactos y f y g continuas. ¿existe alguna relación entre los extremos absolutos de f ⊗ g y los de f y g?

Tema 2

Cálculo diferencial La idea fundamental de todo el Cálculo Diferencial es sencilla: tratar de obtener propiedades sobre objetos (en la práctica, funciones) que, sin ser lineales, admiten una cierta “aproximación lineal”. Esta idea queda diluida en el caso de funciones de una variable real por el hecho de que la existencia de tal aproximación equivale a que los cocientes incrementales de la función tengan límite, esto es, que se pueda hablar de “velocidad”, “tasa de crecimiento”, etc., según el contexto o la disciplina científica en que se use. La presentación actual de esta materia difiere bastante de su desarrollo histórico, paralelo al de la Física Matemática, y cuyo germen se puede situar en el uso de derivadas parciales por Euler, D’Alembert, etc. en el siglo XVIII, en el que la continuidad era concebida como una propiedad mucho más fuerte que como se entiende hoy en día, implicando entonces la derivabilidad. Este fundamento casi filosófico, y que prevaleció durante largo tiempo, está recogido en la frase de Leibniz “Natura non facit saltus” (la Naturaleza no da saltos). A pesar de que el tratamiento es el mismo para cualquier dimensión n del espacio euclídeo, para la correcta asimilación y mejor aprovechamiento de la materia que se contempla en este tema, será necesario haber adquirido un sólido conocimiento de los conceptos básicos sobre funciones de una variable real y cierta destreza en su cálculo. Por supuesto, todo lo que se afirme en general (para dimensión arbitraria n) tiene su correspondiente versión en una variable, con la que ya debe estar familiarizado el lector. Pero no recíprocamente; por ejemplo, cuando n > 1 hemos de distinguir entre las nociones de “derivabilidad” y “diferenciabilidad”, coincidentes en el caso n = 1.

2.1. Derivabilidad y diferenciabilidad Cuando se consideran aplicaciones definidas en abiertos de Rn , n > 1, carece de sentido considerar cocientes incrementales de tales aplicaciones y, por tanto, es imposible generalizar el concepto de derivabilidad en esos términos. Lo que sí es posible es generalizar el concepto de derivada a subespacios de dimensión uno. Aparece así el concepto de derivada direccional y, como caso particular, el de derivada parcial. Definición 2.1. Sean A un abierto de Rn , x0 un punto de A y f una aplicación de A en Rm . Dado un elemento v de Rn \ {0}, se dice que f admite derivada direccional en el punto x0 según la dirección de v si existe y es finito el límite 1 l´ım f (x0 + hv) − f (x0 ) ; h→0 h dicha derivada direccional, que es el límite anterior, se denota por dv f (x0 )

o

Dv f (x0 ).

i)

Cuando se considera el vector ei = (0, . . . , 1 , . . . , 0) de la base estándar de Rn , la correspondiente derivada direccional recibe el nombre de derivada parcial de f respecto de xi o derivada parcial i-ésima de f en el punto x0 , y se denota por ∂f (x0 ). ∂xi Si la aplicación f admite derivadas parciales respecto de todas las variables en el punto x0 se dice que es derivable en dicho punto. Cuando f es derivable en todos los puntos de A se dice que es derivable en A. Di f (x0 )

o

23

24

Tema 2. Cálculo diferencial

Observaciones 2.2. I)

A la hora de definir las derivadas direccionales algunos autores consideran exclusivamente vectores unitarios (de norma euclídea 1). Esto no aporta ventajas ni desventajas a la definición y optar por una u otra forma es cuestión de gusto personal. II ) La segunda notación para las derivadas parciales ∂f/∂xi , introducida por Leibniz, es sin duda la de uso más extendido. Al igual que sucede para las funciones de una variable, tal expresión no denota el cociente de dos números; es simplemente, como se ha dicho, una notación. A pesar de su uso corriente en todas las ramas de la Ciencia y su utilidad a la hora de establecer modelos matemáticos (como en ∂f/∂t para significar una derivación respecto de la variable tiempo) debemos tener precaución en su uso; por ejemplo, para una función ∂f (x, x)? A lo de dos variables, en los puntos de la diagonal, ¿cómo debemos entender ∂x largo de estas notas, con el ánimo de que el lector se familiarice con ambas, usaremos la notación de Leibniz y la de los operadores Di , debida a Cauchy. III)

Las derivadas direccionales, como derivadas de funciones de una variable que son, gozan de las propiedades aritméticas de éstas; por ejemplo, si dos aplicaciones definidas en un mismo abierto de Rn admiten derivada parcial respecto de xj en un punto del abierto, entonces la aplicación suma admite derivada parcial respecto de xj en dicho punto y resulta ser la suma de las derivadas parciales de las dos aplicaciones en ese punto: ∂(f + g) ∂f ∂g (x0 ) = (x0 ) + (x0 ) , ∂xi ∂xi ∂xi o para funciones reales f y g Di (f g)(x0 ) = Di f (x0 ) g(x0 ) + f (x0 ) Di g(x0 ) , . . . Dejamos que el lector deduzca el resto de las propiedades que procedan.

IV )

En la práctica y como se comprobará a lo largo de los ejercicios, la anterior observación permite resolver el cálculo de las derivadas parciales mediante la aplicación de las reglas de derivación en una variable a la función que se obtiene al fijar todas las variables menos aquélla respecto de la cual se pretende derivar. Por ejemplo, si f es la función real definida en R2 por f (x, y) = x cos(x − y), entonces D1 f (x, y)

=

D2 f (x, y)

=

∂f (x, y) = cos(x − y) − x sen(x − y) , ∂x ∂f (x, y) = x − sen(x − y) (−1) = x sen(x − y) . ∂y

Ejemplos sencillos, como el que se puede ver en el ejercicio 2.2.III, muestran que el hecho de que una aplicación f sea derivable en un punto no implica la continuidad de f en ese punto; ni siquiera la existencia de todas las derivadas direccionales implica la continuidad. Se presenta así la primera diferencia relevante con las funciones de una variable. No obstante, el concepto de diferenciabilidad, que en el caso unidimensional es equivalente a la derivabilidad, se generaliza en términos análogos al caso de aplicaciones de varias variables. Definición 2.3. Sean A un abierto de Rn , x0 un punto de A y f una aplicación de A en Rm . Se dice que f es diferenciable en el punto x0 si existen una aplicación lineal L de Rn en Rm y una función ε de A en Rm con l´ım kε(x)k = 0, x→x0

de manera que f (x) − f (x0 ) = L(x − x0 ) + ε(x) kx − x0 k

para cada x ∈ A.

La aplicación lineal L, si existe, es única y recibe el nombre de diferencial de f en el punto x0 . Esta aplicación se denota por (df )x0 ,

Df (x0 ),

df (x0 )

o

f ′ (x0 ).

Si f es diferenciable en todo punto de A se dice que es diferenciable en A. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

2.1. Derivabilidad y diferenciabilidad

25

Observaciones 2.4. I)

Las notaciones indicadas arriba para la diferencial de una función en un punto son las más frecuentes. En estas notas utilizaremos habitualmente la última, f ′ , introducida por Lagrange.

II )

En las ciencias aplicadas, como la Física, y sobre todo en los razonamientos heurísticos que conducen al modelado de ciertos fenómenos (generalmente mediante ecuaciones diferenciales) es habitual usar el término “diferencial” para referirse a un incremento “pequeño” de las magnitudes, esto es, a cantidades cuyos cocientes incrementales se aproximan a la derivada, que es un límite. Hacemos énfasis en que, en Matemáticas, una diferencial es una aplicación lineal, perfectamente definida y sin la subjetividad de lo pequeño (un metro puede considerarse pequeño en Astronomía, pero no en Arquitectura).

III )

Una forma equivalente de definir la diferenciabilidad, que puede encontrarse en numerosos textos, es la siguiente: la función f es diferenciable en x0 si, y sólo si, existe una aplicación lineal L de Rn en Rm tal que l´ım

f (x) − f (x0 ) − L(x − x0 ) = 0 ∈ Rm , kx − x0 k

l´ım

kf (x) − f (x0 ) − L(x − x0 )k = 0 ∈ R. kx − x0 k

x→x0

o, lo que es lo mismo, x→x0

De nuevo, al igual que sucede respecto a la continuidad, estos conceptos admiten una lectura en términos de aplicaciones a valores reales: Teorema 2.5. Es condición necesaria y suficiente para que una aplicación f de un abierto A de Rn en Rm admita derivada direccional en un punto x0 ∈ A según el vector v (resp. sea diferenciable en el punto x0 ) que así se verifique para cada una de sus funciones componentes fi , i = 1, 2, . . . , m. Teorema 2.6. Sean A un abierto de Rn , x0 un punto de A y f una aplicación de A en Rm . Si f es diferenciable en x0 entonces es continua en dicho punto. Teorema 2.7. Sean A un abierto de Rn , x0 ∈ A y f una aplicación de A en Rm . Si f es diferenciable en x0 entonces existen las derivadas direccionales en dicho punto según cualquier dirección, en particular, f es derivable en x0 . Además, para cada v ∈ Rn \ {0} se tiene que Dv f (x0 ) = (df )x0 (v) = f ′ (x0 )(v).

Observaciones 2.8. I)

Si A es un abierto de Rn y f : A → Rm es una aplicación derivable en el punto x0 ∈ A, la matriz cuyas m filas son las n derivadas parciales de cada una de las m componentes fi de f , esto es, ∂(f1 , f2 , . . . , fm ) , Dj fi (x0 ) 1≤i≤m , que denotaremos por ∂(x1 , x2 , . . . , xn ) 1≤j≤n se denomina matriz jacobiana 1 de f en el punto x0 . Si, además, f es diferenciable en x0 , entonces la aplicación lineal f ′ (x0 ) viene dada de forma matricial respecto de las bases estándar de Rn y Rm por dicha matriz jacobiana, es decir,    D1 f1 (x0 ) D2 f1 (x0 ) · · · Dn f1 (x0 ) h1     ′ t  D1 f2 (x0 ) D2 f2 (x0 ) · · · Dn f2 (x0 )   h2  (2.1) f (x0 )(h1 , h2 , . . . , hn ) =  .   .. .. .. ..   ...   . . . . hn D1 fm (x0 ) D2 fm (x0 ) · · · Dn fm (x0 )

1 En

honor a C. G. Jacobi.

U NIVERSIDAD DE VALLADOLID

26

Tema 2. Cálculo diferencial

Nótese que las columnas de la matriz jacobiana son las imágenes por f ′ (x0 ) de los elementos ei , i = 1, 2, . . . , n, de la base estándar de Rn , es decir, de acuerdo con el teorema ∂f t t 2.7, la i-ésima columna es (x0 ) = Di f (x0 ) . ∂xi Si f es una función real definida en un abierto A de Rn , derivable en el punto x0 , la matriz jacobiana de f en x0 se denomina también gradiente de f en el punto x0 y se denota por ∇f (x0 ), esto es, ∇f (x0 ) = D1 f (x0 ), D2 f (x0 ), . . . , Dn f (x0 ) . Si f es diferenciable en dicho punto, la fórmula (2.1) se representa también en este caso mediante el producto escalar f ′ (x0 )(h) = ∇f (x0 ) · h . II )

Los teoremas 2.6 y 2.7 proporcionan también una pauta de trabajo para establecer la diferenciabilidad de una función en un punto. En efecto, avanzando en orden de complejidad de los conceptos: en primer lugar, si la función no es continua en el punto en cuestión no puede ser diferenciable; después, si es continua pero no derivable tampoco puede ser diferenciable, si por el contrario es derivable, la única aplicación lineal L candidata a ser la diferencial es la que viene dada en las bases estándar por la matriz jacobiana, con lo que sólo resta aplicar la definición 2.3 o, equivalentemente, estudiar los límites expuestos en la observación 2.4.III.

III)

Es obvio que toda aplicación lineal L: Rn → Rm es diferenciable en cada punto x0 ∈ Rn , y que la diferencial de L en x0 coincide con L, es decir, L′ (x0 )(v) = L(v)

para cada v ∈ Rn .

En particular, las proyecciones πj : Rn → R son diferenciables en Rn . Por otra parte, es sobradamente conocido que si L: Rn → R es una aplicación lineal, entonces existen números reales a1 , a2 , . . . , an únicos tales que n n P P a j πj . aj x j , es decir, L= L(x1 , x2 , . . . , xn ) = j=1

j=1

Por tanto, si A es un abierto de Rn y f : A → R es una función diferenciable en el punto x0 ∈ A se escribirá n X ∂f ∂f ∂f ∂f (x0 ) πj = (x0 ) π1 + (x0 ) π2 + . . . + (x0 ) πn . f ′ (x0 ) = ∂xj ∂x1 ∂x2 ∂xn j=1

A la aplicación lineal dπj = πj ′ (= πj ) se le denota usualmente (abusando de la notación) por dxj . De esta forma es habitual encontrar la siguiente notación: df =

∂f ∂f ∂f dx1 + dx2 + . . . + dxn . ∂x1 ∂x2 ∂xn

Haremos énfasis en que dxj es una aplicación lineal de Rn en R, no un incremento de ninguna magnitud. IV )

La diferencial de una aplicación en un punto tiene la misma interpretación geométrica que en el caso de funciones reales de variable real. Ilustraremos esto con un ejemplo de fácil visualización: Consideremos una función real f definida en un abierto A de R2 que es diferenciable en el punto a = (a1 , a2 ) ∈ A. La función g(x, y) = f (a) +

LATV

∂f ∂f (a)(x − a1 ) + (a)(y − a2 ) ∂x ∂y

proporciona la “mejor aproximación” afín de f . La gráfica de esta función es un plano afín (en R3 ), que contiene al punto a1 , a2 , f (a1 , a2 ) , y se denomina plano tangente a la superficie z = f (x, y) en dicho punto. Los vectores ∂f ∂f 1, 0, (a) y 0, 1, (a) , ∂x ∂y derivadas en el punto t0 = 0 de las aplicaciones t 7→ a1 + t, a2 , f (a1 + t, a2 ) y t 7→ a1 , a2 + t, f (a1 , a2 + t) ,

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

27

2.1. Derivabilidad y diferenciabilidad

respectivamente, resultan ser dos vectores generadores de dicho plano (ver figura 2.1).

z = g(x, y) z = f (x, y)

y = a2

x = a1

Figura 2.1: Plano tangente z = g(x, y) a una superficie z = f (x, y) en un punto. Una condición necesaria para la diferenciabilidad de una función en un punto es la existencia de todas sus derivadas direccionales; sin embargo, tal condición no es suficiente, a menos que se añada la hipótesis de continuidad de dichas derivadas. Concretamente: Teorema 2.9. Sean A un abierto de Rn y f : A → Rm una aplicación derivable en A. Si todas las derivadas parciales de f , excepto quizá una de ellas, son continuas en un punto x0 ∈ A, entonces f es diferenciable en dicho punto. Observación 2.10. Nótese que para n = 1, dado que sólo se puede contemplar una derivada parcial (la derivada ordinaria), el teorema anterior incluye un resultado bien conocido: una función real f definida en un intervalo abierto de la recta es diferenciable en un punto del intervalo si, y sólo si, es derivable en dicho punto. Proposición 2.11. Sean A un abierto de Rn , f , g aplicaciones de A en Rm y h una función de A en R, todas ellas diferenciables en un punto x0 de A. Entonces: I)

f + g es diferenciable en x0 y (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ).

II )

hf es diferenciable en x0 y (hf )′ (x0 ) = h(x0 )f ′ (x0 ) + h′ (x0 )f (x0 ) , es decir, (hf )′ (x0 )(v) = h(x0 )f ′ (x0 )(v) + h′ (x0 )(v)f (x0 )

III )

para cada v ∈ Rn .

p = hf , gi = f · g es diferenciable en x0 y

p′ (x0 ) = hf (x0 ), g ′ (x0 )i + hf ′ (x0 ), g(x0 )i ,

es decir, p′ (x0 )(v) = hf (x0 ), g ′ (x0 )(v)i + hf ′ (x0 )(v), g(x0 )i IV )

para cada v ∈ Rn .

Si h(x) 6= 0 para todo x ∈ A, se tiene que 1/h es diferenciable en x0 y 1 ′ −1 h′ (x0 ). (x0 ) = h h(x0 )2

Teorema 2.12 (Regla de la cadena). Sean A un abierto de Rn , B un abierto de Rm , f una aplicación de A en Rm con f (A) ⊂ B y g una aplicación de B en Rp . Si f es diferenciable en el punto x0 ∈ A y g es diferenciable en el punto y 0 = f (x0 ) ∈ B, entonces la aplicación compuesta h = g ◦ f es diferenciable en el punto x0 ; además, h′ (x0 ) = g ′ (y 0 ) ◦ f ′ (x0 ) = g ′ f (x0 ) ◦ f ′ (x0 ). U NIVERSIDAD DE VALLADOLID

28

Tema 2. Cálculo diferencial

Observación 2.13. La regla de la cadena, junto con la representación matricial de la diferencial descrita en (2.1), permite expresar las derivadas parciales de la función compuesta en términos de las parciales de las funciones componentes. Explícitamente: con las hipótesis y notación del teorema 2.12, m

X ∂gi ∂fk ∂hi (x0 ) = (x0 ) f (x0 ) ∂xj ∂yk ∂xj k=1

para todos i = 1, 2, . . . , p y j = 1, 2, . . . , n.

A partir de la regla de la cadena se obtiene, para funciones de abiertos de Rn en R, el siguiente resultado: Teorema 2.14 (del valor medio). Sean A un abierto convexo de Rn y f : A → R una función diferenciable en A. Dados a, b ∈ A, existe un punto c, situado en el segmento que une a y b, tal que ∂f ∂f (c)(b1 − a1 ) + . . . + (c)(bn − an ). f (b) − f (a) = f ′ (c)(b − a) = ∂x1 ∂xn Observación 2.15. Cuando se consideran aplicaciones a valores vectoriales la fórmula anterior deja de ser válida; como ejemplo, considérese la aplicación f : [0, 2π] → R2 definida por f (t) = cos(t), sen(t) .

El teorema del valor medio adopta en el caso de aplicaciones a valores vectoriales la forma de una desigualdad:

Teorema 2.16. Sean A un abierto convexo de Rn y f : A → Rm una aplicación diferenciable en A. Existe una constante K, independiente de f , tal que para todos a, b ∈ A se tiene que ∂fi ta + (1 − t)b : t ∈ [0, 1], 1 ≤ i ≤ m, 1 ≤ j ≤ n kb − ak . kf (b) − f (a)k ≤ K sup ∂xj Corolario 2.17. Sean A un abierto conexo de Rn (no necesariamente convexo) y f : A → Rm una aplicación diferenciable en A. Si f ′ (x) = 0 para todo x ∈ A, entonces f es constante.

2.2. Derivadas de orden superior A la vista del resultado 2.5, será suficiente considerar, en lo que ahora nos ocupa, únicamente funciones reales definidas en conjuntos abiertos de Rn . Definición 2.18. Sea f una función real definida en un abierto A de Rn , que admite derivadas parciales en todos los puntos de A. Dichas parciales definen, a su vez, funciones de A en R, Dj f : A

−→

x 7−→

R Dj f (x) =

∂f (x), ∂xj

denominadas derivadas parciales primeras de f ; para éstas pueden existir también derivadas parciales en los puntos de A, ∂ ∂f Di (Dj f )(x) = (x), ∂xi ∂xj definiéndose así funciones en A que reciben el nombre de derivadas parciales segundas de la función f , y que se denotan por Dij f (x)

o

∂2f (x). ∂xi ∂xj

Se definen de forma análoga las derivadas parciales de f de orden m superior al segundo: Di1 i2 ...im f (x). Cuando la función f admite derivadas parciales hasta el orden k ≥ 1 en cada punto de A y éstas son continuas en A, se dice que la función es de clase C k en A, y se representa por f ∈ C k (A). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

2.2. Derivadas de orden superior

29

Si f es de clase C k en A para cada k ∈ N se dice que es de clase C ∞ en A y se representa por f ∈ C ∞ (A). Cuando se diga que f es de clase C 0 en A, denotado por f ∈ C 0 (A), se querrá significar que f es continua en A. Definición 2.19. Sea A un abierto de Rn . Se dice que una aplicación f : A → Rm es de clase C k en A si así lo es cada una de sus funciones componentes. Observación 2.20. Si f : A → Rm es una aplicación de clase C k , k ≥ 1, en el abierto A de Rn , entonces f es diferenciable en A (véase el teorema 2.9). Proposición 2.21. Sean A un abierto de Rn , B un abierto de Rm , f : A → B y g: B → Rp , ambas aplicaciones de clase C k en A y B, respectivamente. Entonces la aplicación compuesta h = g ◦ f es de clase C k en A. Al trabajar con funciones sencillas, por ejemplo polinomios en varias variables, se observa que derivadas parciales de orden superior respecto de las mismas variables, pero en distinto orden, son iguales. Los resultados más importantes que justifican esta igualdad de las “parciales cruzadas” son los de Young y de Schwarz (el de Clairaut es una versión anterior, pero más débil de este último, en tanto que exige como hipótesis la existencia y continuidad de todas las derivadas hasta el segundo orden). Teorema 2.22 (de Schwarz). Sean f una función definida en un abierto A de Rn y x0 un punto de A. Si las derivadas parciales ∂f , ∂xi

∂f ∂xj

y

∂2f ∂xi ∂xj

existen en un entorno del punto x0 , siendo además la última continua en dicho punto, en∂2f tonces también existe la derivada parcial (x0 ) y se tiene que ∂xj ∂xi ∂2f ∂2f (x0 ) = (x0 ). ∂xj ∂xi ∂xi ∂xj Teorema 2.23 (de Young). Sean f una función definida en un abierto A de Rn y x0 un punto de A. Si las derivadas parciales ∂f/∂xi y ∂f/∂xj existen en todo punto de A y ambas son diferenciables en x0 , entonces se tiene que ∂2f ∂2f (x0 ) = (x0 ) . ∂xj ∂xi ∂xi ∂xj Observaciones 2.24. I)

En la mayoría de los modelos matemáticos que se utilizan en la investigación científica, las magnitudes involucradas se suponen tan regulares (derivables con continuidad) como sea necesario, y es por tanto usual que en estas situaciones la igualdad de las derivadas cruzadas se asuma, a tenor de los resultados precedentes, sin mayor dificultad. La función cuyo estudio se propone en el ejercicio 2.19 proporciona un sencillo ejemplo en sentido opuesto al de estos teoremas.

II )

A la hora de representar las derivadas parciales de orden superior (o sucesivas), en la notación de Leibniz, se sigue el siguiente criterio de simplificación: al derivar sucesivamente respecto de la misma variable esto se indica mediante un exponente que representa la multiplicidad de esa derivada, esto es, el número de veces que se deriva sobre esa variable; así, la expresión ∂ m1 +m2 +...+mn f mn (x) m2 1 ∂xm 1 ∂x2 . . . ∂xn representa la derivada de orden m1 + . . . + mn de f derivando mi veces respecto de cada variable xi . Los números mi son enteros no negativos; si mi = 0 se entiende que no se deriva respecto de xi , en cuyo caso se omite el correspondiente término ∂xi0 . Para funciones suficientemente regulares, en virtud de los teoremas anteriores, el orden de derivación es irrelevante.

U NIVERSIDAD DE VALLADOLID

30

Tema 2. Cálculo diferencial

2.3. Fórmula de Taylor La fórmula de Taylor para funciones de varias variables tiene el mismo significado conceptual que en el caso de una variable: aproximar localmente una función definida en un abierto A de Rn por un polinomio. Este resultado se deduce fácilmente de la regla de la cadena 2.12 y la fórmula homónima con resto de Lagrange para el caso unidimensional. Teorema 2.25 (Fórmula de Taylor). Sean A un abierto de Rn , f : A → R una función de clase C k+1 en A y x0 ∈ A. Si B(x0 , r) ⊂ A (r > 0), para cada x ∈ B(x0 , r) se tiene que f (x) = f (x0 )

+

n n 1 X ∂f 1 X ∂2f (x0 )hj1 hj2 + . . . (x0 )hj1 + 1! j =1 ∂xj1 2! j ,j =1 ∂xj1 ∂xj2 1

+

1

n X ∂kf 1 (x0 )hj1 hj2 · · · hjk k! j ,...,j =1 ∂xj1 ∂xj2 . . . ∂xjk 1

+

2

k

1 (k + 1)! j

n X

1 ,...,jk+1

∂ k+1 f (x0 + θ h)hj1 hj2 · · · hjk+1 , ∂xj1 ∂xj2 . . . ∂xjk+1 =1

siendo h = x − x0 = (h1 , h2 , . . . , hn ) y θ ∈ (0, 1) un número que depende de x. Observaciones 2.26. I) II )

Si x ∈ B(x0 , r), el segmento de extremos x0 y x está totalmente contenido en B(x0 , r), en particular, el punto x0 + θh pertenece a dicha bola. Haciendo uso del teorema de Schwarz 2.22, la fórmula de Taylor se expresa como f (x) = f (x0 )

k X

+

X

m=1 j1 +...+jn

∂mf 1 (x0 )hj11 hj22 · · · hjnn jn j2 j1 j !j ! · · · j ! . . . ∂x ∂x ∂x 1 2 n n 2 1 =m

X

+

j1 +...+jn =k+1

∂ k+1 f 1 (x0 + θh)hj11 hj22 · · · hjnn , j 1 j1 !j2 ! · · · jn ! ∂x1 ∂xj22 . . . ∂xjnn

donde ji ∈ N ∪ {0} para todo i (se entiende, por convenio, que la derivación respecto de xi ∂mf no se efectúa si ji = 0). Para ello se ha tenido en cuenta que la derivada ∂xj11 ∂xj22 . . . ∂xjnn m! aparece veces al reordenar las variables de todas las formas posibles. j1 !j2 ! · · · jn ! III) Con la notación del teorema 2.25), la diferencia f (x0 + h) −

1 (k + 1)! j

n X

1 ,...,jk+1

∂ k+1 f (x0 + θh)hj1 hj2 · · · hjk+1 ∂xj1 ∂xj2 . . . ∂xjk+1 =1

es un polinomio de grado menor o igual que k en las n variables h1 , h2 , . . . , hn , denominado polinomio de Taylor de orden k de la función f en el punto x0 , y que se denota habitualmente por Tk (f, x0 )(h). IV )

Puesto que f ∈ C k+1 (A), si B es una bola cerrada y acotada (es decir, compacta) centrada en el punto x0 y contenida en A, todas sus derivadas parciales de orden k + 1 están acotadas en dicha bola. Por tanto, si x0 + h ∈ B, el último sumando 1 (k + 1)! j

n X

1 ,...,jk+1

∂ k+1 f (x0 + θh)hj1 hj2 · · · hjk+1 , ∂xj1 ∂xj2 . . . ∂xjk+1 =1

denominado resto de Taylor de orden k, y que denotaremos por Rk (f, x0 )(h), queda acotado como sigue: Rk (f, x0 )(h) ≤ M khkk+1 , siendo M una constante real positiva.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

2.3. Fórmula de Taylor

31

Esa última propiedad caracteriza el polinomio de Taylor de orden k de una función f de clase C k+1 . Explícitamente: Lema 2.27. Sean A un abierto de Rn , f : A → R una función de clase C k+1 en A y x0 ∈ A. El polinomio de Taylor de orden k de f en el punto x0 es el único de entre todos los polinomios P de grado menor o igual que k que verifica que l´ım

h→0

f (x0 + h) − P (h) k

khk

= 0.

Observaciones 2.28. I)

Si A es un abierto de Rn y Di , 1 ≤ i ≤ n, denota la aplicación ∂f f ∈ C k+1 (A) 7−→ Di f = ∈ C k (A) , ∂xi resulta que Di es lineal. Definamos para h = (h1 , h2 , . . . , hn ) ∈ Rn el operador diferencial Dh =

n X

hi D i

i=1

y, para cada m ≤ k + 1, la composición

Dh m = Dh ◦ .m. . ◦Dh : C k+1 (A) → C k+1−m (A).

Dada una función de clase C k en un abierto A ⊂ Rn , si x0 ∈ A y m ≤ k, la aplicación de Rn en R dada por h 7−→ Dh m f (x0 ) recibe el nombre de diferencial de orden m de f en el punto x0 y se denota por f (m) (x0 )

II )

o

dm f (x0 ).

La diferencial de orden m de una función en un punto es una aplicación dada por un polinomio homogéneo de grado m; cuando m = 1 esta aplicación no es otra que la diferencial ordinaria de la función (una aplicación dada por un polinomio homogéneo de grado 1 es lineal). Con esta notación la fórmula de Taylor adquiere una expresión más familiar, acorde con el caso unidimensional: k X 1 1 (m) f (x0 )(h) + f (k+1) (x0 + θh)(h). f (x0 + h) = f (x0 ) + m! (k + 1)! m=1

Es posible mejorar el lema 2.27 en términos del polinomio de Taylor de grado k + 1. Explícitamente, con las mismas hipótesis de aquel resultado y la notación del apartado anterior, se tiene que f (x0 + h) = f (x0 ) +

f ′ (x0 )(h) f (k) (x0 )(h) f (k+1) (x0 )(h) k+1 + ... + + + ε(h) khk , 1! k! (k + 1)!

(2.2)

siendo ε una función tal que l´ım ε(h) = 0.

h→0

En los siguientes ejemplos se presentan versiones particulares de la fórmula de Taylor, correspondientes a dos casos muy comunes. Ejemplos 2.29. I)

Sea f una función de clase C 4 en el disco abierto B(a, r) ⊂ R2 . Para cada h ∈ R2 con khk < r existe un número θ ∈ (0, 1) tal que 1 ∂2f ∂f ∂f ∂2f 1 ∂2f 2 2 (a)h1 + (a)h2 + (a)h + (a)h h + (a)h f (a + h) = f (a) + 1 1 2 2 ∂x ∂y 2 ∂x2 ∂x∂y 2 ∂y 2 1 ∂3f 1 ∂3f 1 ∂3f 1 ∂3f + (a)h1 3 + (a)h1 2 h2 + (a)h1 h2 2 + (a)h2 3 3 2 2 3 6 ∂x 2 ∂x ∂y 2 ∂x∂y 6 ∂y +

1 (4) f (x0 + θh)(h). 4!

U NIVERSIDAD DE VALLADOLID

32

Tema 2. Cálculo diferencial

II )

Sea f una función de clase C 4 en la bola abierta B(a, r) ⊂ R3 . Para cada h ∈ R3 con khk < r existe un número θ ∈ (0, 1) tal que ∂f ∂f ∂f (a)h1 + (a)h2 + (a)h3 f (a + h) = f (a) + ∂x ∂y ∂z 1 ∂2f 1 ∂2f 1 ∂2f + (a)h1 2 + (a)h2 2 + (a)h3 2 2 2 2 ∂x 2 ∂y 2 ∂z 2 ∂2f ∂2f ∂2f (a)h1 h2 + (a)h1 h3 + (a)h2 h3 + ∂x∂y ∂x∂z ∂y∂z 1 ∂3f 1 ∂3f 1 ∂3f 1 ∂3f 3 3 3 (a)h + (a)h + (a)h + (a)h1 2 h2 + 1 2 3 6 ∂x3 6 ∂y 3 6 ∂z 3 2 ∂x2 ∂y

+

+

1 ∂3f 1 ∂3f 1 ∂3f 2 2 (a)h h + (a)h1 h3 2 (a)h h + 1 2 1 3 2 ∂x2 ∂z 2 ∂x∂y 2 2 ∂x∂z 2

+

1 ∂3f ∂3f 1 ∂3f 2 2 (a)h h + (a)h h + (a)h h h 2 3 2 3 1 2 3 2 ∂y 2 ∂z 2 ∂y∂z 2 ∂x∂y∂z

1 (4) f (x0 + θh)(h). 4!

Si en ambos casos se supone únicamente que la función f es de clase C 3 , el último 3 sumando se ha de escribir como ε(h) khk , igual que en la fórmula (2.2). k

k

Notación: El término ε(h) khk se denota también por o khk n

′

en h0 = 0.

En general, si A ⊂ R , a ∈ A y f, g son dos funciones reales definidas en A, se dice que f es una o de g en a (léase “f es una o pequeña de g en a”), y se escribe ‘f = o(g) en a’, si existe una función ε definida en A ∩ B(a, δ) para algún δ > 0, con l´ım ε(x) = 0 y tal que x→a

f (x) = ε(x) g(x) para cada x ∈ A ∩ B(a, δ) . Esta notación fue introducida por Landau.

2.4. Extremos relativos Una de las aplicaciones más notables de la fórmula de Taylor, como ocurre en el caso de funciones reales de una variable real, consiste en el estudio de extremos relativos. Definición 2.30. Sean f una función real definida en un abierto A de Rn y a un punto de A. Se dice que f presenta un máximo (resp. mínimo) local o relativo en ese punto si existe un entorno V de a, contenido en A (una bola centrada en a, si se prefiere), tal que f (x) ≤ f (a) resp. f (x) ≥ f (a) para todo x ∈ V.

En cualquiera de los dos casos se dice que f presenta un extremo local o relativo en el punto a. Si las desigualdades anteriores son estrictas para cada x 6= a, se dice que el extremo (máximo o mínimo) es estricto. Teorema 2.31 (Condición necesaria de extremo relativo). Sean A un abierto de Rn , a un punto de A y f una función de A en R que es diferenciable en a. Es condición necesaria para que f presente un extremo relativo en a que su diferencial en dicho punto sea nula, f ′ (a) = 0, o dicho de otra forma, que ∇f (a) = 0,

es decir,

∂f (a) = 0 ∂xj

para cada j = 1, 2, . . . , n.

Observación 2.32. Con la notación del teorema anterior, si ∇f (a) = 0 se dice que a es un punto crítico de f . Así pues, los posibles extremos relativos de una función diferenciable se localizan entre los puntos críticos de la función. Un punto crítico donde la función no presenta un extremo relativo se llama punto de silla. Antes de dar condiciones suficientes para la existencia de extremos relativos, haremos una breve revisión de algunos conceptos algebraicos que serán fundamentales para este estudio. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

2.4. Extremos relativos

33

2.4.1. Formas cuadráticas Definición 2.33. Una forma cuadrática en Rn es una aplicación Q: Rn → R dada por un polinomio homogéneo de grado 2, es decir, de la forma X Q(x) = Q(x1 , x2 , . . . , xn ) = cij xi xj , con cij ∈ R. (2.3) 1≤i≤j≤n

Se dice que la forma cuadrática Q es definida positiva (resp. negativa) si Q(x) > 0 (resp. Q(x) < 0) para cada x ∈ Rn , x 6= 0. Se dice que la forma cuadrática Q es semidefinida positiva (resp. negativa) si Q(x) ≥ 0 (resp. Q(x) ≤ 0) para cada x ∈ Rn . Se dice que la forma cuadrática Q en Rn es indefinida si no es semidefinida, es decir, si toma valores estrictamente positivos y negativos en distintos puntos de Rn .

En la observación 1.77 ya indicamos que a toda forma cuadrática se le asocia una matriz simétrica A mediante la expresión Q(x1 , x2 , . . . , xn ) = Q(x) = x A xt .

(2.4)

Los siguientes resultados proporcionan criterios para determinar el carácter de la forma cuadrática Q a partir de la matriz A. Teorema 2.34. Si A es una matriz cuadrada y simétrica con coeficientes reales, todos sus autovalores son reales. Proposición 2.35. Sea Q una forma cuadrática en Rn representada por la matriz simétrica A según (2.4). I)

Q es semidefinida positiva si, y sólo si, todos los autovalores de A son mayores o iguales que 0. Es definida positiva si, y sólo si, todos los autovalores de A son positivos.

II )

Q es semidefinida negativa si, y sólo si, todos los autovalores de A son menores o iguales que 0. Es definida negativa si, y sólo si, todos los autovalores de A son negativos.

III )

Q es indefinida si, y sólo si, A tiene al menos un autovalor positivo y al menos otro negativo.

Proposición 2.36 (Criterio de Sylvester). Sea Q una forma cuadrática en Rn representada por la matriz simétrica A = aij 1≤i,j≤n . Para cada k = 1, 2, . . . , n se denota ∆k = det aij 1≤i,j≤k . Entonces: I) II )

Q es definida positiva si, y sólo si, ∆k > 0 para cada k = 1, 2, . . . , n. Q es definida negativa si, y sólo si, (−1)k ∆k > 0 para cada k = 1, 2, . . . , n.

Volviendo al problema que nos ocupaba: Definición 2.37. Sean A un abierto de Rn , a ∈ A y f una función de clase C 2 en A. La matriz (simétrica en virtud del teorema de Schwarz 2.22) 2 ∂ f (a) Hf (a) = ∂xi ∂xj 1≤i,j≤n se denomina matriz hessiana

2

de f en el punto a.

Observación 2.38. Si f es una función de clase C 2 en un entorno del punto a ∈ Rn , entonces para valores de h suficientemente pequeños se tiene que 1 2 f (a + h) = f (a) + f ′ (a)(h) + h Hf (a) ht + o khk . 2 2 El

nombre, en honor a L. O. Hesse, fue introducido por J. J. Sylvester.

U NIVERSIDAD DE VALLADOLID

34

Tema 2. Cálculo diferencial

A partir de esta representación local se deducen los siguientes resultados: Teorema 2.39 (Condiciones necesarias de extremo relativo). Sean A un abierto de Rn, a un punto de A y f : A → R una función de clase C 2 en A con f ′ (a) = 0. Si f presenta un mínimo (resp. máximo) relativo en a, la forma cuadrática h 7→ h Hf (a) ht es semidefinida positiva (resp. negativa). En consecuencia, si esta forma cuadrática es indefinida, f no puede presentar extremos en el punto a. Teorema 2.40 (Condiciones suficientes de extremo relativo). Sean A un abierto de Rn, a un punto de A y f : A → R una función de clase C 2 en A y tal que f ′ (a) = 0. Entonces: I)

Si la forma cuadrática h 7→ h Hf (a) ht es definida positiva (resp. negativa), entonces f presenta un mínimo (resp. máximo) relativo estricto en a.

II )

Si las formas cuadráticas h → 7 h Hf (x) ht son semidefinidas positivas (resp. negativas) para todos los puntos x de un entorno de a, entonces f presenta un mínimo (resp. máximo) relativo en a.

Por último, mencionaremos que es posible generalizar estos criterios de existencia de extremos relativos, al igual que sucede en el caso de abiertos de la recta, en términos de las diferenciales de orden superior. Obsérvese que, si f ′ (a) = f ′′ (a) = . . . = f (2k−1) (a) = 0, para valores pequeños de h se tiene que f (a + h) − f (a) =

1 f (2k) (a + θh)(h). (2k)!

Un argumento de continuidad (con más precisión, ver la fórmula (2.2)) muestra que el término de la derecha tiene el mismo signo que f (2k) (a)(h) en un entorno de h0 = 0, de donde se deduce el siguiente resultado. Teorema 2.41. Sea f una función de clase C 2k en un abierto A de Rn tal que todas sus derivadas parciales de orden m < 2k se anulan en un punto a ∈ A. I)

Si f (2k) (a)(h) > 0 para cada h ∈ Rn \ {0}, entonces f presenta un mínimo relativo estricto en el punto a.

II )

Si f (2k) (a)(h) < 0 para cada h ∈ Rn \{0}, entonces f presenta un máximo relativo estricto en el punto a.

En realidad, las condiciones de los apartados del teorema anterior se pueden debilitar, pues basta pedir que la aplicación h 7→ f (2k) (x)(h) sea semidefinida positiva (resp. negativa) para todos los x en un entorno del punto a (como se hizo en 2.40.II); en cualquier caso, el estudio de estas situaciones se complica enormemente para k > 1.

Ejercicios 2.1 Calcular las derivadas direccionales de las siguientes funciones en los puntos y según las direcciones que se indican: f (x, y, z) = x3 + 2y 3 + 3z, en (1, 1, 0) según la dirección (1, −1, 2). α x II ) f (x, y, z) = , para x > 0, y > 0, siendo α > 0, en el punto (1, 1, 1), según el vector y (2, 1, −1). I)

III)

f (x, y, z) = sen(xyz), en (π, 1, 1) según la dirección (2, 0, 1).

2.2 Estudiar la continuidad, existencia de derivadas direccionales y diferenciabilidad en (0, 0) de las siguientes funciones de R2 en R: p |xy|. I ) f (x, y) = xy log(x2 + y 2 ) si (x, y) 6= (0, 0), II ) f (x, y) = 0 si (x, y) = (0, 0).  4  xy si (x, y) 6= (0, 0), III) f (x, y) = x4 + y 8  0 si (x, y) = (0, 0). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

35

Ejercicios

2.3 Estudiar la continuidad, existencia de derivadas direccionales y diferenciabilidad en (0, 0, 0) de las siguientes aplicaciones de R3 en R:  xy 2  si (x, y, z) 6= (0, 0, 0), I ) f (x, y, z) = x2 + y 4 + z 2  0 si (x, y, z) = (0, 0, 0). Z |xyz| 2 et dt. II ) f (x, y, z) = 0

2.4 Estudiar la diferenciabilidad en R2 de las siguientes funciones:   p xy si (x, y) 6= (0, 0), x2 + y 2 I ) f (x, y) =  0 si (x, y) = (0, 0).  xy − y p si (x, y) 6= (1, 0), 2 + y 2 − 2x + 1 x II ) f (x, y) =  0 si (x, y) = (1, 0).  3  x si x2 − y 2 6= 0, x2 − y 2 III ) f (x, y) =  0 si x2 − y 2 = 0. 2.5 Probar que la función real f , definida por   (x2 + y 2 ) sen p 1 f (x, y) = x2 + y 2  0

si (x, y) 6= (0, 0), si (x, y) = (0, 0),

2

es diferenciable en todo R y, sin embargo, las derivadas parciales de f no son continuas en el punto (0, 0). 2.6 Sea g una función real definida en un entorno V de 0 ∈ Rn , y tal que existen K ≥ 0 y r > 1 de manera que g(x) ≤ K kxkr para todo x ∈ V.

Probar que g es diferenciable en 0.

2.7 Dado r > 0 se considera la función definida en R2 por r f (x, y) = m´ax |x|r , |y|r = m´ax |x|, |y| .

Estudiar la continuidad, existencia de derivadas direccionales y diferenciabilidad de f en R2 según los valores de r.

2.8 Sean f y g dos funciones reales definidas en un abierto A de Rn y a un punto de A. Demostrar que si f es continua en a, g es diferenciable en a y g(a) = 0, entonces f g es diferenciable en a, y su diferencial es (f g)′ (a) = f (a)g ′ (a). 2.9 Sea fp la función de R2 en R definida por:  p  |x y| fp (x, y) = x2 + y 2  0

si (x, y) 6= (0, 0); si (x, y) = (0, 0).

Discútanse, según los valores de p > 0, la continuidad, existencia de derivadas direccionales y diferenciabilidad de fp en (0, 0).

2.10 Estudiar la diferenciabilidad de la aplicación f : R2 → R3 dada por  y   cos(x + y), log(1 + x2 + y 2 ), e − 1 si y 6= 0, y f (x, y) =   cos(x), log(1 + x2 ), 1 si y = 0. U NIVERSIDAD DE VALLADOLID

36

Tema 2. Cálculo diferencial

2.11 Estudiar la diferenciabilidad de la aplicación f : R2 → R3 dada por   ex+y , sen(x − y), x2 sen 1/ si x 6= 0, x f (x, y) =  ey , sen(−y), 0 si x = 0.

2.12 Suponiendo que todas las funciones involucradas son diferenciables, calcular: I ) u′ (t), siendo u(t) = f x(t), y(t), z(t) . ∂u ∂u II ) y , siendo u(r, s) = f x(r, s), y(r, s), z(r, s) . ∂r ∂s ∂u ∂u ∂u , y , siendo u(r, s, t) = f x(r, s, t), y(r, s, t), z(r, s, t) . III) ∂r ∂s ∂t ∂u ∂u ∂u , y , siendo u(r, s, t) = f x(r, s, t) . IV ) ∂r ∂s ∂t

2.13 Sean f y g dos funciones reales definidas en (0, ∞), ambas derivables en t0 = 1. Se define la función u : (0, ∞) × (0, ∞) → R por u(x, y) = f (xy) + g y/x .

Calcular, si existen,

∂u ∂u (1, 1) y (1, 1). ∂x ∂y

2.14 Demostrar que, si f es una función real derivable en R, la función u definida en R2 por u(x, y) = f (x2 y) verifica la ecuación x

∂u ∂u (x, y) − 2 y (x, y) = 0 ∂x ∂y

para todo (x, y) ∈ R2 .

2.15 Sean g1 , g2 las funciones definidas en R3 por g1 (x, y, z) = x2 + y 2 + z 2 ,

g2 (x, y, z) = x + y + z,

y g: R3 → R2 la aplicación dada por g = (g1 , g2 ). Si f es una función real diferenciable en R2 y h es la función compuesta h = f ◦ g, probar que k∇hk2 = 4(D1 f ◦ g)2 g1 + 4(D1 f ◦ g)(D2 f ◦ g)g2 + 3(D2 f ◦ g)2 .

2.16 Sea fp la función de R2 en R definida por:  p  |x| si (x, y) 6= (0, 0); 2 fp (x, y) = x + y 2  0 si (x, y) = (0, 0). I)

II )

Discútanse, según los valores de p > 0, la continuidad, existencia de derivadas direccionales y diferenciabilidad de fp en (0, 0).

Sea F : R2 → R2 la aplicación definida por

F (x, y) = x + cos(y), f4 (x, y) .

Justifíquese la diferenciabilidad de G = F ◦ F + F en (0, 0) y calcúlese G′ (0, 0). 2.17 Sean a = (1, −1), u = (−3, 2), v = (2, 1). Se sabe que la función f : R2 → R es diferenciable en a y que f (a) = 1, Du f (a) = 1, y Dv f (a) = 4. I) II ) III)

LATV

Calcúlese ∇f (a).

Pruébese que la función g, definida en R por g(t) = f t, cos(πt) , es derivable en el punto t = 1 y calcúlese g ′ (1).

Calcúlese la derivada direccional de g ◦ f en a según la dirección de (3, 4).

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

37

Ejercicios

2.18 En cada uno de los siguientes casos comprobar que las dos derivadas parciales cruzadas de segundo orden de f son iguales: I) II ) III ) IV ) V)

f (x, y) = x4 + y 4 − 4 sen(xy). 1 f (x, y) = cos(y 2 ), x 6= 0. x y , x 6= 0. f (x, y) = arctg x xy f (x, y) = arctg 1 + x2 + y 2 f (x, y) = log(1 + xy), x > 0, y > 0.

2.19 Comprobar que si f es la función definida en R2 por  2 2  x y (x − y ) si (x, y) 6= (0, 0), x2 + y 2 f (x, y) =  0 si (x, y) = (0, 0),

existen las dos derivadas parciales cruzadas de segundo orden de f en el origen, pero no son iguales. ¿Contradice esto el teorema de Schwarz?

2.20 Sea f : R2 → R una función cuyas derivadas parciales de primer orden existen y son diferenciables. Sea F : R2 → R definida por: F (r, θ) = f r cos(θ), r sen(θ) . Calcular, en función de las derivadas parciales de f , las derivadas siguientes: ∂F , ∂r

∂F , ∂θ

∂2F , ∂r2

∂2F , ∂θ2

∂2F , ∂r∂θ

∂2F . ∂θ∂r

2.21 Sea f : R → R una función con derivada segunda continua en todo punto, tal que f ′′ (t) 6= 0 para cada t ∈ R. Sea g una función de clase C 2 en R2 que satisface en todo punto (x, y) ∈ R2 la ecuación funcional de Laplace, ∂2g ∂2g (x, y) + (x, y) = 0 . ∂x2 ∂y 2

Demostrar que la función F = f ◦ g también satisface (2.5) si, y sólo si, g es constante. 2.22 Comprobar que la función g definida en V = R2 \ {(a, b)} por p g(x, y) = log (x − a)2 + (y − b)2 satisface la ecuación de Laplace (2.5) en el abierto V .

2.23 Sea a > 0. Comprobar que la función real u definida en (0, ∞) × R por u(x, t) = verifica la ecuación del calor

1 √

2a πt

e

−

(x−b)2 4a2 t

∂u ∂2u = a2 2 . ∂t ∂x

2.24 Sea f una función real de clase C 2 en R2 . Si la función u, definida por u(x, y) = f (x, y) eax+by , es tal que

∂2u = 0, encontrar los valores de a y b para los que se puede asegurar que ∂x∂y ∂2f ∂f ∂f − − + f = 0. ∂x∂y ∂x ∂y

U NIVERSIDAD DE VALLADOLID

(2.5)

38

Tema 2. Cálculo diferencial

2.25 Sea g: R → R una función de clase C ∞ . Se define f : R2 → R por f (x, y) = g(ax + by + c),

a, b, c ∈ R.

Calcular todas las derivadas sucesivas de f en función de las de g. 2.26 Sea f una función de clase C 2 en R2 \ {(0, 0)}. Comprobar que 2 2 ∂ f ∂2f ∂2g ∂ g 1 (x, y) + (x, y) = 4 (u, v) + (u, v) , x2 + y 2 ∂x2 ∂y 2 ∂u2 ∂v 2 donde f (x, y) = g u(x, y), v(x, y) , siendo u(x, y) = x2 − y 2 , v(x, y) = 2 x y . 2.27 Sea f una función de clase C 2 en (0, ∞) × (0, ∞). Comprobar que

∂2g ∂2g 1 ∂2f (x, y) = (u, v) − (u, v), 4xy ∂x∂y ∂u2 ∂v 2 donde f (x, y) = g u(x, y), v(x, y) , siendo u(x, y) = x2 + y 2 , v(x, y) = x2 − y 2 .

2.28 Utilícese la fórmula de Taylor para expresar las siguientes funciones polinómicas en potencias de (x − 1) e (y − 2): I)

II )

g(x, y) = x2 + x y + y 2 + 2 x .

f (x, y) = x3 + y 3 + x y 2 + x − y .

2.29 Determinar los desarrollos de Taylor de orden 3 de las siguientes funciones en los puntos que se indican: I) II ) III) IV )

f (x, y) = sen(x + 2y), en el punto (0, 0). 2

f (x, y) = e(x−1) cos(y), en el punto (1, 0). f (x, y) = cos(x − y), en el punto (1, 1).

f (x, y) = log(1 + xy)ex+y , en el punto (0, 0).

2.30 Sea f : Rn → R de clase C 2 , positiva y tal que existe M > 0 verificando que Dij f (x) ≤ M, i, j = 1, 2, . . . , n.

Demostrar que para cada x ∈ Rn se tiene que k∇f (x)k2 ≤ 2 M n f (x), concretamente: Di f (x) 2 ≤ 2 M f (x), i = 1, 2, . . . , n.

2.31 Sea f una función real, no negativa y de clase C 2 en un entorno V de 0 en Rn . Se supone que ∇f (0) = 0, y que el conjunto B = {x ∈ Rn : |xi | ≤ 2 c , 1 ≤ i ≤ n} está contenido en V y en él se verifica la acotación Dij f (x) ≤ M, i, j = 1, 2, . . . , n, M > 0. Demostrar que para x ∈ Rn , con |x1 | + |x2 | + . . . + |xn | ≤ c, se tiene que Di f (x) 2 ≤ 2 M f (x), i = 1, 2, . . . , n.

2.32 Calcular, si existen, los siguientes límites: sen(x) sen(y) − xy I) l´ım . x2 + y 2 (x,y)→(0,0) II )

III) IV )

LATV

l´ım

(x,y)→(0,0)

l´ım

(x,y)→(0,0)

x ex2 +y2

tg(xy) − sen(xy) . 2 − 1 1 − cos(x) cos(y)

arctg(xy) − xy . log(1 + x2 + y 2 ) − x2 − y 2

cos(xy) + sen(x2 + y) − 1 − y − x2 . x2 + y 2 (x,y)→(0,0) l´ım

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

39

Ejercicios

2.33 Calcular los extremos relativos de las siguientes funciones definidas en R2 : I)

f (x, y) = x2 + y 3 .

II )

f (x, y) = x6 + y 4 .

III )

f (x, y) = 2 x2 − 4 x y + y 4 − 1.

f (x, y) = x2 − 2 x y + y 2 + x4 + y 4 . Z y sen(t)dt. V ) f (x, y) =

IV )

x

VI )

VII )

f (x, y) = x3 − 3 x2 + 2 y 3 + 3 y 2 . f (x, y) = x2 e−x

2

−y 2

.

2.34 Sea C = [0, π] × [0, π]. Se define f : C → R por x(π − y) f (x, y) = y(π − x)

si x ≤ y, si x > y.

Estudiar la continuidad de f y encontrar el máximo absoluto de f en C. 2.35 Determinar los extremos relativos de la función f (x, y, z) = x2 + y 2 + 3z 2 + yz + 2xz − xy. 2.36 Discutir, según los valores del parámetro a, las cuestiones que se proponen: I)

La existencia de extremos relativos de la función f (x, y) = x3 − 3ax2 − 4ay 2 + 1.

II )

La presencia en el punto (0, 0) de un extremo relativo de la función g(x, y) = a 2xy + y 2 + yx2 + cos(x + y) + x2 (a2 − y).

2.37 Demostrar la desigualdad

x2 + xy + y 2 +

√ a3 a3 3 + ≥ 3 3 a2 x y

si x > 0, y > 0,

siendo a una constante positiva. Sugerencia: Localizar primero los extremos locales de una función adecuada y concluir que uno de ellos es de hecho un extremo absoluto.

2.38 Sean A y B dos conjuntos abiertos de Rn y Rm , respectivamente, f : A → R, g: B → A, b ∈ B y a = g(b). I)

II )

III )

Si g es una biyección, demostrar que f alcanza un extremo absoluto en a si, y sólo si, f ◦ g alcanza un extremo absoluto en b.

Suponiendo que g es un homeomorfismo de un entorno de b sobre un entorno de a, demuéstrese que f presenta un extremo relativo en el punto a si, y sólo si, f ◦ g presenta un extremo relativo en b. Aplicar lo anterior para: 1. Determinar los extremos relativos de la función f (x, y) = cos(xy) − cos x/y en el conjunto A = {(x, y) ∈ R2 : x > 0, y > 0}.

Sugerencia: Considérese la aplicación definida por g −1 (x, y) = x y , x/y .

2. Determinar los extremos locales de la función 2 1 f (x, y) = arctg y/x − 1 + (x2 + y 2 ) /2 (x2 + y 2 − 3), en el conjunto A = {(x, y) ∈ R2 : x > 0, y > 0}.

Sugerencia: Considérese g: (0, ∞) × (0, π/2) → A definida por g(r, θ) = r cos(θ), r sen(θ) . U NIVERSIDAD DE VALLADOLID

40

Tema 2. Cálculo diferencial

2.39 Encuéntrense los extremos relativos de la función f : (0, ∞)n → R dada por 1 1 1 + + ... + f (x1 , x2 , . . . , xn ) = x1 x2 · · · xn + an+1 , a > 0. x1 x2 xn 2.40 Sea a = (a1 , a2 , . . . , an ) un punto de Rn . Se define la función real f en Rn por f (x) = exp − kxk2 − ha, xi , donde kxk2 = x1 2 + x2 2 + · · · + xn 2 y ha, xi = a1 x1 + a2 x2 + · · · + an xn . I)

II )

Demuéstrese que f se anula en el infinito, es decir, que para cualquier ε > 0 existe una constante M > 0 tal que |f (x)| ≤ ε si kxk ≥ M.

Estúdiese si f alcanza máximo o mínimo absolutos en Rn y, caso de existir, calcúlense.

2.41 Sean A un abierto convexo de Rn y f : A → R una función de clase C 2 tal que Hf (x) es semidefinida positiva para cada x ∈ A. Probar que el conjunto V = (x1 , x2 , . . . , xn , z) : (x1 , x2 , . . . , xn ) ∈ A , f (x1 , x2 , . . . , xn ) < z es un abierto convexo de Rn+1 .

2.42 Dado n ∈ N, para cada i = 1, 2, . . . , n sean (ai , bi ) un intervalo de R y fi : (ai , bi ) → R. Se considera producto tensorial g = f1 ⊗ f2 ⊗ · · · ⊗ fn definido en el producto cartesiano A = (a1 , b1 ) × (a2 , b2 ) × · · · × (an , bn ) (ver ejercicio 1.49) I)

Si fi es derivable en ci ∈ (ai , bi ), probar que g es diferenciable en c = (c1 , c2 , . . . , cn ).

II )

Más aún, supuesto que fi es de clase C ∞ en (ai , bi ) , i = 1, 2, . . . , n, probar que g es de clase C ∞ en A y calcular ∂ m1 +m2 +...+mn g mn . m2 1 ∂xm 1 ∂x2 . . . ∂xn

III)

Fijado k ∈ N, supongamos que son conocidos los desarrollos de Taylor de orden k de cada función fi en un punto ci ∈ (ai , bi ), i = 1, 2, . . . , n. Proponer y describir un procedimiento general para calcular el desarrollo de Taylor de orden k de g en el punto c sin necesidad de recurrir a derivaciones.

IV )

Ilustrar los puntos anteriores con la función g definida en un entorno de 0 ∈ R3 por g(x, y, z) = cos(x) ln(1 + y) (1 + z 2 ) ;

en particular, aplíquese el método de

III )

en el punto (0, 0, 0) y para k = 2.

Tema 3

Aplicaciones diferenciables Partiendo de la idea de aproximación lineal que representa la diferenciabilidad de una función, no es de extrañar que ciertos conceptos de Álgebra Lineal elemental, tales como el de rango, aplicación inversa, etc., tengan su análogo en el Cálculo Diferencial. Los resultados centrales de este tema son el teorema de las funciones inversas y el teorema de las funciones implícitas, cuya versión lineal son los teoremas clásicos de Cramer y Rouché del Álgebra Lineal; de hecho, si nos remontamos un poco en el tiempo, es curioso observar que estos y otros resultados que se presentan en esta teoría aparecen enunciados de forma puramente algebraica (en términos de series de potencias de variable compleja) antes de la que podríamos denominar formulación moderna. Pensar en el caso lineal puede servir de gran ayuda a la hora de comprender el significado y alcance de estos teoremas. Se pueden encontrar en la literatura existente diversos métodos de demostración de estos teoremas. En cualquier caso, el punto más delicado radica en demostrar la existencia de tales funciones, siendo luego el estudio de la regularidad una cuestión prácticamente rutinaria. En este sentido, la exposición que realizamos requiere de un resultado sobre puntos fijos que motiva la primera sección.

3.1. Aplicaciones contractivas. Teorema del punto fijo Los conceptos y resultados que se presentan en esta sección se enmarcan en el contexto de los espacios euclídeos, lo que es suficiente para nuestros propósitos. No obstante, admiten una generalización en el marco de los espacios métricos que proporciona una herramienta teórica muy fructífera en la Teoría de Funciones, como el método de Picard, destinado a la prueba de existencia y unicidad de soluciones de ecuaciones diferenciales. También son el germen de numerosos métodos numéricos iterativos (basados en técnicas de aproximaciones sucesivas). En todos los casos el punto de partida es formular los problemas en términos de puntos fijos, es decir, expresados como una ecuación del tipo f (x) = x . Definición 3.1. Supongamos que X es un conjunto no vacío de Rn y que f : X → Rn es una aplicación. Si un punto x0 ∈ X es tal que f (x0 ) = x0 se dice que x0 es un punto fijo de f . Definición 3.2. Sean A ⊂ Rn y f una aplicación de A en Rm . Se dice que f es lipschitziana 1 si existe una constante K tal que kf (x) − f (y)kRm ≤ K kx − ykRn

para todos x, y ∈ A .

En particular, si K < 1 se dice que f es contractiva. Si para todos x, y ∈ A se tiene que kf (x) − f (y)kRm = kx − ykRn se dice que f es una isometría (entre A y f (A)). Teorema 3.3 (del punto fijo, de Banach). Sea X un subconjunto cerrado de Rn . Si f : X → X es una aplicación contractiva, entonces f tiene un único punto fijo. Corolario 3.4. Sea X un subconjunto cerrado de Rn . Si f : X → X es una aplicación tal que para algún p ∈ N se tiene que f [p] = f ◦ f ◦ . p. . ◦f es contractiva, entonces f tiene un único punto fijo. 1 en

honor a R. Lipschitz

41

42

Tema 3. Aplicaciones diferenciables

Observaciones 3.5. I)

Precisando un poco más, el teorema anterior se demuestra probando que partiendo de cualquier punto a ∈ X la sucesión {xk }∞ k=1 definida recurrentemente por x1 = f (a) ,

x2 = f (x1 ) = f (f (a)) , . . . , xk = f (xk−1 ) = f [k] (a) ,

converge hacia el punto fijo de f ; es decir, los términos de la sucesión {xk }∞ k=1 proporcionan aproximaciones a la solución exacta de la ecuación f (x) = x , este procedimiento se conoce con el nombre de método de aproximaciones sucesivas. II )

La convergencia de la sucesión anterior equivale a su carácter de Cauchy. El teorema se enuncia de igual forma en los denominados espacios métricos completos que son, precisamente, aquellos en los que toda sucesión de Cauchy es convergente; es evidente que todo subconjunto cerrado de Rn es completo en virtud de la proposición 1.40 y el teorema 1.42.

3.2. Funciones inversas El objetivo de esta sección es estudiar condiciones suficientes para que una función, definida en un abierto A de Rn y con llegada en Rn , sea localmente invertible en el entorno de un punto a ∈ A, así como obtener propiedades de regularidad sobre la función inversa a partir de la regularidad de la función. Definición 3.6. Sean A un abierto de Rn , a un punto de A y f una aplicación de A en Rn que es diferenciable en a. Se denota por Jf (a) al determinante de la matriz jacobiana de f en a: Jf (a) = det

∂(f1 , f2 , . . . , fn ) = det Dj fi (a) 1≤i,j≤n ∂(x1 , x2 , . . . , xn )

y se denomina determinante jacobiano, o simplemente jacobiano, de f en a. Teorema 3.7 (de las funciones inversas). Sean A un abierto de Rn y f : A → Rn una aplicación de clase C k (k ≥ 1) en A. Si a ∈ A es tal que la aplicación lineal f ′ (a) es regular, o equivalentemente, tal que Jf (a) 6= 0, entonces existen un abierto V que contiene al punto a, y un abierto W que contiene al punto f (a), tales que f aplica biyectivamente V en W y la aplicación inversa f −1 : W → V es también de clase C k en W y se tiene que ′ −1 , x ∈ V, f −1 f (x) = f ′ (x) o lo que es lo mismo,

Observaciones 3.8. I)

II )

−1 ′ , f −1 (y) = f ′ (f −1 (y))

y ∈ W.

La última fórmula es una igualdad de aplicaciones lineales que implica, en particular, que la matriz jacobiana de f −1 en el punto f (x) es la inversa de la matriz jacobiana de f en x, y en consecuencia 1 Jf −1 f (x) = , x ∈ V. Jf (x) A diferencia del caso lineal, en el que la inversibilidad es global, este teorema tiene carácter local, es decir, la regularidad de la matriz jacobiana de f en el punto a sólo garantiza, en general, la inyectividad de f en un entorno del punto a; considérese, por ejemplo, la aplicación f : R2 (x, y)

→ R2 7→ ex cos(y), ex sen(y) ,

a la que se puede aplicar el teorema anterior en cada punto, pero que no es inyectiva en R2 , y no admite por lo tanto inversa global. III)

LATV

Del teorema de la función inversa se deduce que toda aplicación de un abierto de Rn en Rn de clase C 1 y cuyo jacobiano es distinto de cero en todos los puntos de su dominio es una aplicación abierta, es decir, transforma conjuntos abiertos en conjuntos abiertos.

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

43

3.2. Funciones inversas

3.2.1. Notas sobre la demostración del teorema de las funciones inversas De forma escueta relataremos una serie de pasos y reducciones del problema que ayudan a tener una visión más clara del proceso deductivo. La notación y las condiciones serán como en el enunciado del teorema 3.7. Paso 1 Reducción del problema a otro más sencillo Lema 3.9. Fijado un punto c ∈ Rn la traslación τc : Rn → Rn definida por τc (x) = x − c es una isometría (por tanto homeomorfismo) de clase C ∞ , cuyo jacobiano es igual a 1 en todo punto. Notemos que la aplicación f 1 (x) = f (x + a) − f (a), verifica f 1 (0) = 0 y f ′1 (0) = f ′ (a). Lema 3.10. Sea λ: Rn → Rn un isomorfismo lineal. La aplicación f es inyectiva en un entorno de a con inversa diferenciable, si y sólo si, lo es la aplicación f 2 = λ ◦ f . −1 −1 ◦ λ−1 , o bien f −1 = f −1 Si λ = f ′ (a) , entonces f ′2 (a) = IdRn ; además f −1 2 =f 2 ◦ λ. En definitiva, se puede suponer sin pérdida de generalidad que a = 0,

f (a) = 0 y

f ′ (0) = IdRn .

Paso 2 Aplicación del teorema de Banach: existencia de la inversa Lema 3.11. Sea g(x) = x − f (x). Existe un r > 0 tal que para cada x ∈ B(0, r) se tiene que kg(x)k ≤

r 1 kxk ≤ . 2 2

Corolario 3.12. Fijado y ∈ B(0, r/2) la aplicación hy definida en B(0, r) por hy (x) = y+x−f (x) tiene su imagen contenida en B(0, r) y es contractiva: khy (x1 ) − hy (x2 )k ≤

1 kx1 − x2 k , 2

x1 , x2 ∈ B(0, r) .

El teorema del punto fijo asegura entonces que para y ∈ B(0, r/2) existe un único punto fijo de hy , esto es, un único x ∈ B(0, r) con x = h(x) = y + x − f (x), o lo que es lo mismo, y = f (x) o x = f −1 (y) . Paso 3 Continuidad y diferenciabilidad de la inversa local Dados x1 , x2 ∈ B(0, r) se tiene que kx1 − x2 k ≤ kf (x1 ) − f (x2 )k + kg(x1 ) − g(x2 )k ≤ kf (x1 ) − f (x2 )k +

1 kx1 − x2 k . 2

De lo anterior se sigue que kx1 − x2 k ≤ 2 kf (x1 ) − f (x2 )k para x1 , x2 ∈ B(0, r), en particular, si y 1 , y 2 ∈ B(0, r/2), poniendo x1 = f −1 (y 1 ) y x2 = f −1 (y 2 ), se deduce que kf −1 (y 1 ) − f −1 (y 2 )k ≤ 2 ky 1 − y 2 k .

Lema 3.13. Existe 0 < ρ ≤ r/2 tal que para cada y ∈ B(0, ρ) la aplicación lineal f ′ (x) es invertible, siendo x = f −1 (y). Además, por la compacidad de B(0, ρ) existe M ≥ 0 con −1 (z)k ≤ M kzk para todo y ∈ B(0, ρ) y z ∈ Rn . k f ′ (x) Ahora es fácil probar que, si y 1 , y 2 ∈ B(0, ρ), x1 = f −1 (y 1 ) y x2 = f −1 (y 2 ), entonces

′ −1

f (x1 )(x2 − x1 ) − f (x2 ) − f (x1 ) kf −1 (y 2 ) − f −1 (y 1 ) − f ′ (x1 ) (y 2 − y 1 )k ≤ 2M −→ 0 , y 2 →y 1 ky 1 − y 2 k kx1 − x2 k ′ −1 lo que implica que f −1 es diferenciable en y 1 y que f −1 (y 1 ) = f ′ (x1 ) .

Paso 4 Regularidad de la inversa local Las derivadas parciales de f −1 son los coeficientes de la matriz que, en la base estándar, −1 ′ . La bien conocida fórmula para la inversa de una representa a f −1 (y) = f ′ (f −1 (y)) matriz (regla de Cramer) permite escribir estas derivadas parciales como sumas de productos de composiciones de f −1 con derivadas parciales de las componentes f1 , f2 , . . . , fn de f , que son de clase C k . U NIVERSIDAD DE VALLADOLID

44

Tema 3. Aplicaciones diferenciables

3.2.2. Cambios de variables. Aplicación a las ecuaciones diferenciales Definición 3.14. Sean A y B dos abiertos de Rn . Se dice que una aplicación ϕ: A → B es un difeomorfismo o cambio de variables de clase C k si es biyectiva, de clase C k en A, y la aplicación inversa ϕ−1 : B → A es también de clase C k en B. Observación 3.15. Con esta definición en mente, el teorema de la función inversa afirma que si una función de clase C 1 tiene jacobiano no nulo en un punto, entonces dicha función define localmente, es decir, en un entorno de dicho punto, un cambio de variables. También del teorema de la función inversa se sigue que para probar que una aplicación de clase C 1 de un abierto de Rn en Rn es un difeomorfismo de ese abierto sobre su imagen, basta probar que es inyectiva y que su jacobiano no se anula en ningún punto. La importancia de los cambios de variables se pondrá de manifiesto posteriormente, en el estudio de integrales múltiples o, por ejemplo, al tratar con operadores diferenciales, a los que dedicamos las siguientes líneas. Definición 3.16. Sea A un abierto de Rn . Por operador diferencial lineal de orden m en A se entiende toda aplicación definida en el espacio de funciones C m (A) a valores en C 0 (A) por D = a0 D0 +

n X

a j1 D j1 +

n X

a j1 j2 D j1 j2 + . . . +

aj1 ...jm Dj1 ...jm ,

j1 ,...,jm =1

j1 ,j2 =1

j1 =1

n X

donde los coeficientes a0 , aj1 ...jk , 1 ≤ k ≤ m, son funciones continuas en A. (D0 denota el operador identidad). Si D es un operador diferencial de orden m en el abierto A de Rn y h ∈ C m (A), g ∈ C 0 (A) son funciones tales que D(h)(x) = g(x) para cada x ∈ A

se dice que h es solución de la ecuación diferencial (lineal) D(f ) = g. La ecuación diferencial se denomina ordinaria si n = 1 y en derivadas parciales cuando n > 1. Se suele abreviar, respectivamente, E.D.O. y E.D.P. (O.D.E y P.D.E. en inglés).

Ejemplo 3.17. El operador D = aD0 + bD1 + D11 − (c + d)D12 + cdD22 , a, b, c, d ∈ R, asigna a cada función f de clase C 2 en un abierto A de R2 la función continua af + b

∂2f ∂2f ∂2f ∂f + − (c + d) + cd , ∂x ∂x2 ∂x∂y ∂y 2

definida en el mismo abierto. La función h(x, y) = xy es solución de D(f ) = g,

siendo g(x, y) = axy + by − (c + d).

Observación 3.18. Dados dos abiertos A y B de Rn y ϕ: A → B un difeomorfismo de clase C m , si D es un operador diferencial de orden m en A, para cada f ∈ C m (B) se puede considerar la función compuesta f ◦ ϕ ∈ C m (A) y su imagen por D D(f ◦ ϕ).

En virtud de la Regla de la Cadena 2.12, la expresión anterior define un operador diferencial en B del mismo orden que denotaremos por ϕ∗ (D). Puede suceder que este nuevo operador admita una expresión más sencilla que el original, lo que permitirá resolver más fácilmente las ecuaciones diferenciales asociadas correspondientes. Explícitamente, se tiene el siguiente resultado. Teorema 3.19. En las condiciones anteriores, si g ∈ C 0 (B), una función h ∈ C m (B) es solución de la ecuación ϕ∗ (D)(f ) = g si, y sólo si, la función h ◦ ϕ es solución de la ecuación D(f ) = g ◦ ϕ . Observación 3.20. En las condiciones del teorema anterior, puesto que ϕ es una biyección, h queda unívocamente determinada por h ◦ ϕ, y viceversa. Como ejemplo de aplicación ver los ejercicios 3.13, 3.14, 3.15, 3.16 y 3.17.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

45

3.3. Funciones implícitas

3.3. Funciones implícitas 2 A modo de introducción pensemos que en un entorno de un punto de R , donde está definida la función f se pueden encontrar puntos x, y(x) que satisfacen f x, y(x) = 0 . (3.1)

Si se dan las condiciones pertinentes de derivabilidad, la regla de la cadena establece que ∂f ∂f x, y(x) + x, y(x) y ′ (x) = 0 , ∂x ∂y

∂f

simbólicamente y ′ = − ∂x /∂f . ∂y

(3.2)

En los trabajos de Leibniz ya está presente esta derivación implícita, aunque se atribuye a Cauchy la primera aproximación rigurosa a este resultado. Durante tiempo las contribuciones a esta teoría, como la del propio Cauchy o el teorema de inversión de Lagrange se concentraron en el caso de funciones analíticas (series de potencias complejas). La primera versión relativa a funciones de varias variables se debe a Dini y desde entonces se han proporcionado numerosas generalizaciones y métodos de demostración (ver [61]). Hablando ya en general, el objeto del teorema de las funciones implícitas es precisar condiciones tales que, dada una ecuación f (x1 , x2 , . . . , xn ), (y1 , y2 , . . . , ym ) = 0 ∈ Rm , (3.3)

se pueda asociar a cada punto x = (x1 , x2 , . . . , xn ) de un cierto conjunto X ⊂ Rn , un único punto y = (y1 , y2 , . . . , ym ) de otro conjunto Y ⊂ Rm , de manera que el par (x, y) verifique la ecuación. De esta forma, queda definida una aplicación y = ϕ(x), con los pares de valores que son solución de la ecuación anterior. En estas condiciones la aplicación ϕ se dice que está definida implícitamente por la ecuación (3.3). Si la ecuación (3.3) es lineal, la respuesta viene dada por el teorema de Rouché, pero en el caso general la resolución de tal ecuación, aun cuando ésta tenga solución única, puede resultar imposible. Parece entonces conveniente conocer las propiedades de la función ϕ, aunque no se pueda obtener de forma explícita.

Teorema 3.21 (de las funciones implícitas). Sean A un abierto de Rn+m , f : A → Rm una aplicación de clase C k (k ≥ 1) en A, y (a, b) un punto de A tal que f (a, b) = 0. Se supone, además, que ∂fi (a, b) 6= 0. (3.4) det ∂xn+j 1≤i,j≤m Entonces existen un abierto U de Rn , con a ∈ U , y otro abierto V de Rm , con b ∈ V , tales que para cada x ∈ U existe un único ϕ(x) ∈ V con f (x, ϕ(x)) = 0; además, la función ϕ: U → V así definida es una función de clase C k en U . Observaciones 3.22. I)

De nuevo, a diferencia del caso lineal, el resultado tiene carácter local; considérese por ejemplo la función f : R2 (x, y)

II )

→

7→

R x2 + y 2 − 1.

El teorema anterior admite una formulación más general en el sentido siguiente: “Si la matriz jacobiana de la aplicación f en el punto c ∈ Rn+m tiene rango máximo (igual a m), esto es, existen 1 ≤ j1 < j2 < . . . < jm ≤ m + n tales que el menor correspondiente a las derivadas parciales respecto de las variables xj1 , xj2 , . . . , xjm tiene determinante no nulo, entonces estas m variables quedan determinadas implícitamente en función de las n restantes en un entorno de dicho punto”. Esto se reduce al caso contemplado en el teorema 3.21 sin más que considerar una permutación en el orden de las variables.

U NIVERSIDAD DE VALLADOLID

46

Tema 3. Aplicaciones diferenciables

III)

El teorema de las funciones implícitas y el teorema de las funciones inversas son proposiciones equivalentes, esto es, uno se deduce del otro. Algunos autores optan por demostrar primero el teorema de las funciones implícitas y deducir de él el de las inversas. Esta opción no aporta ni ventajas ni desventajas, simplemente depende del gusto personal (ver ejercicio 3.10).

IV )

La unicidad enunciada en el teorema de la función implícita, junto con la condición f (a, b) = 0, implica, en particular, que ϕ(a) = b.

V)

Aun sin conocer explícitamente la aplicación ϕ, es posible calcular sus derivadas parciales sucesivas en el punto a, lo cual se reduce a resolver una serie de sistemas lineales cuya compatibilidad viene garantizada por el hecho de que el determinante jacobiano respecto de las últimas variables no sea nulo. En efecto, en las mismas condiciones y con la misma notación que en el teorema 3.21, denotemos por F = (F1 , F2 , . . . , Fm ) a la aplicación definida en U por F (x) = f (x, ϕ(x)). Puesto que esta aplicación es la idénticamente nula, todas sus derivadas parciales han de ser nulas en U . Así, fijado 1 ≤ k ≤ n, para cada i = 1, 2, . . . , m se tiene que 0=

m X ∂Fi ∂fi ∂ϕj ∂fi (x, ϕ(x)) = (x, ϕ(x)) + (x, ϕ(x)) (x). ∂xk ∂xk ∂xn+j ∂xk j=1

En virtud de (3.4) y por la continuidad de las derivadas parciales, para todos los puntos x en un entorno de a también se verifica que ∂fi (x, ϕ(x)) 6= 0, det ∂xn+j 1≤i,j≤m de manera que el sistema lineal dado por las m ecuaciones m X ∂fi ∂ϕj ∂fi (x, ϕ(x)) (x) = − (x, ϕ(x)), ∂x ∂x ∂x n+j k k j=1

i = 1, 2, . . . , m,

∂ϕj (x), j = 1, 2, . . . , m, es compatible determinado, lo que permite ∂xk obtener las derivadas parciales de las funciones implícitas ϕj . El sistema anterior se puede resolver mediante el método de Cramer; esta fórmula, que expresa las soluciones en función de los coeficientes del sistema, sirve para mostrar que las funciones implícitas son de la misma clase, C k , que la aplicación f . Si f es además de clase C 2 , dados 1 ≤ l, k ≤ n se tiene que en las m incógnitas

0 = =

∂ 2 Fi (x, ϕ(x)) ∂xl ∂xk

m X ∂ 2 fi ∂ϕj ∂ 2 fi (x, ϕ(x)) + (x, ϕ(x)) (x) ∂xl ∂xk ∂x ∂x ∂xl n+j k j=1 m m X X ∂ 2 fi ∂ϕj ∂ϕh ∂ϕj ∂ 2 fi (x, ϕ(x)) (x) + (x, ϕ(x)) (x) (x) + ∂xl ∂xn+j ∂xk ∂xn+h ∂xn+j ∂xl ∂xk j=1 h=1

+

m X j=1

2

∂ ϕj ∂fi (x, ϕ(x)) (x), ∂xn+j ∂xl ∂xk

para cada i = 1, 2, . . . , m, lo que da lugar a un sistema lineal en las m incógnitas ∂ 2 ϕj (x), j = 1, 2, . . . , m, ∂xl ∂xk cuya matriz de coeficientes es la misma que antes. Nótese además que el término independiente viene dado por las derivadas de f y las parciales primeras de ϕ, que en el punto a ya han sido determinadas previamente. Repitiendo este argumento se obtienen recursivamente las derivadas sucesivas de las funciones implícitas en el punto a como soluciones de sistemas lineales, todos ellos con la misma matriz de coeficientes. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

47

3.3.1. Teoremas de rango Los teoremas de rango van encaminados en el mismo sentido que el de las funciones implícitas. Su análogo algebraico es el de la triangulación de matrices no cuadradas y, al igual que los anteriores, tienen carácter local. Definición 3.23. Sean A un abierto de Rn , a un punto de A y f una aplicación de A en Rm de clase C 1 . Se dice que f es una inmersión en a si f ′ (a) es una aplicación inyectiva de Rn en Rm (nótese que debe ser n ≤ m). Se dice que f es una submersión en el punto a si f ′ (a) es suprayectiva (en este caso debe ser n ≥ m). Teorema 3.24 (de inmersión). Sean A un abierto de Rn y f una aplicación de A en Rm de clase C k , tal que f es una inmersión en un punto x0 ∈ A. Entonces existen un entorno abierto V de f (x0 ) en Rm , un entorno abierto U de x0 en Rn , con f (U ) ⊂ V , y un difeomorfismo ϕ de clase C k de V en ϕ(V ), tales que la restricción de ϕ ◦ f a U es la inyección canónica de Rn en Rn × {0}m−n . Es decir, (ϕ ◦ f )(x1 , x2 , . . . , xn ) = (x1 , x2 , . . . , xn , 0, . . . , 0). Teorema 3.25 (de submersión). Sea A un abierto de Rn y f una aplicación de A en Rm de clase C k , que es una submersión en un punto x0 ∈ A. Existen entonces un entorno abierto U de x0 en Rn , y un difeomorfismo ϕ de clase C k de U en ϕ(U ) (conjunto abierto de Rn ), tales que, si π denota la proyección canónica de Rn sobre Rm , la restricción de f a U es π ◦ ϕ. Es decir, f ◦ ϕ−1 (x1 , x2 , . . . , xm , . . . , xn ) = (x1 , x2 , . . . , xm ). Observación 3.26. Los dos resultados anteriores se deducen fácilmente del teorema de las funciones implícitas. Hablando en un tono intuitivo, la conclusión de estos teoremas es que, salvo difeomorfismos, las variedades diferenciables (curvas, superficies, etc.) se pueden identificar localmente con subespacios lineales. Ambos teoremas son casos particulares de un resultado más general, que enunciamos a continuación, y cuya prueba resulta mucho más laboriosa y queda fuera de los objetivos de esta asignatura. Teorema 3.27 (del rango constante). Sean A un abierto de Rn y f : A → Rm una aplicación de clase C k y tal que el rango de f ′ (x) es r en cada punto x en un entorno de x0 ∈ A. Existen entonces un entorno abierto U de x0 , un entorno abierto V de f (x0 ) y difeomorfismos de clase C k , ϕ: U → ϕ(U ) ⊂ Rn , ψ: V → ψ(V ) ⊂ Rm , tales que para cada x = (x1 , x2 , . . . , xn ) ∈ ϕ(U ) se tiene que

ψ ◦ f ◦ ϕ−1 (x1 , x2 , . . . , xr , . . . , xn ) = (x1 , x2 , . . . , xr , 0, . . . , 0).

Ejercicios 3.1 Se considera la aplicación f : R2 → R2 definida por I) II ) III )

f (x, y) = e2 x − ey , ey .

Determinar el conjunto imagen f (R2 ).

Probar que f es inyectiva y obtener explícitamente la aplicación inversa f −1 . Comprobar que las matrices jacobianas de f y f −1 en puntos correspondientes son inversas una de la otra.

U NIVERSIDAD DE VALLADOLID

48

Tema 3. Aplicaciones diferenciables

3.2 Se consideran las aplicaciones f , g: R3 → R3 definidas por f (x, y, z)

=

g(x, y, z)

=

(x y z, x y + x z + y z, x),

x cos(y) cos(z), x cos(y) sen(z), x sen(y) .

Determinar los puntos de R3 donde f ◦ g admite inversa diferenciable.

3.3 Se consideran el abierto A = {(x, y) ∈ R2 : x > 0} ⊂ R2 y la aplicación f : A → R2 dada por x4 + y 4 , sen(x) + cos(x) . f (x, y) = x I ) ¿Es f inyectiva en A? II )

Determinar los puntos a de A para los que existe un entorno suyo donde f admite inversa de clase C 1 y calcular la matriz jacobiana de f −1 en f (a).

3.4 Sean g1 y g2 dos funciones de R2 en R, de clase C 1 y tales que: g1 (0, y) 6= 0, para cada y ∈ R,

Se define f : R2 → R2 por

y

g2 (x, 0) 6= 0, para cada x ∈ R.

f (x, y) = x g1 x, g2 (x, y) , y g2 g1 (x, y), y .

Probar que f es diferenciable y calcular f ′ . Deducir que f es inyectiva en un entorno de (0, 0). 3.5 Sea ϕ la función de R3 en R3 definida por ϕ(x, y, z) = (x2 + y 2 , x2 − y 2 , z 2 ).

I)

Determinar los puntos de R3 para los cuáles existe un entorno suyo en el que la aplicación ϕ es inyectiva.

II )

Sean U = {(x, y, z) ∈ R3 : x > 0, y > 0, z < 0} y V = {(u, v, w) ∈ R3 : u > |v|, w > 0}. Probar que ϕ es un difeomorfismo de U sobre V .

3.6 Sean U un abierto conexo de R2 y h = (h1 , h2 ): U → R2 una función cuyo jacobiano no se anula en ningún punto de U . Sean f, g: R → R funciones diferenciables, y φ: R2 → R una función diferenciable cuyas derivadas parciales no se anulan en ningún punto. Supongamos además que φ(f (u), g(v)) = 0 para todo (u, v) ∈ h(U ) . Probar que f es constante en h1 (U ) y g es constante en h2 (U ). Considerar h1 (x, y) = cos(xy) , h2 (x, y) = sen(xy) , f (u) = u2 , g(v) = v 2 , φ(α, β) = α + β − 1 . ¿Qué ocurre en este ejemplo en relación con lo anterior? 3.7 Sean U un abierto de Rn y f una función real de clase C 2 en U . Se dice que un punto crítico x de f es no degenerado si el determinante hessiano de f en x, det Hf (x), es distinto de cero. Demostrar que si x es un punto crítico no degenerado de f , existe un entorno V de x tal que V no contiene más puntos críticos de f que x. 3.8 Sea f : Rn → Rn una aplicación de clase C 1 y contractiva. Se define la función g de Rn en Rn por g(x) = x + f (x). I)

Probar que g es inyectiva y que el determinante jacobiano de g es no nulo en todo punto.

II )

Probar que la imagen de g es un conjunto abierto y cerrado. Concluir que g es un difeomorfismo de Rn en Rn .

3.9 Se consideran V = R2 \ {(0, 0), (1, 0), (−1, 0)} y la aplicación f de V en R2 dada por 1 1 . ,y 1 − 2 f (x, y) = x 1 + 2 x + y2 x + y2

Demostrar que f admite inversa en un entorno de cada punto de su dominio de definición. ¿Admite inversa globalmente?

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

49

Ejercicios

3.10 A partir del teorema de las funciones implícitas deducir como corolario el teorema de las funciones inversas; en otras palabras, comprobar que ambos enunciados son equivalentes. Sugerencia: La relación y = f (x), x ∈ A ⊂ Rn , y ∈ Rn se escribe también F (x, y) = f (x) − y, siendo F una aplicación definida de A × Rn a valores en Rn .

3.11 Comprobar que la función definida en R por f (0) = 0 ;

f (x) = x + 2 x2 sen 1/x ,

x 6= 0 ,

es derivable en todo punto y que en cualquier entorno del origen posee infinitos extremos relativos. Conclúyase que en el teorema de las funciones inversas no se puede relajar la hipótesis de continuidad de las derivadas en un entorno del punto. 3.12 Comprobar que las siguientes aplicaciones son de clase C ∞ , calcular el determinante jacobiano en cada punto y determinar abiertos en los que definan difeomorfismos: I ) Coordenadas polares en R2 : (r, θ) ∈ R2 7→ ϕ(r, θ) = r cos(θ), r sen(θ) II ) Coordenadas cilíndricas en R3 : (r, θ, z) ∈ R3 7→ ϕ(r, θ, z) = r cos(θ), r sen(θ), z III )

Coordenadas esféricas en R3 :

(r, θ, φ) ∈ R3 7→ ϕ(r, θ, φ) = r cos(θ) cos(φ), r sen(θ) cos(φ), r sen(φ) .

3.13 Sean U = (0, ∞) × (0, ∞) y ϕ: U → U la aplicación definida por (u, v) = ϕ(x, y) = x, y/x . I)

II )

Probar ϕ es un difeomorfismo de U sobre U .

Si f es una función derivable en U que satisface la ecuación diferencial x

∂f ∂f +y = f, ∂x ∂y

(3.5)

probar que para la función g = f ◦ ϕ−1 se tiene que u III )

∂g = g. ∂u

Encontrar todas las funciones derivables en U que verifican (3.5).

3.14 Realizando un cambio a coordenadas polares, encontrar una función real f , no nula, y de clase C 1 en un abierto A de R2 tal que x

∂f ∂f (x, y) − y (x, y) = f (x, y) ∂y ∂x

para todo (x, y) ∈ A.

3.15 Sea V = (a, b) × (c, d) un abierto de R2 (acotado o no). Probar que si f es una función real de clase C 2 en V y verifica que ∂2f (x, y) = 0 para todo (x, y) ∈ V, ∂x∂y entonces existen dos funciones F : (a, b) → R y G: (c, d) → R de clase C 2 tales que f (x, y) = F (x) + G(y)

para todo (x, y) ∈ V.

3.16 Sea f una función de clase C 2 en R2 que satisface la ecuación de ondas: 2 ∂2f 2∂ f (x, t) = a (x, t), ∂t2 ∂x2

a 6= 0.

Si Φ es la aplicación lineal de R2 en R2 dada por (x, t) = Φ(ξ, η) = g = f ◦ Φ, probar que g verifica

∂2g (ξ, η) = 0. ∂ξ∂η

ξ + η ξ − η y se define , 2 2a

Concluir que f (x, t) = F (x + at) + G(x − at) para ciertas funciones F, G ∈ C 2 (R). U NIVERSIDAD DE VALLADOLID

50

Tema 3. Aplicaciones diferenciables

3.17 Sean a y b números reales, con a 6= b. Resolver la ecuación

∂2f ∂2f ∂2f − (a + b) + ab 2 = 0 2 ∂u ∂u∂v ∂v transformándola en la ecuación ∂2f =0 ∂x∂y

mediante el uso de las variables x, y determinadas por las relaciones x = v + au, y = v + bu. 3.18 Demostrar que la relación x3 + y 3 − 3xy − 1 = 0

define, en un entorno de 0 ∈ R, una función implícita y = ϕ(x) con ϕ(0) = 1. Determinar el desarrollo de Taylor de orden 3 en el punto 0 de la función ϕ. 3.19 Calcular el polinomio de Taylor de orden 2 en el punto (1, 1) de la función z definida implícitamente en un entorno de dicho punto por la ecuación z 15 + y 2 z 2 − xy 7 − x8 = 0,

con z(1, 1) = 1.

3.20 Sea f : R → R de clase C 1 y tal que f (0) = 0 f ′ (0) = −2 . Demostrar que la relación y − z x = f (z)

define en un entorno del punto (1, 0) una función implícita z = z(x, y) con z(1, 0) = 0. Probar que existe un entorno W de dicho punto donde se verifica que ∂z ∂z (x, y) + z(x, y) (x, y) = 0, ∂x ∂y

(x, y) ∈ W.

3.21 Sea α y β números reales. Comprobar que la ecuación sen(α x + β y + z) ez = 0 define una función implícita zαβ = zαβ (x, y) en un entorno del punto (0, 0) con zαβ (0, 0) = 0. Determinar los valores de α y β para los que se verifica que ∂zαβ (0, 0) = 3 ∂x

y

∂zαβ (0, 0) = −3. ∂y

3.22 Sea ϕ una función de clase C ∞ en R con ϕ(1) 6= 0. Se define Z ez F (x, y, z) = ϕ(t)dt, (x, y, z) ∈ R3 . xy

Demostrar que, en un entorno del punto (1, 1, 0), la ecuación F (x, y, z) = 0 define una función implícita z = z(x, y) de clase C ∞ . Determinar el polinomio de Taylor de orden 2 de la función z en el punto (1, 1). 3.23 Probar que la ecuación (y − 1)2 + x2 + eyz = (z − 1)2

define una función implícita z = z(x, y) en un entorno del punto (0, 1) con z(0, 1) = 0. Demostrar que la función z presenta un máximo relativo en dicho punto. 3.24 En el abierto R2 × (0, ∞) se considera la ecuación 2

ezx + log(x2 + y 2 + z) = 1. Comprobar que dicha relación define una función implícita z = z(x, y) de clase C ∞ en una bola abierta centrada en (0, 0) y tal que z(0, 0) = 1. ¿Presenta z(x, y) algún extremo local en (0, 0)? LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

51

3.25 Comprobar que la ecuación x + y + z + cos(xyz) = 1 define a z como función implícita z = ϕ(x, y), de clase C ∞ , en un entorno del punto (0, 0), con ϕ(0, 0) = 0, y demostrar que z(x, y) + x + y = 0. l´ım x2 + y 2 (x,y)→(0,0) 3.26 Demostrar que el sistema de ecuaciones ( x z3 + y u + 2 x = 1

2 x y 3 + u2 z + 2 y = 2

define funciones implícitas x = x(z, u) , y = y(z, u) en un entorno del punto (0, 1) , con x(0, 1) = 0 , y(0, 1) = 1 . Demostrar que la aplicación ϕ(z, u) = x(z, u), y(z, u) admite inversa diferenciable en un entorno de (0, 1) . 3.27 Comprobar que el sistema de ecuaciones ( x y2 + x z u + y v2 = 3

u3 y z + z x v − u2 v 2 = 1

define, en un entorno del punto (1, 1, 1), funciones implícitas u = u(x, y, z), v = v(x, y, z), con ∂v u(1, 1, 1) = 1, v(1, 1, 1) = 1. Calcular (1, 1, 1). ∂y 3.28 Demostrar que el sistema ( y sen(z) + 1 + x2 + z + u − 2 y + 1 = 0 2 x3 + u y − z = 0

define funciones implícitas de clase C ∞ , z = z(x, y), u = u(x, y) en un entorno del punto (0, 1), con z(0, 1) = 0, u(0, 1) = 0. Calcular los polinomios de Taylor de orden 2 de las funciones z y u en el punto (0, 1). 3.29 Determinar los valores de a para los cuáles el sistema de ecuaciones ( cos(axz) − y w = 0 x2 + eayz − w = 1

define funciones implícitas z = ϕ1 (x, y) , w = ϕ2 (x, y) , de clase C ∞ en un abierto U que contiene al punto x0 = (1, 1), tales que ϕ1 (1, 1) = 0 y ϕ2 (1, 1) = 1 . Para esos valores de a estudiar si la aplicación ϕ = (ϕ1 , ϕ2 ): U → R2 admite inversa diferenciable en un entorno de x0 . 3.30 Comprobar que el sistema de ecuaciones  3 x + 2 y + z2 + u + v2 = 0   4 x + 3 y + z + u2 + v + w + 2 = 0   x + z + u2 + w + 2 = 0

define a (u, v, w) como funciones implícitas de (x, y, z), de clase C ∞ en un entorno del punto (x0 , y0 , z0 ) = (0, 0, 0), y con u(0, 0, 0) = 0, v(0, 0, 0) = 0, w(0, 0, 0) = −2 . ∂u ∂v ∂w Calcular (0, 0, 0), (0, 0, 0) y (0, 0, 0). ∂x ∂y ∂z 3.31 Se considera el sistema de ecuaciones ( 2 y z + exz + cos(xy) = 3,

yz 2 + exy + sen(xz) = 2.

U NIVERSIDAD DE VALLADOLID

52 I) II )

Tema 3. Aplicaciones diferenciables

Probar que dicho sistema define funciones implícitas y = ϕ1 (x), z = ϕ2 (x) de clase C ∞ en un entorno de 0 ∈ R, con ϕ1 (0) = 1, ϕ2 (0) = 1.

Estudiar si la función h, definida en un entorno de 0 por h(x) = x + ϕ1 (x) + ϕ2 (x),

presenta un extremo relativo en 0. En caso afirmativo, indicar si es máximo o mínimo. 3.32 Sean f y g dos funciones de clase C 2 en R. Se supone que g ′ (0) = 0 y g ′′ (0) 6= 0. I)

Comprobar que la relación

x + yf ′ (z) + g ′ (z) = 0 define una función implícita z = z(x, y) de clase C 1 en una bola U centrada en (0, 0) y tal que z(0, 0) = 0. II )

Se considera la función F definida en U por

F (x, y) = x z(x, y) + y f z(x, y) + g z(x, y) .

Demostrar que F es de clase C 2 en U y determinar el polinomio de Taylor de orden 2 de F en (0, 0). III)

Comprobar que en U se verifica la siguiente igualdad: 2 2 ∂ F ∂2F ∂2F = . ∂x2 ∂y 2 ∂x∂y

3.33 Sean f1 y f2 las funciones definidas en {(x, y, z, w) ∈ R4 : z < 0} por y f1 (x, y, z, w) = 3 x2 z + 6 w y 2 + 3 ; f2 (x, y, z, w) = x w − 4 − 8 . z I ) Probar que el sistema de ecuaciones f1 (x, y, z, w), f2 (x, y, z, w) = (0, 0) define funciones implícitas x(z, w) e y(z, w) , de clase C ∞ en un entorno U del punto (z0 , w0 ) = (−1, 0) , y con x(−1, 0) = 1, y(−1, 0) = 2 . II ) Sea g: U → R2 la aplicación definida por g(z, w) = x(z, w), y(z, w) . Estudiar si g admite inversa diferenciable en un entorno de (z0 , w0 ) = (−1, 0) . En caso afirmativo calcular Jg −1 (1, 2). III)

Calcular

∂2x (−1, 0) . ∂z 2

3.34 Consideremos la familia de polinomios {Pt }t∈R , en la variable x, y cuyos coeficientes son funciones de t ∈ R, definidos por: Pt (x) = x4 − (1 + t) x3 − cos(t) x2 + (1 + t) .

I)

Comprobar que para t próximo a t0 = 0 el polinomio Pt tiene una raíz próxima a x0 = 1, a la que denotaremos x(t).

II )

Para precisar la idea de proximidad del apartado anterior, estimar |x(t) − 1| (el error que se comete al sustituir la raíz x(t) por x0 = 1) cuando t tiende hacia 0.

Tema 4

Sucesiones y series funcionales El lector ya ha tratado el problema de dar sentido preciso al concepto de suma infinita al tratar las series numéricas. El problema que aquí abordamos es similar y generaliza lo anterior: los objetos a sumar son ahora funciones en lugar de números. Las propiedades enunciadas para funciones (continuidad, derivabilidad, etc.) suscitan de forma natural nuevos problemas; por ejemplo, la suma finita de funciones continuas es una función continua, pero ¿qué se puede decir acerca de la suma de una serie de funciones continuas? El objetivo principal de este tema consiste, por tanto, en el estudio de las propiedades de continuidad, derivabilidad e integrabilidad en los procesos de paso al límite. Los resultados que se exponen, además del interés que tienen por sí mismos, aportan la herramienta necesaria para el estudio de las series de potencias o el de las series trigonométricas, protagonistas del Análisis de Fourier.

4.1. Sucesiones de funciones. Modos de convergencia Definición 4.1. Sea X un conjunto no vacío. Se denota por F (X, R) el espacio vectorial de las funciones de X en R . Una sucesión de funciones reales en X es una sucesión de elementos de F (X, R) . La notación y terminología general de sucesiones se aplica igualmente en este caso, así que la forma usual de denotar una sucesión de funciones es {fn }∞ n=1 . Dar una sucesión de funciones en el conjunto X es dar, para cada x ∈ X, una sucesión numérica; los conceptos relativos a estas últimas dan lugar a los que a continuación se presentan. Definición 4.2. Se dice que una sucesión {fn }∞ n=1 de funciones reales en X es puntualmente acotada si la sucesión numérica {fn (x)}∞ n=1 es acotada para cada x ∈ X.

Análogamente se definen las sucesiones de funciones reales puntualmente acotadas superior o inferiormente.

Una sucesión {fn }∞ n=1 de funciones reales en X es uniformemente acotada o totalmente acotada si existe una constante M ≥ 0 tal que fn (x) ≤ M para todos x ∈ X y n ∈ N .

Observación 4.3. El adjetivo “uniforme” se usa de nuevo en el sentido de generalidad, concretamente: la acotación es independiente del punto x ∈ X. Resulta evidente de la definición que toda sucesión uniformemente acotada es puntualmente acotada, pero el recíproco no es cierto, es decir, una sucesión puede ser puntualmente acotada sin ser uniformemente acotada. Basta considerar la sucesión de funciones reales definidas en R por fn (x) = x/n , n ∈ N . Definición 4.4. Se dice que una sucesión {fn }∞ n=1 de funciones reales en X es monótona creciente (resp. decreciente) si fn (x) ≤ fn+1 (x) (resp. fn (x) ≥ fn+1 (x)) para todo x ∈ X y todo n ∈ N. 53

54

Tema 4. Sucesiones y series funcionales

Definición 4.5. Sea {fn }∞ n=1 una sucesión de funciones reales en el conjunto X. Se dice que la sucesión es puntualmente convergente si para cada x ∈ X la sucesión numérica {fn (x)}∞ n=1 es convergente. En este caso la función f definida en X por f (x) = l´ım fn (x) , n→∞

x ∈ X,

se denomina límite puntual de la sucesión {fn }∞ n=1 . Definición 4.6. Sea {fn }∞ n=1 una sucesión de funciones reales en el conjunto X. Se dice que la sucesión es uniformemente convergente si existe una función f en X verificando la siguiente propiedad: “Para cada número real ε > 0 existe un número natural n0 (que depende de ε ) tal que para todo número natural n ≥ n0 se tiene que fn (x) − f (x) < ε para cada x ∈ X”.

Observación 4.7. No es difícil comprobar que, si la sucesión {fn }∞ n=1 es uniformemente convergente, entonces es puntualmente convergente y la función f de la definición anterior es precisamente el límite puntual de la sucesión. Proposición 4.8. Sea {fn }∞ n=1 una sucesión de funciones reales en un conjunto X. I)

II )

Si {fn }∞ n=1 es puntualmente convergente entonces está puntualmente acotada.

Si la sucesión {fn }∞ n=1 es de funciones acotadas en X y es uniformemente convergente, entonces el límite puntual f es una función acotada y la sucesión está uniformemente acotada.

∞ Proposición 4.9. Sean {fn }∞ n=1 y {gn }n=1 dos sucesiones de funciones en un mismo conjunto X, que convergen uniformemente en X hacia las funciones f y g, respectivamente.

I) II )

La sucesión {fn + gn }∞ n=1 converge uniformemente hacia f + g en X. Si, además, ambas sucesiones están uniformemente acotadas en X, entonces {fn gn }∞ n=1 converge uniformemente en X hacia f g .

Observaciones 4.10. I)

Si se suprime la hipótesis de acotación uniforme sólo se puede garantizar, a priori, la convergencia puntual de {fn gn }∞ n=1 ; considérense, como contraejemplo, las sucesiones de funciones reales definidas en (0, 1) por fn (x) = x + 1/n ; gn (x) = 1/x .

II )

∞ Es fácil comprobar que {fn }∞ n=1 converge uniformemente hacia f si, y sólo si, {fn − f }n=1 converge uniformemente hacia 0. Esto proporciona el siguiente criterio de convergencia uniforme de uso habitual en la práctica.

Proposición 4.11. Sea {fn }∞ n=1 una sucesión de funciones reales que converge puntualmente en un conjunto X hacia la función f . Para cada n ∈ N se define mn = sup |fn (x) − f (x)| : x ∈ X , con el convenio de que mn = ∞ si el conjunto |fn (x) − f (x)| : x ∈ X no es acotado. Son equivalentes los siguientes asertos: a) La sucesión {fn }∞ n=1 converge uniformemente en X hacia f .

b) Existe un n0 ∈ N tal que mn ∈ R para cada n ≥ n0 y la sucesión de números reales {mn }∞ n=n0 converge hacia 0 . Corolario 4.12. Con la notación de la proposición anterior, si existe una sucesión {µn }∞ n=1 de números reales convergente hacia 0 y tal que, para cada n ∈ N , se tiene que |fn (x) − f (x)| ≤ µn

para todo x ∈ X,

entonces la sucesión {fn }∞ n=1 converge uniformemente en X hacia f . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

55

4.2. Series de funciones

La condición de convergencia uniforme se puede dar, como sucede para sucesiones numéricas, evitando la mención de la función límite. Independientemente de cual sea el conjunto X, la clave está en la completitud del espacio de llegada. Definición 4.13. Sea {fn }∞ n=1 una sucesión de funciones reales en el conjunto X. Se dice que la sucesión es uniformemente de Cauchy en X si verifica la siguiente propiedad: “Para cada número real ε > 0 existe un número natural n0 (que depende de ε) tal que para cada par de números naturales n, m ≥ n0 se tiene que fn (x) − fm (x) < ε para cada x ∈ X”.

Proposición 4.14 (Criterio de convergencia uniforme de Cauchy). Una sucesión de funciones reales en el conjunto X es uniformemente convergente en X si, y sólo si, es uniformemente de Cauchy en X. Observación 4.15. Estamos tratando sólo el caso de funciones reales, pero no hay ninguna dificultad en extender la mayor parte de las definiciones y propiedades al caso de aplicaciones a valores en Rk , en general en un espacio normado, o para funciones complejas. Únicamente carecen de sentido aquellos conceptos enunciados en términos de la relación de orden en R, como la monotonía. Ahora bien, en el caso de aplicaciones f = (f1 , f2 , . . . , fk ) definidas en subconjuntos de Rm con llegada en Rk , es suficiente el contexto en el que estamos trabajando pues, a tenor de lo expuesto en los dos primeros temas, las nociones y propiedades de límites, continuidad y derivabilidad para f se reducen a los correspondientes sobre las funciones componentes fi . La mera convergencia puntual de una sucesión de funciones continuas no garantiza nada acerca del límite. Sin embargo, bajo la condición de convergencia uniforme la función límite hereda el carácter continuo de la sucesión. Aunque admite una formulación más general en espacios métricos, el teorema siguiente concreta esta aseveración en el caso de funciones reales definidas en subconjuntos de Rm , lo que es suficiente para nuestros propósitos. Teorema 4.16 (Continuidad del límite puntual uniforme). Sean X un subconjunto de Rm y {fn }∞ n=1 una sucesión de funciones que converge uniformemente en X hacia la función f . Si x0 ∈ X es tal que fn es continua en x0 para cada n ∈ N, entonces f es continua en x0 . En consecuencia, si fn es continua en X para cada n ∈ N, la función límite f es continua en X. A modo de recíproco, el teorema de Dini, que también es válido en el ámbito de los espacios métricos, establece la convergencia uniforme bajo condiciones de monotonía. Teorema 4.17 (de Dini). Sean X un subconjunto compacto de Rm y {fn }∞ n=1 una sucesión monótona de funciones reales y continuas en X, que converge puntualmente en X hacia una función continua f . Entonces {fn }∞ n=1 converge uniformemente en X hacia f .

4.2. Series de funciones Comencemos recordando que una serie numérica no es otra cosa que una sucesión, la de sumas parciales, construida a partir de otra sucesión, la de sus términos de la serie. En consecuencia todo lo que se ha expuesto en la sección anterior tiene su correspondiente traducción al caso de sumas parciales de sucesiones de funciones. Pero, como sucede en el caso de series numéricas, existen ciertas peculiaridades que motivan este estudio aparte. Definición 4.18. Dada una sucesión {fn }∞ n=1 de funciones reales en un conjunto no vacío X, se denomina serie de término general fn a la sucesión {Sn }∞ n=1 definida por Sn = f 1 + f 2 + . . . + f n =

n X

fj ,

n = 1, 2, . . .

j=1

Sn recibe el nombre de suma parcial n-ésima y fn se denomina término n-ésimo de la serie. ∞ P fn . Es usual representar una serie de término general fn de forma abreviada por n=1

U NIVERSIDAD DE VALLADOLID

56

Tema 4. Sucesiones y series funcionales

Las nociones de acotación y convergencia, tanto puntual como uniforme, para una serie de funciones son obvias: las que se refieren a la sucesión funcional de las sumas parciales. En particular: Definición 4.19. Una serie de funciones

∞ P

fn en un conjunto X es puntualmente conver-

n=1

gente si la sucesión {Sn }∞ n=1 de sumas parciales de la misma es puntualmente convergente en X. En este caso la función f definida en X por f (x) = l´ım Sn (x) n→∞

se denomina función suma de la serie y se suele denotar también, en un abuso de notación, ∞ P fn , esto es, por f = n=1

f (x) =

∞ X

fn (x) ,

n=1

x ∈ X.

Observaciones 4.20. I)

De la teoría general de series numéricas convergentes se deduce que, si una serie de funciones es puntualmente convergente, entonces el término general ha de converger puntualmente hacia 0. Pero esta condición no es suficiente para la convergencia puntual de la serie.

II )

Además de lo dicho en general para sucesiones funcionales, aparecen ahora nuevas nociones de convergencia, relacionadas con la convergencia absoluta de series numéricas.

Definición 4.21. Dada una serie de funciones

∞ P

fn en un conjunto X, si la serie

n=1

∞ P

n=1

|fn | es

puntualmente convergente en X se dice que la serie original es absolutamente convergente (de forma puntual) en X. Obviamente, toda serie absolutamente convergente es puntualmente convergente. En cuanto a la convergencia uniforme, el criterio de Cauchy se traduce de forma obvia para series de funciones: Proposición 4.22 (Criterio de convergencia uniforme de Cauchy). Sea

∞ P

fn una serie

n=1

de funciones en un conjunto X. Es condición necesaria y suficiente para que la serie sea uniformemente convergente en X que se verifique la siguiente propiedad: “Para cada número real ε > 0 existe un número natural n0 (que depende de ε) tal que para cada par de números naturales p y q con p > q ≥ n0 se tiene que Sp (x) − Sq (x) = fq+1 (x) + . . . + fp (x) < ε para todo x ∈ X”. Definición 4.23. Sea

∞ P

fn una serie de funciones en un conjunto X. Se dice que la serie

n=1

converge normalmente en X si existe una serie convergente de números reales no negativos ∞ P mn tal que para todo n ∈ N se tiene que n=1

fn (x) ≤ mn

para cada x ∈ X.

Observación 4.24. La convergencia normal o en norma se denomina así por la siguiente razón: si en el espacio vectorial B(X, R) de las funciones definidas en X a valores reales y acotadas se considera kf k∞ = sup |f (x)| : x ∈ X , entonces k · k∞ es realmente una norma en B(X, R) .

El modo de convergencia normal es más fuerte que los otros mencionados, explícitamente:

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

57

4.2. Series de funciones

Proposición 4.25 (Criterio de Weierstrass). Sea

∞ P

fn una serie de funciones reales en

n=1

el conjunto X. Si la serie converge normalmente en X, entonces converge absolutamente y uniformemente en X. Como corolario inmediato del teorema 4.16 tenemos el siguiente resultado. Teorema 4.26 (Continuidad de la suma uniforme). Sean X un subconjunto de Rm y

∞ P

fn

n=1

una serie de funciones que converge uniformemente en X hacia la función f . Si x0 ∈ X es tal que fn es continua en x0 para cada n ∈ N, entonces f es continua en x0 . ∞ P En consecuencia, si fn es continua en X para cada n ∈ N, la función suma fn es n=1

continua en X.

Observación 4.27. Existen series funcionales uniformemente convergentes que no son normalmente convergentes. Al igual que sucede para series numéricas, el tratamiento de las series funcionales cuyos términos toman valores de signo arbitrario y no son normalmente convergentes requiere un estudio particular en cada caso. Los resultados siguientes, que se deducen a partir de la fórmula de Abel, dan condiciones suficientes para la convergencia uniforme de una serie de funciones. ∞ Lema 4.28 (Fórmula de sumación por partes de Abel). Sean {an }∞ n=1 y {bn }n=1 dos sucesiones de números reales. Pongamos

S0 = 0 ;

Sn = a1 + a2 + . . . + an =

n X

k=1

ak ,

n ∈ N.

Entonces, para cada par de números naturales p y q , con p > q ≥ 1 , se verifica la identidad p X

k=q

ak bk = Sp bp+1 − Sq−1 bq +

p X

k=q

Sk (bk − bk+1 ) .

∞ Proposición 4.29 (Criterio de Abel). Sean {fn }∞ n=1 , {gn }n=1 sucesiones de funciones en un conjunto X. Se supone que: ∞ P fn converge uniformemente en X. I ) La serie n=1

La sucesión {gn }∞ n=1 es monótona y uniformemente acotada en X. ∞ P fn gn converge uniformemente en X. Entonces la serie II )

n=1

∞ Proposición 4.30 (Criterio de Dirichlet). Sean {fn }∞ n=1 , {gn }n=1 sucesiones de funciones en un conjunto X. Se supone que: ∞ P fn está uniformemente acotada en X. I ) La sucesión de sumas parciales de la serie n=1

La sucesión {gn }∞ n=1 es monótona decreciente y converge uniformemente hacia 0 en X. ∞ P fn gn converge uniformemente en X. Entonces la serie II )

n=1

Corolario 4.31 (Criterio de Leibniz para series alternadas). Sea {fn }∞ n=1 una sucesión de funciones reales en el conjunto X. Si {fn }∞ es monótona decreciente y converge uniformen=1 ∞ P (−1)n fn converge uniformemente en X. mente hacia 0 en X, entonces la serie n=1

U NIVERSIDAD DE VALLADOLID

58

Tema 4. Sucesiones y series funcionales

4.3. Sucesiones y series de funciones de variable real Prestamos ahora atención a las propiedades de derivación e integración en el sentido de Riemann para funciones definidas en intervalos de la recta. El objetivo es precisar condiciones bajo las cuales la función límite herede estas propiedades de los términos de la sucesión. Teorema 4.32 (Derivabilidad del límite puntual). Sean I un intervalo abierto de R y {fn }∞ n=1 una sucesión de funciones derivables en I. Se supone que: I)

II )

La sucesión de derivadas {fn ′ }∞ n=1 converge uniformemente en los subintervalos compactos de I hacia una función g .

Existe un x0 ∈ I tal que la sucesión numérica {fn (x0 )}∞ n=1 es convergente.

Entonces la sucesión {fn }∞ n=1 converge uniformemente en los compactos de I hacia una función f que es derivable en I . Además, f ′ (x) = g(x)

para cada x ∈ I .

Corolario 4.33 (Derivabilidad de la función suma). Sean I un intervalo abierto de R y ∞ P fn una serie de funciones derivables en I . Se supone que: n=1

I)

La serie de las derivadas

∞ P

fn ′ converge uniformemente en los compactos de I.

n=1

II )

Existe un x0 ∈ I tal que la serie numérica

Entonces la serie

∞ P

∞ P

fn (x0 ) es convergente.

n=1

fn converge uniformemente en los compactos de I. Además,

n=1

X ∞

n=1

fn

′

(x) =

∞ X

fn ′ (x)

para cada x ∈ I .

n=1

Observaciones 4.34. I)

La última igualdad establece que, en las condiciones señaladas, la derivada de la suma es la suma de las derivadas, igual que en el caso finito.

II )

La segunda hipótesis del teorema 4.32 (resp. de 4.33) es esencial para poder garantizar ∞ P fn ). Como contraejemplo, considérese la la convergencia puntual de {fn }∞ n=1 (resp. de sucesión de funciones definidas en R por

n=1

fn (x) = (−1)n . Resulta que fn ′ ≡ 0 para todo n ∈ N, pero {fn }∞ n=1 no converge en ningún punto. Teorema 4.35 (Integrabilidad del límite puntual). Sea {fn }∞ n=1 una sucesión de funciones integrables (en el sentido de Riemann) en el intervalo [a, b], que converge uniformemente en [a, b] hacia una función f . Entonces: I) II )

f es integrable en [a, b]. Si se consideran las funciones definidas en [a, b] por Z x Z x fn , f; Fn (x) = F (x) = a

a

n ∈ N,

la sucesión de funciones {Fn }∞ n=1 converge uniformemente en [a, b] hacia F . En particular, Z b Z b fn . f = l´ım a

n→∞

a

Observación 4.36. Algunos autores definen función integrable en el sentido de Riemann como aquélla que es límite uniforme de funciones escalonadas en el correspondiente intervalo compacto [a, b]. El teorema anterior establece la equivalencia entre esta construcción de la integral y la original de Riemann. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

4.4. Aproximación de funciones continuas

Corolario 4.37 (Integrabilidad de la función suma). Sea

∞ P

59

fn una serie de funciones inte-

n=1

grables en el intervalo [a, b], que converge uniformemente en [a, b]. Entonces: I) II )

La función suma es integrable en [a, b]. Si se consideran las funciones definidas en [a, b] por Z xX Z ∞ F (x) = fn ; Fn (x) = a

la serie de funciones

∞ P

n=1

x

fn , a

Fn converge uniformemente en [a, b] hacia F . En particular,

n=1

Corolario 4.38. Sea

∞ P

Z

b a

∞ X

n=1

fn =

∞ Z X

n=1

b

fn . a

fn una serie de funciones integrables en el intervalo [a, b], que con-

n=1

verge normalmente en [a, b]. Entonces la función suma es integrable en [a, b]; además Z b X ∞ ∞ Z b X ≤ f |fn | . n a

n=1

n=1

a

Observación 4.39. El teorema 4.35 y el corolario 4.37 admiten una generalización al caso de funciones de varias variables reales. Ahora bien, la teoría de Lebesgue, que abordamos en posteriores temas, proporciona una herramienta mucho más potente que la teoría de Riemann y, en particular, este tipo de teoremas de paso al límite bajo el signo integral se enuncian bajo condiciones menos restrictivas que la de la convergencia uniforme.

4.4. Aproximación de funciones continuas A tenor de los resultados precedentes, es posible obtener información sobre las propiedades de una función f a partir de las de los términos de una sucesión {fn }∞ n=1 que converge hacia ella. Ahora, a modo de recíproco, nos planteamos si es posible elegir las funciones fn de manera que gocen de buenas propiedades y sean “sencillas”, esto proporciona una herramienta de razonamiento muy útil. Hablando desde un punto de vista algebraico las funciones más sencillas son si duda los polinomios. Se podría pensar que la fórmula de Taylor da respuesta al planteamiento anterior pero, en primer lugar, requiere de la regularidad de la función, y además la aproximación que proporciona es local (en un entorno del punto). Puede suceder incluso que para una función f de clase C ∞ en un entorno de x0 los polinomios de Taylor de de f en x0 no converjan hacia f (ver ejercicio 4.29). Cuando se consideran funciones continuas en conjuntos compactos se obtienen interesantes propiedades de aproximación. Los siguientes resultados precisan esta afirmación en el caso de funciones definidas en intervalos de la recta. Definición 4.40. Sea f una función real definida y continua en el intervalo [0, 1]. Para cada n ∈ N se define n X n k x (1 − x)n−k , f k/n Bn (f )(x) = k k=0

que se denomina polinomio de Bernstein de orden n asociado a f .

Teorema 4.41 (de Bernstein). Si f : [0, 1] → R es continua, la sucesión de polinomios de Bernstein {Bn (f )}∞ n=1 converge uniformemente hacia f en [0, 1]. U NIVERSIDAD DE VALLADOLID

60

Tema 4. Sucesiones y series funcionales

Teorema 4.42 (de aproximación polinomial, de Weierstrass). Sean I = [a, b] un intervalo compacto de R y f una función continua en I. Existe una sucesión de polinomios {Pn }∞ n=1 que converge uniformemente en I hacia f . En particular, dado ε > 0 existe un polinomio P tal que f (x) − P (x) < ε para cada x ∈ I. Definición 4.43. Se denomina polinomio trigonométrico a toda función de la forma m m X X ak cos(k t) + bk sen(k t) . ak cos(k t) + bk sen(k t) = a0 + P (t) = k=1

k=0

El número natural m es el orden del polinomio P (supuesto que am 6= 0 o bm 6= 0).

Corolario 4.44. Sea f : [−π, π] → R una función continua y par (f (x) = f (−x) , x ∈ [−π, π]). Existe una sucesión de polinomios trigonométricos pares Pn (t) =

mn X

an,k cos(k t) ,

k=0

que converge uniformemente en [−π, π] hacia f . Corolario 4.45. Sea f : [−π, π] → R una función continua, impar (f (x) = −f (−x) , x ∈ [−π, π]) y tal que f (−π) = 0 = f (π). Existe una sucesión de polinomios trigonométricos impares Qn (t) =

mn X

bn,k sen(k t) ,

k=1

que converge uniformemente en [−π, π] hacia f . Teorema 4.46 (de aproximación trigonométrica, de Weierstrass). Sea f : R → R una función continua y periódica de periodo 2 π. Existe una sucesión de polinomios trigonométricos que converge uniformemente hacia f en R. 4.4.1. Comentarios sobre la generalización del teorema de Weierstrass Aquí hemos presentado el teorema clásico de Weierstrass 4.42 como consecuencia del de Bernstein 4.41, pero este segundo data de los comienzos del siglo XX, mientras que el otro fue probado por Weierstrass en 1885. Numerosos autores han contribuido con distintas pruebas del teorema de Weierstrass: Picard (1890), Volterra (1897), Lebesgue (1898), Mittag-Leffler (1900), Landau (1908), Bernstein (1912), Montel (1918), ... En 1937, Stone presenta una generalización del teorema clásico Weierstrass, basada en él, pero que contempla como dominio de definición de las funciones espacios compactos en general, y clases de funciones (álgebras) abstractas. En realidad la clave del razonamiento de Stone radica en probar que si se pueden aproximar dos funciones f y g también pueden aproximarse m´ax{f, g} y m´ın{f, g} y para √ ello se requiere sólo de la aproximación uniforme por polinomios de la función t ∈ [−1, 1] 7→ t2 = |t|. Por no salir del ámbito de estas notas, enunciamos este resultado en el caso de compactos de Rn , aunque esta restricción no aporte ninguna simplificación en su demostración. Notación: Dados dos espacios métricos E y F (por ejemplo, subconjuntos de Rn y Rm , respectivamente) se denota por C (E, F ) al espacio vectorial de las funciones continuas de E en F . Si F = R se pone simplemente C (E, R) = C (E). Si E es compacto, los elementos de C (E) y C (E, C) son funciones acotadas y es posible dotar a este espacio de la norma kf k∞ = m´ax |f (x)| : x ∈ E ,

cuya topología asociada, en virtud de la proposición 4.11, es la de la convergencia uniforme: kfn − f k∞ −→ 0, si, y sólo si, {fn }∞ n=1 converge uniformemente hacia f . n→∞

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

61

Teorema 4.47 (de Stone-Weierstrass). Sea K un subconjunto compacto de Rn . Supongamos que A es una familia de elementos de C (K) que verifica I) II ) III )

A contiene a las funciones constantes. Si f, g ∈ A y α ∈ R, entonces f + g ∈ A , f g ∈ A y α f ∈ A (A es un álgebra).

Si x, y ∈ K, x 6= y, existe g ∈ A tal que g(x) 6= g(y) (A separa puntos).

Entonces, para cada f ∈ C (K) existe una sucesión {gn }∞ n=1 de elementos de A que converge uniformemente en K hacia f . Teorema 4.48 (de Stone-Weierstrass, versión compleja). Sea K un subconjunto compacto de Rn . Supongamos que A es una familia de elementos de C (K, C) que verifica I) II ) III ) IV )

A contiene a las funciones constantes. Si f, g ∈ A y α ∈ R, entonces f + g ∈ A , f g ∈ A y α f ∈ A . Si x, y ∈ K, x 6= y, existe g ∈ A tal que g(x) 6= g(y). Si f ∈ A entonces f ∈ A (A es autoadjunta).

Entonces, para cada f ∈ C (K, C) existe una sucesión {gn }∞ n=1 de elementos de A que converge uniformemente en K hacia f . Observación 4.49. En la terminología del Análisis Funcional el teorema de Stone-Weierstrass reza así: “Si A es una subálgebra autoadjunta de C (K, C) que contiene a las constantes y separa puntos, entonces A es densa en C (K, C), k · k∞ ”. Corolario 4.50. Sea K un subconjunto compacto de Rn . Toda función continua en K es límite uniforme en K de polinomios. Observación 4.51. Cuando se considera la circunferencia unidad T = {(x, y) ∈ R2 : x2 + y 2 = 1} ,

que es un compacto de R2 , las funciones f ∈ C (T) se identifican con funciones g continuas en R y de periodo 2 π mediante la relación g(t) = f cos(t), sen(t) . La versión trigonométrica del teorema de Weierstrass, el teorema 4.46, es un corolario prácticamente inmediato del resultado anterior, pues si P (x, y) es un polinomio en dos variables, entonces Q(t) = P cos(t), sen(t) es un polinomio trigonométrico.

Ejercicios 4.1 Estudiar la convergencia puntual y uniforme de las sucesiones de funciones {fn }∞ n=1 siguientes en los conjuntos que se indican: I) II ) III ) IV ) V) VI ) VII ) VIII)

fn (x) = xn , 1. x ∈ [0, 1]; n

2. x ∈ [0, 1/2]

fn (x) = x (1 − x) , x ∈ [0, 1] n fn (x) = n x 1 − x2 , x ∈ [0, 1] x fn (x) = , 1. x ∈ [a, b]; 2. x ∈ R n xn , x ∈ [0, 1] fn (x) = 1 + xn xn fn (x) = , x ∈ [0, 1] n + xn 1 , x∈R fn (x) = 1 + n x2 √ x n , x∈R fn (x) = 1 + n x2

U NIVERSIDAD DE VALLADOLID

62 IX) X) XI) XII) XIII)

XIV)

XV)

XVI) XVII) XVIII)

Tema 4. Sucesiones y series funcionales

fn (x) = senn (x) ,

i h π π 1. x ∈ − , ; 4 4

2. x ∈ R

x , x ∈ (0, ∞) 1 + nx x2 + n x fn (x) = , x∈R n nx fn (x) = , x∈R 1 + n2 x2 sen(n x) , x∈R fn (x) = 1 + n2 x2  x si 0 ≤ x ≤ n, x ∈ [0, ∞) fn (x) = n  1 si x > n.  1   n x si 0 ≤ x ≤ , n x ∈ [0, ∞) fn (x) = 1   1 si x > . nx n √ n fn (x) = x , x ∈ [0, 1] fn (x) =

fn (x) = x e−nx , x ∈ [0, ∞)

fn (x) = n x e−nx , x ∈ [0, ∞)

fn (x) = n2 x e−nx , x ∈ [0, ∞) ex XX) fn (x) = n , x ∈ (1, ∞). x

XIX)

4.2 Sea f : R → R una función uniformemente continua. Para cada n ∈ N se define 1 , x ∈ R. fn (x) = f x + n

Estudiar la convergencia de la sucesión {fn }∞ n=1 .

4.3 Sea f : [a, b] → R derivable. Demostrar que existe una sucesión {gn }∞ n=1 de funciones continuas en [a, b] tal que, para cada x ∈ [a, b], f ′ (x) = l´ım gn (x) . n→∞

4.4 Sea g una función continua en [0, 1] tal que g(1) = 0. Probar que la sucesión {fn }∞ n=1 , definida por fn (x) = xn g(x) , x ∈ [0, 1] , es uniformemente convergente en [0, 1].

4.5 Se considera la sucesión {fn }∞ n=1 definida por fn (x) = I) II )

2 n2 x

(1 +

n2 x2 ) log(n

+ 1)

,

x ∈ R.

Probar que {fn }∞ n=1 converge puntualmente, pero no uniformemente, en R .

Probar que si a > 0, entonces {fn }∞ n=1 converge uniformemente en el intervalo [a, ∞).

4.6 Estudiar la convergencia puntual y uniforme de la sucesión {fn }∞ n=1 de funciones definidas en el intervalo [0, 1] por  2 n x si 0 ≤ x ≤ 1/2n ,    fn (x) = n2 1/n − x si 1/2n < x < 1/n ,    0 si 1/n ≤ x ≤ 1 . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

63

Ejercicios

4.7 Dada f : R → R, probar que l´ım f (x) = a si, y sólo si, la sucesión {fn }∞ n=1 definida por x→∞

fn (x) = f (x + n),

x ∈ R,

converge uniformemente en [0, ∞) hacia la función con valor constante a. 4.8 Deducir, mediante el estudio de la sucesión de derivadas, que la sucesión de funciones {fn }∞ n=1 , definida por log(1 + n3 x2 ) fn (x) = , n2 converge uniformemente en [0, 1]. 4.9 Estudiar la convergencia puntual y uniforme en [0, 1] de la sucesión de funciones {fn }∞ n=1 definida por nx − 1 . fn (x) = 1 + x log(n) 1 + n x2 log(n)

4.10 I)

Sea {fn }∞ n=1 una sucesión de funciones que converge uniformemente hacia f en un conjunto A. Probar que, para toda sucesión {xn }∞ n=1 de puntos de A, se tiene que l´ım |fn (xn ) − f (xn )| = 0 .

n→∞

II )

Fijado a > 0 se considera la sucesión de funciones reales {fn }∞ n=1 definida en R por x n fn (x) = 1 − a + a cos √ . n Probar que esta sucesión converge puntualmente, pero no uniformemente, en R.

4.11 Estudiar la convergencia, para x ≥ 0, de la sucesión de funciones {fn }∞ n=1 definida por fn (x) = Calcular el valor de l´ım

n→∞

Z

1 0

n ex + x e−x . n+x

x2 + 1 fn (x) dx .

4.12 Probar que convergen uniformemente en R las series de funciones siguientes: I)

II )

∞ X senn (x) n5/2 n=1

∞ X 1 −n2 x2 e 3n n=1

∞ X cos(n x2 ) III ) . (n + 1)! n=0

4.13 Estudiar la convergencia puntual y uniforme en el intervalo [0, 2] de la serie funcional ∞ X

n=0

x (1 − x)n .

4.14 Probar que la serie funcional

converge uniformemente en [0, ∞) . U NIVERSIDAD DE VALLADOLID

∞ X enx − 1 2n enx n=0

64

Tema 4. Sucesiones y series funcionales

4.15 Estudiar la convergencia de la serie de funciones ∞ X

x2 (1 + x2 )n n=0 y hallar, donde proceda, el valor de su suma. 4.16 Se considera la serie funcional dada por ∞ X

xn . n (1 + n x2 ) n=1 Estudiar los dominios de convergencia puntual y uniforme. 4.17 Se consideran las funciones fn : [0, ∞) → R definidas por fn (x) = x n2 e−nx − (n − 1)2 e−(n−1)x , n = 1, 2, . . . I)

Probar que la serie

∞ P

n=1

II )

fn (x) converge en [0, ∞) y hallar su suma.

Demostrar que dicha serie no converge uniformemente en [0, ∞). ∞ P fn (x) es uniforme en [a, ∞). III) Demostrar que, si a > 0, la convergencia de n=1

4.18 Demostrar que la serie

∞ X xn (1 − x) log(n + 1) n=1

converge uniformemente en [0, 1], pero no converge normalmente: es decir, si n xn (1 − x) o mn = sup : x ∈ [0, 1] , n ∈ N, log(n + 1) la serie

∞ P

mn es divergente.

n=1

4.19 Demostrar que la serie funcional ∞ X

n=1

(−1)n

x2 + n n2

converge uniformemente en cualquier intervalo acotado, pero no converge absolutamente en ningún punto de R . 4.20 Estudiar la convergencia puntual en (0, ∞) de la serie funcional ∞ X log(1 + n x) n xn n=1

(nótese que log(1 + α) ≤ α, para todo α > 0). Probar que la convergencia es uniforme en todo intervalo de la forma [ω, ∞), con ω > 1. 4.21 Estudiar la convergencia puntual y uniforme en R de la serie de funciones ∞ X

1 . 2 + n)(x2 + n + 1) (x n=1 4.22 Probar que converge uniformemente en R la serie funcional ∞ X sen(n2 x) . n2 n=1

¿Qué puede decirse acerca de la convergencia de la serie derivada? LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

4.23 Sea

∞ P

65

fn (x) una serie de funciones tal que fn es positiva y continua en [a, b] para todo

n=1

n ∈ N. Si la serie converge en [a, b), diverge en x = b y f (x) designa la suma de la serie para cada x ∈ [a, b), probar que l´ım− f (x) = +∞. x→b

4.24 Dado α > 0, para cada n ∈ N se define un : [0, ∞) → R por un (x) = I)

∞ P

Probar que la serie

n=1

II )

xα . 1 + n2 x2

un (x) converge puntualmente en [0, ∞), cualquiera que sea α.

Demostrar que, para α > 1, la serie converge uniformemente en [0, 1]. Sugerencia: Analícense por separado los casos α ≥ 2 y 1 < α < 2.

III )

Probar que, para α ≤ 2, la serie converge uniformemente en [1, ∞).

4.25 Sea f una función de clase C ∞ en un entorno del punto x0 ∈ R. Se supone que existen constantes M, R > 0 y δ > 0 tales que para cada n ∈ N y cada x ∈ [x0 − δ, x0 + δ] se verifica que (n) f (x) ≤ M Rn . Probar que la serie de Taylor de f en x0 , f en [x0 − δ, x0 + δ].

∞ P f (n) (x0 ) (x − x0 )n , converge uniformemente hacia n! n=0

4.26 Probar las siguientes igualdades y que la suma es uniforme en los compactos ∞ X xn x , x ∈ R. I) e = n! n=0 II )

sen(x) =

∞ X

(−1)n

x2n+1 , x ∈ R. (2n + 1)!

(−1)n

x2n , x ∈ R. (2n)!

n=0

III )

cos(x) =

∞ X

n=0

4.27 Se considera la función f : [0, 1] → R dada por n f (x) = −x log(x) si x 6= 0; 0 si x = 0.

1 para todo x ∈ [0, 1]. Demostrar que f es continua en [0, 1] y que 0 ≤ f (x) ≤ e n ∞ X −x log(x) converge uniformemente en [0, 1]. II ) Probar que la serie funcional n! n=0 I)

(Para n = 0 se entiende que f (x)0 ≡ 1.) Z 1 (−1)n+m n! (−x)m log(x)n dx = III ) Demostrar que para todos m, n ∈ N. (m + 1)n+1 0 IV ) Hallar la suma de la serie dada en II ) y concluir que Z 1 ∞ X 1 . x−x dx = (n + 1)n+1 0 n=0

4.28 Mediante el estudio de las derivadas de las correspondientes funciones, deduzcánse las siguientes igualdades, probando asimismo que la suma es uniforme en los subconjuntos compactos del correspondiente abierto de definición. ∞ X xn , x ∈ (−1, 1). (−1)n+1 I ) log(1 + x) = n n=1 II )

arctg(x) =

∞ X

n=0

(−1)n

x2n+1 , x ∈ R. 2n + 1

U NIVERSIDAD DE VALLADOLID

66

Tema 4. Sucesiones y series funcionales

4.29 Se considera la función definida en R por n 0 si x ≤ 0, f (x) = −1 e /x si x > 0. I ) Demostrar, razonando por inducción sobre el natural n, que para x > 0 f (n) (x) = Pn (1/x) e

−1/x ,

donde Pn es un polinomio de grado 2 n. II )

n ∈ N,

Deducir que f es de clase C ∞ en R, pero la serie de Taylor de f en x0 = 0 no representa a f en ningún intervalo del tipo [−δ, δ].

4.30 Demostrar que si x 6= 2 kπ, k ∈ Z, (es decir, sen x/2 6= 0) se verifica que n n X X sen nx/2 cos (n + 1)x/2 sen nx/2 sen (n + 1)x/2 cos(k x) = , . sen(k x) = sen x/2 sen x/2 k=1 k=1 Deducir que, si 0 < δ < π, las series de funciones ∞ X sen(n x) n + x2 n=1

y

∞ X cos(n x) n + x2 n=1

son uniformemente convergentes en el intervalo [δ, 2 π − δ]. Introducción a las series de Fourier 4.31

∞ Sean a0 ∈ R y {an }∞ n=1 , {bn }n=1 sucesiones de números reales tales que las series ∞ ∞ P P numéricas an y bn son absolutamente convergentes. n=1

I)

n=1

Probar que la suma de la serie

∞

a0 X an cos(n x) + bn sen(n x) + 2 n=1

(4.1)

define una función continua f en R . II )

III)

Comprobar que se verifica que Z Z 1 π 1 π a0 = f (x) dx ; an = f (x) cos(n x) dx , π −π π −π Si, además, las series

∞ P

n an y

n=1

f es de clase C 1 en R .

∞ P

1 bn = π

Z

π

f (x) sen(n x) dx , −π

n ∈ N . (4.2)

n bn son absolutamente convergentes, demostrar que

n=1

Nota: Una serie del tipo (4.1) se denomina serie trigonométrica. Obviamente sus sumas parciales son polinomios trigonométricos. Dada una función f de periodo 2 π en R e integrable en los intervalos compactos (no necesariamente continua), se denomina serie de Fourier de f a la serie trigonométrica cuyos coeficientes están dados por las integrales (4.2). Uno de los problemas más interesantes del Análisis de Fourier es determinar condiciones suficientes para que la serie de Fourier de una función converja hacia dicha función. 4.32 Sea f una función continua en R y de periodo 2 π. Supongamos que {Pn }∞ n=1 es una sucesión de polinomios trigonométricos que converge hacia f uniformemente, y pongamos m

Pn (x) =

n an,0 X + an,k cos(k x) + bn,k sen(k x) . 2

k=1

Se conviene que an,k = bn,k = 0 si k > mn . Comprobar que para todo k se tiene que Z Z 1 π 1 π f (x) cos(k x) dx , l´ım bn,k = bk = f (x) sen(k x) dx . l´ım an,k = ak = n→∞ n→∞ π −π π −π LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

67

Ejercicios

4.33 Sean x0 ∈ (−π, π) y δ > 0 tales que [x0 − δ, x0 + δ] ⊂ (−π, π). Se define el polinomio trigonométrico Q(x) = 1 − cos(δ) + cos(x − x0 ) , n n y para cada n ∈ N el polinomio Pn (x) = Q(x) = 1 − cos(δ) + cos(x − x0 ) . I)

Comprobar que

∗ Q(x) ≥ 1 para todo x ∈ [x0 − δ, x0 + δ] ;

II )

∗ Q(x) ≥ Q(x0 + δ/2 ) > 1 si x ∈ [x0 − δ/2 , x0 + δ/2 ] ; ∗ Q(x) ≤ 1 para cada x ∈ [−π, x0 − δ] ∪ [x0 + δ, π] .

Supongamos que h: [−π, π] → R es acotada, integrable en el sentido de Riemann, continua en el punto x0 ∈ (−π, π) y con h(x0 ) > 0. Elíjase además δ > 0 suficientemente pequeño de manera que h(x) > 0 siempre que |x − x0 | < δ . Demostrar que si Q y Pn se defienen como antes, en términos de estos valores de x0 y δ, entonces Z π h(x) Pn (x) dx = ∞ . l´ım n→∞

−π

4.34 (Teorema de unicidad) Sea f una función real, definida y continua en R, de periodo 2 π, y tal que son nulos todos sus coeficientes de Fourier. Probar que entonces debe ser f = 0. Dicho de otra forma, dos funciones continuas y 2 π-periódicas en R con la misma serie de Fourier han de ser iguales. 4.35 Sea f una función continua en R y de periodo 2 π. Demostrar que si la serie de Fourier de f converge uniformemente en R, entonces su suma coincide con f . 4.36 Sea f : R → R periódica de periodo 2 π, dos veces derivable en todo R y tal que su derivada segunda es integrable en [−π, π]. I)

II )

Integrando por partes probar que existe M > 0 tal que los coeficientes de Fourier de f se acotan como sigue: M M |an | ≤ 2 y |bn | ≤ 2 , n ∈ N . n n Deducir que la serie de Fourier de f converge uniformemente hacia f en R.

4.37 Sea f la función definida en [−π, π] por f (x) = | sen(x)|, y extendida a toda la recta por periodicidad. I)

Demostrar que la serie de Fourier de f es ∞ 4X 1 2 − cos(2 n x) . 2 π π n=1 4 n − 1

II ) III )

Probar que esta serie converge uniformemente. Calcular las sumas de las siguientes series numéricas ∞ X

1 , 2−1 4 n n=1

∞ X (−1)n . 4 n2 − 1 n=1

4.38 Sea f la función dada por f (x) = |x| para x ∈ [−π, π] , y extendida periódicamente a R. I)

II )

Demostrar que la serie de Fourier de f converge hacia f uniformemente en R.

A partir del valor de f (0) obtener la suma de la serie ∞ X

k=0

U NIVERSIDAD DE VALLADOLID

1 . (2 k + 1)2

68

Tema 4. Sucesiones y series funcionales

4.39 Se considera la función f que es impar y está definida en [0, π] por f (x) = x (π − x). I)

Demostrar que, para cada x ∈ [−π, π], se tiene que

∞ 8 X sen (2k + 1) x . f (x) = π (2 k + 1)3 k=0

II ) Deducir a partir de f π/2 la igualdad

∞ X

k=0

π3 (−1)k = . 3 (2 k + 1) 32

4.40 Mediante el estudio de la función f definida en [−π, π] por f (x) = (π 2 − x2 ), deducir que ∞ X 1 π2 = . n2 6 n=1

Tema 5

Fundamentos de la integral La materia que se presenta ahora es común a todo método de integración en los espacios euclídeos. El punto de partida es la noción familiar y cotidiana de longitud de un segmento y las que de ella derivan: área de un rectángulo, volumen de un paralelepípedo, etc., presentes en la historia de la humanidad, como tarde, en las culturas babilónica, egipcia..., de lo que tenemos constancia documental. También debe resultar familiar, y no sólo al científico, la necesidad de extender esos conceptos a objetos geométricos más complicados (a nadie le sorprende que se hable del área de un círculo), es decir, de tener un criterio para medir el tamaño de los conjuntos. Una vez que se tiene una medida se dispone de un mecanismo de integración de funciones, pero también recíprocamente, una integral (un operador lineal y monótono que actúe sobre funciones continuas) permite definir una medida sobre cierta clase de conjuntos. En cualquier caso, tanto si se pretende construir una medida como si se persigue definir la integral, es necesario el estudio de las nociones que se presentan en este tema. La consideración de espacios de dimensión arbitraria Rd no supone otra dificultad que la de la notación, pero si el lector lo prefiere, y sobre todo cuando se trate de interpretaciones geométricas, puede limitarse a pensar en los casos d = 2 y d = 3.

5.1. Intervalos en Rd De nuevo, al hablar de intervalos de la recta, nos referiremos a los conexos (I es un intervalo de R si las condiciones x, z ∈ I y x ≤ y ≤ z implican que y ∈ I). Para un intervalo no vacío y acotado de la recta, digamos que de extremos a y b con a ≤ b, su longitud coincide con su diámetro y a esta cantidad la denominaremos también medida (unidimensional) de I y la denotaremos por m1 (I); así, un conjunto unipuntual tiene medida 0 y si a, b ∈ R con a < b, entonces m1 [a, b] = m1 (a, b] = m1 [a, b) = m1 (a, b) = b − a .

Al conjunto vacío le asignamos, obviamente, también la medida 0. Aunque no habría grandes dificultades en asignar el valor ∞ como medida de un intervalo no acotado y de interior no vacío, en lo sucesivo, y aunque no se mencione explícitamente, todos los intervalos considerados serán acotados. Definición 5.1. Un intervalo (acotado) de Rd es un producto cartesiano I1 × I2 × · · · × Id de intervalos acotados I1 , I2 , . . . , Id de R. Si I = I1 × I2 × · · · × Id es un intervalo de Rd se define su medida (d-dimensional) como md (I) = md (I1 × I2 × · · · × Id ) = m1 (I1 ) m1 (I2 ) · · · m1 (Id ) .

También se usan los términos clásicos longitud, área y volumen en los casos d = 1, 2, 3 respectivamente. Observaciones 5.2. I)

Son también usuales los términos celda o multiintervalo para referirse a un intervalo en Rd . Puesto que el contexto establece la dimensión del espacio en que se trabaja, aquí utilizaremos la nomenclatura propia de la recta real (d = 1), a sabiendas de que esta licencia no se corresponde con la idea de conjunto ordenado de ese caso particular. 69

70

Tema 5. Fundamentos de la integral

II )

Del mismo modo, generalizando el concepto relativo al espacio tridimensional, llamaremos cubo en Rd a todo intervalo C = I1 × I2 × · · · × Id cuyos factores tengan igual longitud: md (C) = m1 (I1 )d .

m1 (I1 ) = m1 (I2 ) = . . . = m1 (Id ) , III)

Nótese que si I = I1 × I2 × · · · × Id es un intervalo de Rd , su medida es la misma que la de cualquier otro que se encuentre comprendido entre su interior ◦

◦

◦

◦

I= I 1 × I 2 × · · · × I d

y su adherencia

I = I 1 × I 2 × · · · × I d. IV )

Cuando no haya lugar a confusión, y con el ánimo de aliviar la notación, escribiremos simplemente m(I) en lugar de md (I), omitiendo la referencia a la dimensión.

V)

Es evidente que un intervalo de diámetro pequeño tiene medida pequeña pero, salvo en el caso d = 1, el recíproco es falso; nótese que el diámetro de un intervalo viene dado por p δ(I1 × I2 × · · · × Id ) = m1 (I1 )2 + m1 (I2 )2 + . . . + m1 (Id )2 .

VI )

De la definición anterior se sigue inmediatamente que si I es un intervalo de Rp y J es un intervalo de Rq , entonces I × J es un intervalo de Rp+q y mp+q (I × J) = mp (I) mq (J) .

VII)

Al tratar con intervalos y su medida, algunos prefieren considerar una clase más pequeña de conjuntos, los denominados semiintervalos que son productos cartesianos de intervalos semiabiertos (ai , bi ]. Esto no supone más ventajas que cierta elegancia estética.

Propiedades 5.3. Sean I, J e {Ik : k ∈ N} intervalos de Rd . I)

II ) III)

I ∩ J es otro intervalo.

Si I ⊆ J, entonces m(I) ≤ m(J).

Dado ε > 0, existen un intervalo abierto A y un intervalo cerrado C con C ⊂ I ⊂ A y m(A) − ε ≤ m(I) ≤ m(C) + ε . n

IV )

Si I = ∪ Ik , con Ik ∩ Il = Ø si k 6= l, entonces m(I) = k=1

n

V)

Si ∪ Ik ⊂ I, con Ik ∩ Il = Ø si k 6= l, entonces m(I) ≥ k=1

n

VI )

Si I ⊂ ∪ Ik entonces m(I) ≤ k=1 ∞

VII)

n P

m(Ik ).

n P

k=1 n P

m(Ik ). m(Ik ).

k=1

k=1

Si I = ∪ Ik , con Ik ∩ Il = Ø si k 6= l, entonces m(I) = k=1

∞ P

m(Ik ).

k=1

5.1.1. Conjuntos elementales Lo siguiente va dirigido a formalizar algo totalmente evidente desde la intuición de lo cotidiano: la aditividad de la medida para conjuntos sencillos. Definición 5.4. Se denomina conjunto elemental en Rd a toda unión finita de intervalos n

E = ∪ Ik , k=1

Ik intervalo de Rd , k = 1, 2, . . . , n .

Proposición 5.5. Sean E y F conjuntos elementales de Rd . I) II )

LATV

E ∪ F y E ∩ F son conjuntos elementales. En consecuencia, las uniones e intersecciones finitas de conjuntos elementales son conjuntos elementales. E \ F es un conjunto elemental. Departamento de Álgebra, Análisis Matemático, Geometría y Topología

5.2. Conjuntos de medida nula

71

n

Lema 5.6. Sea E = ∪ Ik un conjunto elemental. Existe una familia {Jl : l = 1, 2, . . . , q} de k=1

intervalos disjuntos dos a dos y tales que: I) II )

q

E = ∪ Jl ; esto es, {Jl : l = 1, 2, . . . , q} es una partición de E. l=1

Cada intervalo Ik es unión de una subfamilia finita de intervalos Jl : es decir, existe Λk ⊂ {1, 2, . . . , q} tal que Ik = ∪ Jl . l∈Λk

Lema 5.7. Supongamos que {Ik : k = 1, 2, . . . , n} y {Jl : l = 1, 2, . . . , q} son particiones de un mismo conjunto elemental E de Rd . Se tiene que n X

m(Ik ) =

k=1

q X

m(Jl ) .

l=1

El resultado anterior avala la coherencia de la siguiente definición. Definición 5.8. Si E es un conjunto elemental de Rd , que se escribe como unión disjunta de los intervalos I1 , I2 , . . . , In , se define la medida de E por m(E) =

n X

m(Ik ) .

k=1

Lema 5.9. Sean E y F conjuntos elementales de Rd . Existe una familia {Ik : k = 1, 2, . . . , n} de intervalos disjuntos dos a dos tal que: I)

{Ik : k = 1, 2, . . . , n} es partición de E ∪ F , en particular, n

E ∪ F = ∪ Ik . k=1

II )

E y F se escriben como uniones de intervalos Ik ; precisando más, existe KE y KF , subconjuntos de {1, 2, . . . , n} tales que E=

∪ Ik ,

k∈KE

F =

∪ Ik .

k∈KF

5.2. Conjuntos de medida nula Hemos asignado la misma medida a un intervalo compacto de Rd que a su interior, lo cual es natural si se observa que estos dos intervalos difieren en subconjuntos de espacios afines de dimensión menor estrictamente que d y se piensa que, en R2 un segmento debe tener área 0, un paralelogramo contenido en un plano de R3 tiene volumen 0 etc. Antes de poder hablar de la medida de conjuntos en general necesitamos describir aquellos que tienen “medida nula”, sean o no intervalos. Definición 5.10. Se dice que un conjunto E ⊂ Rd es de medida nula si para cada ε > 0 existe una familia numerable de intervalos {Ik : k ∈ N} tales que: ∞ ∞ P m(Ik ) < ε. i) E ⊂ ∪ Ik . ii) k=1

k=1

Observaciones 5.11. I)

Los conjuntos de medida nula, también denominados despreciables, juegan un papel clave en la integración, como iremos viendo en adelante.

II )

En la definición anterior, las sumas que aparecen en ii) se entienden como series convergentes de términos positivos, y pueden ser finitas si se admite la posibilidad de que exista k0 ∈ N tal que Ik = Ø para k ≥ k0 . Esto ocurre, por ejemplo, si el conjunto E es compacto. Explícitamente:

U NIVERSIDAD DE VALLADOLID

72

Tema 5. Fundamentos de la integral

Lema 5.12. Un subconjunto compacto C de Rd es de medida nula si, y sólo si, para cada ε > 0 existe una familia finita de intervalos {Ik : k = 1, 2, . . . , n} tales que: n n P m(Ik ) < ε. i) C ⊂ ∪ Ik . ii) k=1

k=1

En otras palabras, C es de medida nula si, y sólo si, para cada ε > 0 existe un conjunto elemental E con C ⊂ E y m(E) < ε . Observación 5.13. En la teoría de Riemann, mucho más restrictiva que la de Lebesgue en cuanto a los conjuntos y funciones a a tratar, el papel de los conjuntos de medida nula lo juegan los denominados conjuntos con contenido de Jordan nulo, que se caracterizan de forma similar a la descrita en la definición 5.10, exigiendo en este caso que puedan ser recubiertos por una cantidad finita de intervalos cuya suma de medidas sea arbitrariamente pequeña. Nótese que, para empezar, esta condición obliga a que el conjunto sea acotado. La figura 5.1 ilustra también, en el caso de variedades de dimensión 1 contenidas en R2 (i.e., curvas planas), la propiedad cuya demostración se propone en el ejercicio 5.23. Una curva regular y compacta tiene contenido de Jordan nulo. Aumentando el número de intervalos, siempre una cantidad finita, y ajustándolos a la curva, se puede hacer la suma de sus áreas tan pequeña como se quiera.

Figura 5.1: Contenido de Jordan nulo El lema anterior establece que los conjuntos de medida nula y compactos tienen contenido de Jordan nulo, pero existen conjuntos de medida nula que no tienen contenido de Jordan nulo, p.e., los conjuntos numerables y no acotados. Esta afirmación se sustenta en las propiedades que se enuncian a continuación. Propiedades 5.14. I) II ) III)

Si E ⊂ Rd es de medida nula y A ⊂ E, entonces A es de medida nula.

La unión numerable de conjuntos de medida nula es un conjunto de medida nula. ∞

Si E ⊂ ∪ Ak ⊂ Rd , entonces E es de medida nula si, y sólo si, E ∩ Ak es de medida nula k=1

para todo k ∈ N.

5.2.1. La locución “casi siempre” Supongamos que sobre los puntos de un subconjunto A de Rd se tiene enunciada una propiedad P, precisando más, una proposición lógica, que por tanto toma dos valores lógicos: “verdadero” o “falso”. Si el conjunto N de los puntos x ∈ A para los que P es falsa tiene medida nula, decimos que P se verifica casi siempre en A, o casi por doquier en A, o en casi todo punto de A, o mediante cualquier otra locución gramatical con el mismo significado (dependiendo del gusto de cada cual). Ejemplos 5.15. I)

Casi todo punto de R es irracional. 1 II ) La función f (x, y) = 2 está definida casi siempre en R2 (ver ejercicio 5.14). x + y2 − 1

III) IV )

LATV

La función parte entera ⌊x⌋ es continua en casi todo punto de R. l´ım xn = 0 en casi todo punto de [−1, 1].

n→∞

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

73

5.3. Funciones escalonadas y su integral

Al referirnos por escrito a propiedades que se verifican en casi todo punto abreviaremos con las siglas “c.s.”, como, por ejemplo, al decir “la función valor absoluto es derivable c.s. en cos(x) R” e incluso en expresiones como “ l´ım 1+n x2 = 0 ”. c.s.

n→∞

En los textos en inglés se encontrará habitualmente la abreviatura “a.e.” (por almost everywhere), y en la literatura francesa se suele escribir “p.p.” (de presque partout).

5.3. Funciones escalonadas y su integral Notación: Sean U un conjunto y A ⊂ U . La función real definida en U por χA (x) = 1 si x ∈ A, 0 si x ∈ / A,

se denomina función característica de A (referida al conjunto universal U ). Las siguientes propiedades son inmediatas: 1. χU = 1 , χØ = 0 , χU \A = 1 − χA .

2. χ(A1 ∩A2 ∩···∩An ) = χA1 χA2 · · · χAn 3. χ(A1 ∪A2 ∪···∪An ) = m´ax χA1 , χA2 , . . . , χAn ≤ χA1 + χA2 + . . . + χAn , y se da la igualdad si, y sólo si, los conjuntos son disjuntos dos a dos.

Definición 5.16. Se dice que una función α: Rd → R es escalonada si existen intervalos I1 , I2 , . . . , In de Rd y números reales a1 , a2 , . . . , an tales que α(x) =

n X

ak χIk (x) ,

x ∈ Rd .

k=1

En el lado izquierdo, los trozos de planos horizontales constituyen parte de la gráfica de una función escalonada en R2 . Al añadir los trozos de planos verticales obtenemos lo que asemejan ser peldaños de una escalinata.

Figura 5.2: Funciones escalonadas Nótese que una función escalonada se anula fuera de un conjunto elemental y toma un número finito de valores. A modo de recíproco: Proposición 5.17. Un subconjunto E ⊂ Rd es elemental si, y sólo si, su función característica es escalonada. Los lemas 5.6 y 5.9 nos permite dar representaciones más adecuadas para el tratamiento de estas funciones. Lema 5.18. Sea α una función escalonada en Rd . Existen intervalos J1 , J2 , . . . , Jq disjuntos dos a dos, y números reales c1 , c2 , . . . , cq tales que α(x) =

q X

cl χJl (x) ,

l=1

x ∈ Rd .

Lema 5.19. Sean α, β funciones escalonadas en Rd . Existen intervalos J1 , J2 , . . . , Jq disjuntos dos a dos, y números reales a1 , a2 , . . . , aq y b1 , b2 , . . . , bq , tales que α(x) =

q X l=1

U NIVERSIDAD DE VALLADOLID

al χJl (x)

y

β(x) =

q X l=1

bl χJl (x) ,

x ∈ Rd .

74

Tema 5. Fundamentos de la integral

Propiedades 5.20. Sean α, β funciones escalonadas en Rd . I) II ) III) IV )

Si a, b ∈ R, entonces a α + b β es escalonada. α β es escalonada.

|α| es escalonada.

m´ax{α, β} y m´ın{α, β} son escalonadas.

Definición 5.21. Sea α =

n P

ak χIk una función escalonada en Rd . El número

k=1 n X

ak m(Ik )

k=1

se denomina integral de α (en Rd ) y se denota por Z Z Z α(x) dm(x) , α(x) dx , Rd

Rd

α,

o simplemente

Rd

Z

α.

Observaciones 5.22. I)

La definición anterior se ha dado en términos de una representación de α. Pero, por supuesto, si q n X X ak χIk (x) = cl χJl (x) , x ∈ Rd , k=1

l=1

entonces se tiene que

n X

k=1

es decir, la definición es coherente. II )

ak m(Ik ) =

q X

cl m(Jl ),

l=1

Resulta evidente que para un conjunto elemental E se tiene que Z χE = m(E) .

Uno de los problemas que abordamos más adelante es generalizar la igualdad anterior a una clase de conjuntos más amplia.

III)

Al igual que en el caso de funciones de una variable cuando se habla de áreas, la integral de funciones escalonadas proporciona una primera aproximación a la idea de volumen, etc. Véase la ilustración 5.2: la integral de la función escalonada representada a la izquierda es la suma de los volúmenes de los paralelepípedos (intervalos de R3 ) de la derecha.

Propiedades 5.23. Sean α, β funciones escalonadas en Rd . R R R a α + b β = a α + b β (linealidad). I ) Si a, b ∈ R, entonces R II ) Si α(x) ≥ 0 para cada x ∈ Rd , entonces α ≥ 0. R R d III) Si α(x) ≤ β(x) para cada x ∈ R , entonces α ≤ β (monotonía). R R IV ) α ≤ |α|.

Nos interesa “medir” la diferencia entre dos funciones escalonadas α y β, no sólo en términos de los valores que toman, sino también respecto al tamaño de los intervalos dónde difieren. Esta diferencia o distancia vendrá dada por Z |α − β| .

En el lenguaje del Análisis Funcional, lo anterior define una seminorma. Nótese que funciones escalonadas e iguales casi siempre distan entre sí 0, de ahí el prefijo “semi”. Hablando de manera relajada, funciones escalonadas (luego será también con funciones cualesquiera) que coincidan salvo en conjuntos de medida nula son, a todos los efectos de integración, iguales.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

75

Ejercicios

d Definición 5.24. Se dice que la sucesión {αn }∞ n=1 de funciones escalonadas en R es fundamental si satisface la condición (de tipo Cauchy) siguiente: “Para cada ε > 0 existe n0 ∈ N tal R que si p, q ≥ n0 entonces |αp − αq | < ε”.

Podría parecer que la condición de Cauchy anterior implica la convergencia puntual de la sucesión de funciones escalonadas, pero no es así (ver ejercicio 5.27). No obstante, los siguientes teoremas contienen resultados de paso al límite esenciales para la construcción de la integral que presentaremos en el tema siguiente. d Teorema 5.25. Sea {αn }∞ n=1 una sucesión fundamental de funciones escalonadas en R . ∞ ∞ d Existe una subsucesión {αnk }k=1 y una sucesión {Uj }j=1 de subconjuntos de R tales que

I)

II )

Uj ⊃ Uj+1 para cada j ∈ N.

∞

Cada Uj es unión numerable de intervalos Uj = ∪ Ij,l cuya suma de medidas es finita y l=1

siendo además

∞ X

l´ım

j→∞

III ) IV )

m(Ij,l ) = 0 .

l=1

d Para cada j ∈ N la sucesión {αnk (x)}∞ k=1 converge uniformemente en R \ Uj . d {αnk }∞ k=1 converge casi siempre en R .

d Teorema 5.26. Sea {αn }∞ n=1 una sucesión fundamental de funciones escalonadas en R y tal d que l´ım αn (x) = 0 para casi todo x ∈ R . Entonces n→∞ Z αn = 0 . l´ım n→∞

Ejercicios 5.1 Sean I un intervalo de Rd y ε > 0. Probar que existe una colección finita de cubos {Ck : k = 1, 2, . . . , n} tal que: n n P m(Ck ) ≤ m(I) + ε. i) I ⊂ ∪ Ck , ii) m(I) ≤ k=1

k=1

Además, si los cubos se toman semiabiertos, se pueden elegir disjuntos dos a dos.

5.2 Probar que la caracterización de conjuntos de medida nula se puede establecer de forma equivalente exigiendo que los intervalos Ik que recubren E sean todos abiertos, o todos compactos, o todos cubos, etc. 5.3 Probar que un conjunto E es de medida nula si, y sólo si, puede ser recubierto por una familia numerable de conjuntos Ek tales que Ek ⊂ Ik , siendo los Ik intervalos cerrados cuya suma de medidas puede tomarse arbitrariamente pequeña. En particular, el subconjunto E de Rd es de medida nula si, y sólo si, para cada ε > 0 existe una familia numerable de bolas {B(ak , rk ) : k ∈ N} tales que ∞ X

(rk )d < ε .

k=1

5.4 Probar que un intervalo abierto no vacío de Rd no es de medida nula, y deducir que tampoco lo es Rd . 5.5 Si E ⊂ Rd es de medida nula, ¿qué se puede decir de su interior, de su adherencia y de su derivado? 5.6 Comprobar que un conjunto de interior vacío no tiene por qué ser necesariamente de medida nula. 5.7 Sea A un subconjunto de Rd tal que su derivado es finito. Demostrar que A es de medida nula. U NIVERSIDAD DE VALLADOLID

76

Tema 5. Fundamentos de la integral

5.8 Sea A = (0, 1) ∩ Q y sean I1 , I2 , . . . , In intervalos abiertos que recubren a A. Probar que n X

k=1

m(Ik ) ≥ 1 .

Analice lo anterior en relación con los conceptos de medida nula y contenido de Jordan nulo. 5.9 Probar que si A ⊂ R es de medida nula, existe x ∈ R tal que (x + A) ∩ Q = Ø . 5.10 Sean A y B subconjuntos de Rp y Rq , respectivamente, con A de medida nula en Rp . Probar que A × B es de medida nula en Rp+q . Como aplicación, demostrar que el conjunto {(x, y, z) ∈ R3 : x ∈ Q ó y ∈ Q ó z ∈ Q}

es de medida nula en R3 . Lo mismo sucede con los hiperplanos

Hi = { x = (x1 , x2 , . . . , xn ) ∈ Rn : xi = 0 } ,

n ≥ 2, 1 ≤ i ≤ n.

5.11 Sean G un abierto no vacío de Rd y A un subconjunto de G de medida nula. Probar que G \ A es denso en G. 5.12 (El conjunto ternario de Cantor) Se denota por Q0 al intervalo compacto [0, 1] ⊂ R. Se divide Q0 en tres segmentos de igual longitud y se consideran los 2 intervalos cerrados I1,j , j = 1, 2, de la partición generada en Q0 adyacentes a sus extremos. Cada uno de ellos tiene 2

longitud 1/3, por tanto el conjunto Q1 = ∪ I1,j tiene medida 2/3. A continuación se procede j=1

igual con cada uno de los intervalos I1,j , obteniéndose así 22 intervalos I2,j , j = 1, 2, 3, 4, de 22

2 longitud 1/32 cuya unión Q2 = ∪ I2,j tiene medida 2 /32 . j=1

Recurrentemente se construye una sucesión de compactos {Qn }∞ n=1 que verifica:

1. Qn+1 ⊂ Qn para cada n ≥ 1. 2n

2. Qn = ∪ In,j , siendo los In,j intervalos cerrados de longitud 1/3n , y disjuntos dos a dos. j=1 n Por tanto, m(Qn ) = 2 /3n . 3. Si m > n, en cada In,j hay exactamente 2m−n intervalos del tipo Im,l . Se define el conjunto ternario de Cantor C como ∞

C = ∩ Qn . n=1

I) II ) III)

Probar que C es de medida nula. Probar que C es no numerable. Además, se tiene que C es compacto y [0, 1] \ C es denso en [0, 1] (ver ejercicio 5.11).

5.13 Probar que todos los puntos del intervalo [0, 1] cuya expresión decimal no contiene más que ceros o nueves forman un conjunto de medida nula y no numerable. 5.14 Demostrar que el grafo de una función continua f : R → R es un conjunto de medida nula en R2 . Generalizar el resultado para f : Rn → R. 5.15 Sea A un abierto acotado y convexo de Rd . Probar que Fr(A), la frontera de A, es de medida nula. Dedúzcase lo mismo en el caso de que A sea cerrado y convexo. Nota: Este ejercicio está propuesto, junto con un esbozo de su resolución, en el volumen 2 de la obra de Garnir [24]. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

77

5.16 Sea E un subconjunto acotado de Rd tal que su frontera tiene medida nula. Probar que, dado ε > 0, existen conjuntos elementales C y A tales que 1. C es cerrado y C ⊂ E.

2. A es abierto y E ⊂ A.

3. m(A \ C) < ε.

5.17 Dada una función f : E ⊂ Rd → R se dice que c ∈ R es una cota superior casi siempre de f en E si el conjunto {x ∈ E : f (x) > c} tiene medida nula. Si f tiene una cota superior c.s. diremos que f está acotada superiormente c.s., y en este caso se define el supremo esencial de f como el inferior de sus cotas superiores c.s. De forma análoga se definen las cotas inferiores c.s. y el ínfimo esencial. Demostrar que el supremo esencial de una función es una cota superior casi siempre de la función. 5.18 Sean f y g funciones definidas y continuas en un abierto A de Rd e iguales casi siempre. Probar que f = g en todo punto de A. 5.19 Construir: I)

Una función casi siempre continua en R que no sea igual casi siempre a una función continua.

II )

Una función casi siempre igual en R a una función continua y que no sea casi siempre continua.

5.20 Probar que si f : R → R verifica que f (x) = f (x + 1) para casi todo x ∈ R, entonces existe g: R → R tal que f (x) = g(x) casi siempre y g(x) = g(x + 1) para cada x ∈ R. 5.21 Se dice que A ⊂ Rd es casi abierto si casi todos sus puntos son interiores. Sea V abierto de Rd y f : V → R. Probar que son equivalentes: a) f es continua en casi todo punto de V .

b) Para todo t ∈ R los conjuntos {x ∈ V : f (x) > t} y {x ∈ V : f (x) < t} son casi abiertos. 5.22 (Invarianza de la medida nula por transformaciones C 1 ) Sean V un abierto de Rd y f : V → Rd una función de clase C 1 . I)

II )

Demostrar que para cada subconjunto compacto K ⊂ V existe una constante C (que depende sólo de K y f ) tal que si I es un cubo contenido en K, entonces f (I) está contenido en un cubo J con m(J) ≤ C m(I). Si E ⊂ V es de medida nula, entonces f (E) es de medida nula.

Sugerencia: Recuérdese que todo abierto de Rn es unión numerable de compactos (ver ejercicio 1.32).

5.23 (Primer teorema de Sard) Sean U un abierto de Rd y f : U → Rn de clase C 1 . Si d < n entonces f (U ) es de medida nula en Rn . Nota: En las condiciones anteriores, si además U es conexo, f es inyectiva y la aplicación lineal f ′ tiene rango máximo (es decir, d ) en todo punto, se dice que f (V ) es una variedad diferenciable (elemental) de dimensión d en Rn . En particular, una curva diferenciable (variedad de dimensión 1) en R2 tiene área 0, una superficie diferenciable (variedad de dimensión 2) en R3 tiene volumen 0, etc. (véase también el teorema 3.24). La hipótesis de diferenciabilidad de f es esencial. Esto es, si sólo se exige que f sea continua puede suceder que f (V ) tenga medida mayor que 0. Un ejemplo clásico es la denominada curva de Peano, una aplicación continua del intervalo [0, 1] ⊂ R con valores en R2 , cuya imagen es el cuadrado [0, 1] × [0, 1]. En el libro de Bentabol et al. [4] se encuentran detallados los denominados teoremas de Sard. Asimismo, [4] presenta un estudio pormenorizado de la curva de Peano, que puede ser consultado también en [23]. U NIVERSIDAD DE VALLADOLID

78

Tema 5. Fundamentos de la integral

5.24 Sea f una función Riemann-integrable en el intervalo compacto [a, b] de R. Probar que f es límite c.s. en [a, b] de una sucesión fundamental de funciones escalonadas. Más aún, la sucesión se puede tomar monótona creciente. d 5.25 Sea {αn }∞ n=1 una sucesión de funciones escalonadas en R , que es monótona creciente en casi todo punto. Probar que la sucesión es fundamental si, y sólo si, existe C > 0 tal que Z αn ≤ C para cada n ∈ N . Rd

5.26 Sea f una función real definida y continua en un intervalo compacto I de Rd . Probar que f es límite uniforme en I de una sucesión fundamental de funciones escalonadas. 5.27 Dividamos el intervalo [0, 1) en los 10 subintervalos hk − 1 k Ik = , k = 1, 2, . . . , 10, , 10 10 luego en los 100 subintervalos h k − 11 k − 10 Ik = , k = 11, 12, . . . , 110, , 100 100 y así, sucesivamente, numeramos todos los intervalos de extremos decimales y semiabiertos por la derecha contenidos en [0, 1). Pongamos αn = χIn . I) II ) III)

Demostrar que la sucesión {αn }∞ n=1 es fundamental.

Probar que {αn (x)}∞ n=1 no converge para ningún punto x ∈ [0, 1).

Encontrar una subsucesión de {αn }∞ n=1 que converja c.s.

5.28 En las condiciones y con la notación del teorema 5.25. Comprobar con un ejemplo que el hecho de que la sucesión {αnk }∞ k=1 converja uniformemente en el complementario de cada conjunto Uj , j ∈ N, no implica que esta sucesión converja uniformemente en la unión de ∞ todos ellos, es decir, en Rd \ ∩ Uj . j=1

Tema 6

Integral de Lebesgue Hoy en día se pueden encontrar en la literatura diversas presentaciones de la construcción de la integral de Lebesgue, pero salvo ligeras variaciones podemos agruparlas en dos grandes lineas o métodos: por un parte, una vez que se tiene una medida se dispone de un mecanismo de integración de funciones, pero también recíprocamente, una integral (un operador lineal y monótono que actúe sobre funciones continuas) permite definir una medida sobre cierta clase de conjuntos. En otras palabras, los conceptos de medida e integral van parejos. La idea original de Lebesgue, presentada en su tesis doctoral de 1902, y que se recoge en el artículo [63], consiste en extender la medida a conjuntos más generales que los elementales (los medibles o pertenecientes a la σ-álgebra de Lebesgue) y definir P luego la integral por aproximación de la de funciones simples, esto es, de la forma s = ci χAi , como las escalonadas, pero donde los Ai son conjuntos medibles. La mayor dificultad de este procedimiento consiste en determinar qué conjuntos se pueden medir, lo que habitualmente se hace mediante el método de la medida exterior o de Carathéodory. Los trabajos de diversos autores probaron luego que es posible realizar una construcción equivalente sin recurrir a la Teoría de la Medida. En particular, el que se conoce hoy en día como esquema de Daniell o de las funciones superiores (ver [2]), define la integral mediante sucesiones crecientes de funciones escalonadas. Posteriormente, además de la aportación de Riesz1 o de Young, las variaciones introducidas por Stone, sustituyendo las sucesiones monótonas de funciones escalonadas por sucesiones fundamentales, conducen al que podríamos denominar método de Daniell-Stone, y que es extensible a funciones a valores complejos o vectoriales, al requerir de la norma y no de la relación de orden. Este último será el método que seguiremos (ver [16], [27] y [48]). El motivo principal es que esto nos permite proporcionar cuanto antes ejemplos prácticos y recursos de cálculo, sin necesidad de pasar por los detalles abstractos de la Teoría de la Medida; además, el marco general de las medidas (σ-álgebras, clases monótonas, etc.) es estudiado en el Cálculo de Probabilidades (una probabilidad es una medida positiva de variación total 1) y también en una parte del Análisis Funcional, lo que se viene denominando últimamente Análisis Real.

6.1. Definiciones y primeras propiedades En lo que sigue nos referiremos, vagamente, a funciones definidas en Rd . En mente tendremos que se trata de funciones reales, pero tal como apuntamos más arriba, nada impide generalizarlo todo, salvo lo que se enuncie en términos de la relación de orden, al caso de funciones complejas. La consistencia de la siguiente definición viene garantizada por el teorema 5.26. Definición 6.1. Sea f una función definida c.s. en Rd . Se dice que f es integrable (en el sentido de Lebesgue ) si es límite en casi todo punto de una sucesión fundamental de funciones escalonadas {αn }∞ n=1 . En este caso, existe el límite Z l´ım αn (x) dx n→∞

Rd

y es el mismo para todas las sucesiones fundamentales que convergen c.s. hacia f .

1 La particularización a espacios euclídeos de la integración abstracta propuesta por Daniell alrededor de 1919, se suele denominar también método de Riesz, pues ya en 1912 éste había abogado por el uso de funciones escalonadas.

79

80

Tema 6. Integral de Lebesgue

La integral (de Lebesgue ) de f es el límite anterior y se denota por Z Z Z Z f (x) dm(x) , f (x) dx , f, o simplemente f. Rd

Rd

Rd

Definición 6.2. Se dice que un subconjunto E de Rd es integrable si lo es su función característica. En este caso, la medida (de Lebesgue ) de E es el número real no negativo Z χE (x) dx . m(E) = Rd

Observaciones 6.3. I)

Nótese que la notación usada para la integral de una función es la misma que en el caso de funciones escalonadas. Por supuesto, una función escalonada es integrable en el sentido de Lebesgue y su integral coincide con la dada en la definición 5.21.

II )

También, para hacer énfasis en la dimensión del espacio en que se integra son habituales las notaciones Z Z f (x1 , x2 , . . . , xp ) dx1 . . . dxp , f (x1 , x2 , . . . , xp ) dx1 . . . dxp , etc. Rp

y en los casos habituales de dimensión 2 o 3, repitiendo el símbolo de la integral ZZ ZZZ f (x, y) dx dy , f (x, y, z) dx dy dz , etc.

III)

Por definición, funciones que sean iguales casi siempre son simultáneamente integrables o no, y si lo son tienen la misma integral. De forma más coloquial: al integrar, es irrelevante lo que ocurra en conjuntos de medida nula, en este sentido son “despreciables”.

IV )

Como cabe esperar, los conjuntos integrables con medida 0, en los términos de la definición anterior, son los conjuntos de medida nula según la acepción introducida en el tema anterior. Esta afirmación será probada un poco más tarde, cuando hayamos desarrollado toda la maquinaria de la integral. De momento, lo que es evidente es que los conjuntos despreciables son integrables y tienen medida 0.

V)

La clase de los conjuntos integrables, contiene, obviamente a los conjuntos elementales y la medida ahora definida coincide con la que se introdujo en el tema anterior. Esta clase está contenida a su vez en una más amplia, la de los conjuntos medibles. De momento nos conformamos con señalar que los conjuntos integrables son los conjuntos medibles que tienen medida finita.

VI )

El conjunto de funciones integrables en Rd se denota por L 1 (Rd ), o simplemente por L (Rd ). La L en honor a Lebesgue, claro está. En cuanto al exponente 1, adquiere más relevancia en otro contexto más general, cuando se consideran los espacios L p funciones tales que |f |p es integrable (|f |1 = |f | es integrable si lo es f , ver 6.4.II).

Propiedades 6.4. Sean f, g ∈ L 1 (Rd ). Se verifica que: I)

Linealidad: Si a, b ∈ R entonces a f + b g ∈ L 1 (Rd ) y Z Z Z af + bg = a f+ b Rd

Rd

g. Rd

Es decir L 1 (Rd ) es un espacio vectorial y la aplicación f ∈ L 1 (Rd ) 7−→ particular, cualquier función igual c.s. a 0 tiene integral nula.

II )

III) IV )

|f | ∈ L 1 (Rd ) y además

Z

Rd

Rd

Rd

f es lineal; en

|f | .

m´ax{f, g} ∈ L 1 (Rd ) y m´ın{f, g} ∈ L 1 (Rd ).

R Monotonía: Si f (x) ≥ 0 c.s. en Rd entonces Rd f ≥ 0. Equivalentemente, si f (x) ≥ g(x) c.s., entonces Z Z f≥ g. Rd

LATV

Z f ≤

R

Rd

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

6.2. Sucesiones de funciones integrables

81

Observación 6.5. Dada una función real f : X → R se definen su parte positiva y su parte negativa por f + (x) = m´ax{f (x), 0}

f − (x) = m´ax{−f (x), 0} ,

y

respectivamente. Es obvio que f + ≥ 0, f − ≥ 0 y que f = f + − f −,

|f | = f + + f − .

Tanto en la teoría de la Medida e Integración Abstracta como en el esquema de Daniell, o de las funciones superiores, la integrabilidad se define primero para funciones positivas y luego para funciones reales: f será integrable si, y sólo si, lo son f + y f − , en cuyo caso Z Z Z Z Z Z f = f+ − f− y |f | = f + + f − . Nótese que en nuestra exposición la integrabilidad de f + y f − , así como las igualdades anteriores, son consecuencia directa de las propiedades anteriores.

Cuando las propiedades 6.4, concretamente la de monotonía, se particularizan a las funciones características de conjuntos se deduce lo siguiente: Propiedades 6.6. Sean E, E1 , E2 , . . . , Ep subconjuntos integrables de Rd . I) II ) III )

m(E) ≥ 0.

Si E ⊂ E1 entonces m(E) ≤ m(E1 ). p

∪ Ek es integrable y

k=1

m

p X p m(Ek ) , ∪ Ek ≤

k=1

k=1

y se da la igualdad si Ej ∩ Ek es despreciable para j 6= k.

6.2. Sucesiones de funciones integrables Antes que nada, y aunque no es necesario para el desarrollo de la materia, señalemos que los primeros resultados en lo que exponemos a continuación se pueden presentar en un contexto más general de espacios métricos. Concretamente si la “distancia” entre funciones integrables f y g la cuantificamos por Z |f − g|

nos encontramos que funciones distintas, pero iguales c.s., distan 0 entre si. La respuesta a este contratiempo es identificar funciones iguales c.s., esto es, considerar la relación 1 d de equivalencia dada por “f Rg si f = g” y el espacio cociente L (R )/R, que se denota por c.s. R L1 (Rd ). Resulta que L1 (Rd ) es un espacio normado cuando se considera kCf k = |f |, siendo f cualquier representante de la clase Cf . Como en todo espacio normado, las nociones topológicas se pueden dar en términos secuenciales, de ahí el nombre que reciben los primeros resultados. No volveremos a mencionar este asunto. Teorema 6.7 (Densidad de las funciones escalonadas en L1 ). Sea f una función integrable en Rd y sea {αn }∞ n=1 una sucesión fundamental de funciones escalonadas que converge c.s. hacia f . Entonces Z f (x) − αn (x) dx = 0 . l´ım n→∞

Rd

Teorema 6.8 (Completitud de L1 ). Sea {fn }∞ de L 1 (Rd ) que n=1 una sucesión de elementos R verifica la condición (de Cauchy): “para cada ε > 0 existe n0 ∈ N con |fp − fq | < ε si p, q ≥ n0 ”. Existe entonces f ∈ L 1 (Rd ) tal que Z f (x) − fn (x) dx = 0 . l´ım n→∞

Rd

Además, f es límite c.s. de una subsucesión {fnk }∞ k=1 . U NIVERSIDAD DE VALLADOLID

82

Tema 6. Integral de Lebesgue

Observación 6.9. La mera convergencia puntual de una sucesión de funciones integrables no supone nada, en cuanto a la integrabilidad del límite puntual, en ausencia de otras condiciones adicionales, como la de “de Cauchy” citada en el teorema 6.8. De hecho, podemos encontrar: 1. Una función límite c.s. de funciones integrables, pero no integrable. 2. Más aún, una función f límite uniforme de funciones integrables, pero no integrable. 3. Una función f integrable y límite c.s. de funciones integrables {fn }∞ n=1 pero tal que su integral no es el límite de las integrales de las fn . Estas cuestiones se proponen como ejercicio (ver ejercicio 6.5). Teorema 6.10 (de la convergencia monótona, de Levi). Sea {fn }∞ n=1 una sucesión de funciones integrables en Rd tal que para cada n ∈ N se verifica fn (x) ≤ fn+1 (x)

para casi todo x ∈ Rd .

Se supone además que existe una constante C con Z fn ≤ C para todo n ∈ N . Rd

Entonces, existe una función f integrable en Rd tal que: {fn }∞ n=1 Z II ) l´ım I)

n→∞

Rd

converge hacia f c.s. Z fn − f = 0 ; en particular, l´ım n→∞

fn = Rd

Z

f. Rd

Teorema 6.11 (de la convergencia dominada, de Lebesgue). Sea {fn }∞ n=1 una sucesión de funciones integrables en Rd que converge en casi todo punto hacia una función f . Supongamos que además existe una función g integrable en Rd tal que fn (x) ≤ g(x) para todo n ∈ N . c.s.

Entonces: I)

f es integrable. Z Z fn − f = 0 ; en particular, l´ım II ) l´ım n→∞

Rd

n→∞

fn = Rd

Z

f. Rd

Corolario 6.12 (Teoremas de anulación). R I ) Sea f ∈ L 1 (Rd ) tal que Rd |f | = 0. Entonces f = 0 c.s. II )

Un conjunto E ⊂ Rd es de medida nula si, y sólo si, es integrable y md (E) =

R

Rd

χE = 0.

6.2.1. Comentarios sobre la generalización del teorema de Levi En la teoría abstracta de la Medida, si f es límite c.s. de una sucesión creciente {sn }∞ n=1 de funciones simples (dígase escalonadas en Rd ) y no negativas (por tanto f ≥ 0 c.s.) se asigna Z Z sn , f = l´ım n→∞

límite que puede ser finito o infinito. Obviamente, la función f será integrable si el límite es finito. También se admite que una función pueda tomar el valor ∞, de manera que toda sucesión creciente de números no negativos tiene límite en la semirrecta ampliada [0, ∞]. En este contexto, el teorema de la convergencia monótona adquiere un aspecto más sencillo: Teorema 6.13 (de la convergencia monótona, de Lebesgue). Sea {fn }∞ n=1 una sucesión de funciones “medibles” y no negativas en Rd tal que para cada n ∈ N se verifica fn (x) ≤ fn+1 (x)

para casi todo x ∈ Rd .

Entonces la función definida c.s. por f = l´ım fn es “medible” y l´ım n→∞

LATV

R

d n→∞ R

fn =

R

Rd

f.

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

83

6.3. Integración en intervalos de la recta

Más adelante daremos sentido al término medible, de momento baste indicar que hay funciones que podemos medir, pero que no son integrables. En la misma línea citamos otro afamado resultado (ver también el ejercicio 6.10): Teorema 6.14 (Lema de Fatou). Sea {fn }∞ n=1 una sucesión de funciones “medibles” y no negativas. Entonces Z Z l´ım inf fn ≤ l´ım inf fn . n→∞

n→∞

Notación: Para una sucesión de números reales {an }∞ n=1 se definen l´ım inf an := l´ım ´ınf{ak : k ≥ n} = sup ´ınf{ak : k ≥ n} : n ∈ N , n→∞ n→∞ l´ım sup an := l´ım sup{ak : k ≥ n} = ´ınf sup{ak : k ≥ n} : n ∈ N , n→∞

n→∞

límites que existen siempre en la recta ampliada [−∞, ∞]. Resulta que l´ım inf an ≤ l´ım sup an , n→∞

y si coinciden la sucesión tiene límite, que es ese valor común.

n→∞

6.3. Integración en intervalos de la recta La materia que exponemos ahora, además de mostrar que la teoría de Lebesgue contiene y generaliza a la de Riemann, nos proporciona los primeros recursos de cálculo en lo relativo al problema de estudiar la integrabilidad de una función y determinar su integral, si es procedente, en el caso de funciones de una variable real. Para funciones de varias variables sucede exactamente lo mismo, aunque no se expone aquí pues el lector probablemente desconozca la teoría de Riemann en dimensión mayor que 1. No obstante, es fácil entender que una vez definidos los intervalos y su medida, el procedimiento es el mismo (particiones de diámetro pequeño, sumas de Darboux, etc.). Hasta ahora estamos considerando las funciones definidas en el espacio Rd . Con el objetivo de establecer una formulación uniforme que nos permita la comparación entre las dos teorías citadas entenderemos todas las funciones así, definidas en Rd . Eso es posible extendiendo por el valor 0 las funciones fuera de su dominio de definición original; lo que no alterará, ni el carácter integrable ni los valores de las integrales. Definición 6.15. Sean I un intervalo de la recta (de cualquier naturaleza, acotado o no) y f : I → R una función. I)

II )

La extensión de f a R es la función f ∗ definida por: n f ∗ (x) = f (x) si x ∈ I, 0 si x ∈ / I.

Diremos que f es integrable (en el sentido de Lebesgue) en I, y escribiremos f ∈ L 1 (I), si f ∗ es integrable en el sentido de Lebesgue en R, y en este caso la integral de f en I es Z Z f (x) dm(x) = f ∗ (x) dm(x) . I

R

Notación: En general, cuando una función no esté definida en todo Rd , sino en un subconjunto suyo E, a la extensión f ∗ , construida como en la definición precedente, la denotaremos por f χE . Por ejemplo, ln χ(0,∞) o ln(x) χ(0,∞) (x) representa la función que toma los mismos valores que el logaritmo natural en (0, ∞) y se anula en el resto de los puntos de R. Teorema 6.16. Sea [a, b] un intervalo compacto de R y f : [a, b] → R una función acotada. Si f es integrable en [a, b] en el sentido de Riemann también lo es en el de Lebesgue, además se tiene que Z Z b f (x) dx = f (x) dm(x) . a

[a,b]

Teorema 6.17 (Criterio de Riemann-integrabilidad, de Lebesgue). Sea [a, b] un intervalo compacto de R y f : [a, b] → R una función acotada. f es integrable en el sentido de Riemann en [a, b] si, y sólo si, f es continua en casi todo punto de [a, b]. U NIVERSIDAD DE VALLADOLID

84

Tema 6. Integral de Lebesgue

Observación 6.18. Los dos teoremas anteriores muestran que la teoría de Lebesgue generaliza a la de Riemann y nos dan la pista para comprobar que esta generalización es estricta, es decir, que existen funciones integrables en el sentido de Lebesgue que no lo son en el de Riemann: basta considerar el ejemplo propuesto por Dirichlet, la función característica de los racionales de [0, 1]: f (x) = χQ (x)χ[0,1] (x) . Esta función no es continua en ningún punto de [0, 1], luego no puede ser Riemann-integrable en este intervalo. Por otra parte, dado que Q ∩ [0, 1] es de medida nula, f = 0, por lo que f es c.s. Lebesgue-integrable, y con integral 0. Por supuesto, en los modelos habituales de la Ciencia y la Técnica las funciones son más “dóciles” que la del ejemplo anterior, y los problemas de integrabilidad suelen venir dados por el carácter no acotado del integrando o del dominio de integración. En este sentido, lo que veremos a continuación se puede resumir en el siguiente aserto: Para funciones localmente acotadas y continuas c.s., la integrabilidad en el sentido de Lebesgue equivale a la convergencia absoluta de la integral en el sentido impropio de Riemann. Teorema 6.19. Sean (a, b) un intervalo de R (acotado o no) y f : (a, b) → R continua. I)

Criterio de comparación: Si existe g integrable en R tal que |f (x)| ≤ g(x) c.s. en (a, b) , entonces f es integrable en (a, b).

II )

Regla de Barrow: Si f es integrable en (a, b) y F es una primitiva de f (que existe en virtud del teorema Fundamental del Cálculo), entonces existen y son finitos los límites F (a+ ) = l´ım+ F (x) Además,

Z

f (x) dm(x) = (a,b)

F (b− ) = l´ım− F (x) .

y

x→a

Z

x→b

→b →a

f (x) dx = F (b− ) − F (a+ ) .

Teorema 6.20. Sean (a, b) un intervalo de R (acotado o no) y f : (a, b) → R integrable en el sentido de Riemann en cada subintervalo compacto de (a, b). Si la integral en el sentido impropio de Riemann de f en (a, b) es absolutamente convergente, entonces f es integrable en el sentido de Lebesgue en (a, b) y Z Z →b f (x) dx . f (x) dm(x) = →a

(a,b)

Observaciones 6.21. I)

En el teorema precedente, la condición de convergencia absoluta de la integral no se puede sustituir por la mera convergencia. El clásico contraejemplo de la función sen(x) χ (0,∞) (x) x nos sirve para mostrar que una función puede tener integral impropia convergente y no ser integrable en el sentido de Lebesgue. f (x) =

II )

A tenor de lo expuesto anteriormente, en el estudio de integrales de Lebesgue son aplicables las mismas técnicas usadas en la integral de Riemann que emanan del criterio de comparación. Por citar algún ejemplo: 1. Si f es continua en el intervalo (0, b] y existe l´ım xα f (x) = ℓ ∈ (0, ∞)

x→0+

entonces f es integrable en (0, b] si, y sólo si, lo es la función 1/xα , es decir, si y sólo si, α < 1. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

85

Ejercicios

2. Sea f una función definida en el intervalo [a, b), acotado o no, y tal que existe una sucesión {cn }∞ ım cn = b de n=1 de puntos de (a, b) y estrictamente creciente, con l´ n→∞

manera que f es Lebesgue-integrable en [a, c1 ) y en cada intervalo [cn , cn+1 ), n ∈ N. Entonces f es integrable en [a, b) si, y sólo si, la serie de términos positivos ∞ Z X f (x) dm(x) n=1

es convergente. En este caso, Z Z f (x) dm(x) = [a,b)

[cn ,cn+1 )

f (x) dm(x) + [a,c1 )

∞ Z X

n=1

f (x) dm(x) . [cn ,cn+1 )

El lector sabrá realizar el conveniente ejercicio de traducción para reinterpretar los criterios de convergencia absoluta restantes en el contexto de la integral de Lebesgue. III )

Podría parecer, a la vista de situaciones como la del segundo ejemplo del punto anterior, que conviene hablar de una integral “flechada” o “impropia” de Lebesgue, pero notemos que en la construcción de la integral no se ha impuesto ninguna restricción en cuanto a la acotación de las funciones o de sus dominios de definición. Volviendo sobre ese ejemplo, la sucesión de intervalos In = [a, cn ) es creciente, por lo que la sucesión de funciones {gn }∞ n=1 definida por gn = |f | χIn = |f |

n X

χ[cn−1 ,cn )

(c0 = a),

k=1

es de funciones positivas, integrables, y monótona creciente hacia |f |. La conclusión anunciada antes se sigue del teorema de la convergencia monótona para gn ↑ |f |, y n→∞ luego del teorema de la convergencia dominada para hn = f χIn −→ f . n→∞

Más general: en virtud del criterio secuencial del límite se tiene que Z Z l´ım |f (x)| dm(x) = l´ım |f (x)| dm(x) β→b−

para cualquier sucesión IV )

[a,β)

{cn }∞ n=1

n→∞

[a,cn )

de puntos de (a, b) creciente hacia b.

En lo sucesivo, para designar la integral en el sentido de Lebesgue de una función f en un intervalo de la recta de extremos a < b, utilizaremos también la notación de Riemann: Z b Z b f. f (x) dx o simplemente a

a

Ante una expresión de ese tipo, el contexto particular nos indicará en cada caso si conviene abordarla como integral de Riemann, integral impropia de Riemann absolutamente convergente, o integral de Lebesgue.

Ejercicios 6.1 En los siguientes casos compruébese la veracidad de lo afirmado construyendo una sucesión fundamental de funciones escalonadas que converja hacia la correspondiente función. 1 I ) f (x) = √ χ(0,1] (x) es integrable en R. x 1 χ(0,1]×(0,1] (x, y) es integrable en R2 . II ) f (x, y) = p 2 x + y2 6.2 Se consideran los intervalos I = [−1, 1] × [−1, 1] y J = [0, 1] × [0, 1] de R2 . Utilizando convenientes sucesiones de funciones escalonadas demostrar que: Z I) (x + y) χI (x, y) dx dy = 0 . R2 Z Z 2 χ II ) x cos(y) I (x, y) dx dy = 4 x2 cos(y) χJ (x, y) dx dy . R2

U NIVERSIDAD DE VALLADOLID

R2

86

Tema 6. Integral de Lebesgue

6.3 Sean f : R → R y g: R → R funciones integrables. En R2 se define la función h por h(x, y) = f (x) g(y).

(h se denomina producto tensorial de f y g y se denota por h = f ⊗ g). I ) Probar que h es integrable en R2 y que ZZ Z Z h(x, y) dx dy = f (x) dx g(y) dy. R2

R

R

Sugerencia: Probarlo primero para el caso de que f y g sean escalonadas.

II )

Sean I = [0, 1] × [0, 1] y f la función definida en R2 por f (x, y) = x y χI (x, y) . Comprobar que f es integrable y calcular su integral.

6.4 Calcular, justificando su existencia, el valor de la integral Z e−|x| dx dy . 2 R2 1 + y 6.5 En las siguientes situaciones examínese la convergencia c.s. y la convergencia uniforme de la correspondiente sucesión de funciones {fn }∞ n=1 , así como la integrabilidad de las funciones y de su límite, y la relación entre la integral del límite y el límite de las integrales. I ) fn (x) = χ[−n,n] (x) , x ∈ R . fn (x) = χ[n,∞) (x) , x ∈ R . 1χ III) fn (x) = [−n,n] (x) , x ∈ R . n IV ) fn (x) = χ[n,n+1] (x) , x ∈ R . 1χ V ) fn (x) = [n,n+1) (x) , x ∈ R . n II )

d ∞ 6.6 Sean {In }∞ n=1 una sucesión de intervalos de R disjuntos dos a dos y {an }n=1 una sucesión de números reales (o complejos). I ) Comprobar que está bien definida en todo punto de Rd la función f dada por la expresión

f (x) =

∞ X

an χIn (x) .

n=1

Las funciones definidas de esta forma se denominan numerablemente escalonadas. II )

Probar que una función numerablemente escalonada f , escrita en la forma anterior, es integrable si, y sólo si, la serie numérica ∞ X

n=1

es convergente.

|an | m(In )

6.7 En los siguientes casos examinar la integrabilidad de la correspondiente función y sus propiedades de acotación, anulación en el infinito (i.e., l´ım f (x) = 0 ), etc. kxk→∞

I)

II )

f (x, y) =

∞ X

1χ 2 In (x, y) , siendo In = [n, n + 1) × [n, n + 1) ⊂ R . n n=1

f (x, y, z) =

∞ X

n=1

III)

n χIn (x, y, z) , siendo In = n, n + 1/n) × n, n + 1/n) × n, n + 1/n) ⊂ R3 .

f (x1 , x2 , . . . , xd ) =

∞ X

n χIn (x1 , x2 , . . . , xd ) , siendo

n=1

In = LATV

1 1i 1 1 i d veces 1 1i , , , × × ··· × ⊂ Rd . n+1 n n+1 n n+1 n Departamento de Álgebra, Análisis Matemático, Geometría y Topología

87

Ejercicios

6.8 (Teorema de la convergencia monótona, 2a. versión) Sea {fn }∞ n=1 una sucesión de funciones integrables en Rd tales que 1. Para cada n ∈ N se tiene que fn ≥ fn+1 c.s. R 2. Existe una constante C con C ≤ Rd fn para todo n ∈ N .

Probar que la sucesión {fn }∞ n=1 converge c.s. hacia una función integrable f y que Z f n − f = 0 . l´ım n→∞

En consecuencia,

R

f = l´ım

n→∞

R

Rd

fn .

6.9 Considérese la sucesión de funciones definida en el ejercicio 6.5.V. Demostrar que dicha sucesión converge en casi todo punto y satisface la condición de tipo Cauchy del teorema 6.8. Sin embargo, no puede existir ninguna función g ∈ L 1 (R) tal que fn (x) ≤ g(x) para cada n ∈ N . c.s.

Nota: La prueba del teorema de la convergencia dominada 6.11 consiste, grosso modo, en probar que la condición de acotación de las fn implica el carácter “de Cauchy” de la sucesión. Lo que muestra este ejemplo es que el recíproco no es cierto, esto es, la condición de tipo Cauchy para una sucesión {fn }∞ n=1 de funciones integrables no implica una acotación uniforme de todos los términos fn por una misma función integrable g. d 6.10 (Lema de Fatou) Sea {fn }∞ n=1 una sucesión de funciones integrables en R que converge c.s. hacia una función f . Se supone además que existen una función g ∈ L 1 (Rd ) y una constante C tales que para todo n ∈ N se verifica: Z g(x) ≤ fn (x) y fn ≤ C . c.s.

Demostrar que f es integrable y que Z Z f = l´ım n→∞

Rd

Rd

Rd

´ınf{fk : k ≥ n} ≤ l´ım inf n→∞

Z

fn . Rd

6.11 Para cada n ∈ N sea fn una función integrable en Rd . Se supone que ∞ Z X |fn | < ∞. n=1

Rd

Probar que: ∞ P fn converge absolutamente c.s. hacia una función integrable. I) n=1 Z ∞ Z ∞ P P II ) Se tiene que fn = fn . Rd n=1

n=1

Rd

6.12 Vuelva a examinar el ejercicio 4.27, abordando ahora la igualdad Z 1 ∞ X 1 , x−x dx = (n + 1)n+1 0 n=0

en el contexto de la integral de Lebesgue.

¿Supone alguna ventaja? ¿Se simplifican los cálculos? ¿Y su justificación? 6.13 Si fn ∈ L 1 (Rd ), n ∈ N, y l´ım

n→∞

Z

Rd

|fn | = 0,

entonces {fn }∞ n=1 no converge necesariamente c.s. hacia la función nula, pero contiene una subsucesión que sí lo hace. U NIVERSIDAD DE VALLADOLID

88

Tema 6. Integral de Lebesgue

6.14 Sea f : Rd → R una función no negativa e integrable. Si α ≥ 1, asumiendo que las integrales tienen sentido, calcular Z f (x) α dx . l´ım n log 1 + n→∞ Rd n Sugerencia: Para t ≥ 0 se tiene que log(1 + tα ) ≤ α t .

6.15 Sea f una función real definida y continua en un intervalo compacto I de Rd . Probar que g = f χI es integrable en Rd y se verifica que Z m´ın{f (x) : x ∈ I} m(I) ≤ g(x) dx ≤ m´ax{f (x) : x ∈ I} m(I) . Rd

Sugerencia: Ver ejercicio 5.26.

6.16 Sea I un intervalo de Rd (recuérdese que, por convenio, I es acotado) y {fn }∞ n=1 una sucesión de funciones integrables, acotadas, nulas fuera de I y uniformemente convergentes en Rd hacia una función f . Probar que f es integrable y que Z Z l´ım fn = f. n→∞

Rd

Rd

¿Sigue siendo cierto el resultado si se suprime la condición de anulación fuera de un intervalo de todas las funciones? 6.17 Para n ≥ 1 y x ∈ R, sea

fn (x) = e−nx − 2e−2nx .

∞ P

fn (x) converge para todo x > 0 y calcular su suma f (x). R∞ II ) Probar que fn ∈ L 1 (0, ∞) para cada n ∈ N, y que f ∈ L 1 (0, ∞) . Comparar 0 f con ∞ R P ∞ fn . 0 I)

Demostrar que

n=1

n=1

6.18 Calcular los siguientes límites: Z 1 nx I ) l´ım dx n→∞ 0 1 + n2 x2 Z 1 n x log(x) II ) l´ım dx n→∞ 0 1 + n2 x2

6.19 Calcular los siguientes límites: Z n x n x/2 e dx 1− I ) l´ım n→∞ 0 n Z n x n −2x 1+ II ) l´ım e dx. n→∞ 0 n 6.20 Probar que si a > 0, entonces l´ım

n→∞

Z

∞ a

2

2

n2 x e−n x dx = 0 . 1 + x2

¿Se puede asegurar lo mismo para las integrales en (0, ∞)? 6.21 Demostrar que si |x| ≤ 1 y t > 0 para cada n ∈ N se tiene que X n k −(k+1)t ≤ 2 , x e et − x k=0

y deducir que si |x| ≤ 1 entonces

LATV

Z

∞ 0

∞ X xn−1 sen(t) dt = . et − x 1 + n2 n=1

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

89

Ejercicios

6.22 Probar que

Z

1 0

√ 3

∞ X 9 x log(x) dx = . x−1 (3 n + 4)2 n=0

6.23 Calcular el valor de las siguientes integrales en forma de serie numérica. 2 Z 1 log(x) dx I) 1−x 0 Z 1 sen(x) log(x) dx II ) III )

Z

0

∞

0

log(x) dx . x2 − 1

6.24 Sean p y q números reales positivos. Se consideran las siguientes funciones definidas en el intervalo (0, 1): f (x) = I) II )

xp−1 ; 1 + xq

fn (x) = xp−1

n X

(−1)k xk q ,

n = 0, 1, 2, . . .

k=0

Comprobar que f y fn , n ≥ 0, son integrables en (0, 1).

Probar que, si x ∈ (0, 1), para cada n = 0, 1, 2, . . . se tiene 0 ≤ fn (x) ≤ 2 f (x) =

2 xp−1 . 1 + xq

III )

Concluir del teorema de la convergencia dominada que Z 1 p−1 ∞ X x (−1)n dx = . q p + nq 0 1+x n=0

IV )

Deducir las igualdades log(2) =

∞ X (−1)n+1 ; n n=1

∞ X π (−1)n+1 = . 4 2n − 1 n=1

6.25 Para cada α ∈ R se considera la sucesión {fn }∞ n=1 definida por: fn (x) = nα x e−nx χ(0,∞) (x),

Probar que son equivalentes: Z fn (x) dx = 0 . a) l´ım n→∞

x ∈ R.

R

b) α < 2 .

c) Existe f ≥ 0, f ∈ L 1 (0, ∞) tal que fn ≤ f , para cada n ∈ N.

6.26 Para n ∈ N se considera la función

fn (x) = n2 xa (1 − x)n χ(0,1) (x), x ∈ R . I ) Estudiar bajo qué condiciones existe g ∈ L 1 (0, 1) de manera que fn ≤ g para cada n ∈ N.

II )

Deducir para qué valores de a se verifica l´ım

n→∞

n! = 0. (n + a − 1)(n + a − 2) · · · (a + 1)

6.27 Calcular l´ım

n→∞

U NIVERSIDAD DE VALLADOLID

Z

∞ 0

log(x + n) e−x cos(x) dx . n

90

Tema 6. Integral de Lebesgue

6.28 Sea {fn }∞ n=1 la sucesión de funciones dada por n n+x , x > 0. fn (x) = n + 2x

Demostrar que fn (x) > fn+1 (x) para cada n ∈ N, y encontrar el límite de las integrales y la integral del límite para las sucesiones de funciones gn (x) = fn (x) e

x/2

y

hn (x) = fn (x) e

−x/2 .

6.29 Sean f, g ∈ L 1 (Rd ). I)

Mostrar con un contraejemplo que f g no tiene por qué ser integrable.

II )

Supongamos que, además, una de las dos funciones f o g es acotada c.s. Probar que entonces también es integrable f g .

III)

Más aun, digamos que f es integrable y que g es acotada c.s. (no necesariamente integrable) y es límite c.s. de una sucesión de funciones escalonadas. Demostrar que también en este caso f g es integrable.

6.30 (Densidad de Cc (Rd ) en L1 (Rd )) I)

Sea I un intervalo compacto de Rd . Probar que para cada ε > 0 existe una función continua g: Rd → [0, 1], que vale 1 en cada punto de I y se anula fuera de un intervalo abierto A que contiene a I, esto es, 0 ≤ χI ≤ g ≤ χA ≤ 1 ; y además Z m(I) ≤ g ≤ m(I) + ε . Rd

Nota: El resultado es válido para una clase más amplia de conjuntos (ver el lema de Urysohn 1.89.III), ahora bien, en el caso de intervalos la función g se puede construir explícitamente de forma sencilla. El conjunto sop(g) = cl {x ∈ Rd : g(x) 6= 0} (un cerrado) se denomina soporte de g. El espacio de las funciones continuas en Rd y de soporte compacto se denota por Cc (Rd ). Según el resultado del ejercicio 6.15 toda función de Cc (Rd ) es integrable. II )

Sea α una función escalonada en Rd . Demostrar que para todo ε > 0 existe una función g ∈ Cc (Rd ) tal que Z α(x) − g(x) dx < ε. Rd

Deducir lo mismo para una función integrable en Rd .

Un poco más sobre series de Fourier Las fórmulas (4.2) son aplicables a cualquier función f de L 1 ([−π, π)) (si se prefiere, f definida en R, de periodo 2 π e integrable en los intervalos acotados). Por tanto, podemos hablar de la serie de Fourier de f también en esta situación, aunque f no esté acotada c.s. Se aborda ahora uno de los resultados importantes en la teoría de series de Fourier. 6.31 Sea I un intervalo acotado de R. Comprobar que se verifica: Z Z l´ım cos(n x) dx = 0 = l´ım sen(n x) dx . n→∞

I

n→∞

I

Deducir que si α es una función escalonada, entonces Z π Z π α(x) sen(n x) dx . α(x) cos(n x) dx = 0 = l´ım l´ım n→∞

−π

n→∞

−π

6.32 (Lema de Riemann-Lebesgue) Sea f ∈ L 1 ([−π, π)). Los coeficientes de Fourier de f tienden hacia 0 cuando n crece hacia ∞: Z π Z π f (x) sen(n x) dx . f (x) cos(n x) dx = 0 = l´ım l´ım n→∞

−π

n→∞

−π

Tema 7

Medibilidad. Integración iterada En el tema anterior, y sobre todo a la vista de algunos ejercicios, ya se puede intuir que el concepto de integral se puede establecer para funciones no necesariamente definidas en todo el espacio. Los dominios de definición de estas funciones no pueden ser arbitrarios, se necesita que puedan ser medidos (que tengan área, volumen, etc.). Ya hemos contemplado antes una gama de estos conjuntos, los integrables, pero esto excluye a todos los que tienen “medida infinita” (una semirrecta en R, un sector angular en R2 , etc.). Asimismo, conviene considerar funciones con “buen comportamiento” aunque no sean integrables: las funciones constantes y no nulas y otras muchas funciones continuas resultan no integrables en Rd . Estos problemas son el objetivo de las dos primeras secciones. Una vez establecida esta generalización de la integral se trata la primera de las dos grandes técnicas prácticas: la integración iterada, que reduce el cálculo al de integrales en intervalos de la recta, presentado en el tema precedente. La otra técnica destacable, el método de cambio de variables, que generaliza el homónimo resultado para funciones de una variable, es el foco de atención del tema siguiente.

7.1. Funciones medibles y conjuntos medibles Definición 7.1. Una función f definida en Rd se dice medible (en el sentido de Lebesgue) si es límite c.s. de una sucesión de funciones escalonadas. Se dice que un subconjunto E de Rd es medible si su función característica es medible. Ejemplos 7.2. I) II )

Toda función integrable es medible. Toda función numerablemente escalonada es medible.

III )

Si g es medible y f = g, entonces f es medible.

IV )

Los conjuntos elementales y, en general, los conjuntos integrables son medibles.

V)

c.s.

Rd , Ø y los conjuntos de medida nula son medibles.

Las siguientes propiedades son prácticamente inmediatas a partir de las propiedades de las funciones escalonadas. Propiedades 7.3. Sean f , f1 , f2 , . . . , fn funciones medibles en Rd y E, E1 , E2 , . . . , En subconjuntos medibles de Rd . Se tiene que: I)

|f | es medible, pero el recíproco no es cierto (puede ser |g| medible y no serlo g). n P λk fk es medible. II ) Si λ1 , λ2 , . . . , λn ∈ R, la función λ1 f1 + λ2 f2 + . . . + λn fn = k=1

III )

IV )

f1 · f2 · · · fn =

n Q

fk es medible.

k=1

m´ax{f1 , f2 , . . . , fn } y m´ın{f1 , f2 , . . . , fn } son medibles. V ) Si f (x) 6= 0 c.s. entonces la función definida c.s. 1/f es medible (si se prefiere, 1/f definida de forma arbitraria en los puntos en que se anule f ).

VI ) VII)

Rd \ E es medible.

Si a ∈ Rb , el trasladado a + E = {a + x : x ∈ E} es medible. 91

92 VIII) IX)

Tema 7. Medibilidad. Integración iterada

Si λ ∈ R, el λ E = {λ x : x ∈ E} es medible. n

n

k=1

k=1

∪ Ek y ∩ Ek son medibles.

Los dos resultados siguientes nos proporciona nuevos ejemplos de funciones y conjuntos medibles. Proposición 7.4. Toda función continua en Rd es medible. En consecuencia, si f es igual c.s. a una función continua, entonces f es medible. Proposición 7.5. Si E es abierto o E es cerrado de Rd , entonces E es medible. Por tanto, si E es abierto o cerrado y N es de medida nula, entonces E ∪ N y E \ N son medibles. Observación 7.6. En particular, el resultado anterior se aplica al caso de que N sea la frontera de E. Es decir, los conjuntos con frontera nula, que denominaremos cuadrables, son medibles. Pero, atención! No todo conjunto medible es cuadrable: pensemos en Q ⊂ R, de medida nula y cuya frontera es R. Los conjuntos acotados y cuadrables son los denominados conjuntos con contenido de Jordan o medibles en el sentido de Jordan, que juegan en la teoría de Riemann un papel similar al de los medibles en la de Lebesgue. Teorema 7.7 (Criterio de comparación). Sea f una función medible en Rd . Se supone que existe g ∈ L 1 (Rd ) con |f | ≤ g, entonces también f es integrable. c.s.

Corolario 7.8. Una función medible f es integrable si, y sólo si, |f | es integrable. Corolario 7.9. Si f es medible en Rd y g, h ∈ L 1 (Rd ) son tales que g ≤ f ≤ h, entonces f es c.s.

integrable.

c.s.

Corolario 7.10. Si f es medible y acotada en Rd y g ∈ L 1 (Rd ), entonces también f g ∈ L 1 (Rd ). Corolario 7.11. Si E es un subconjunto medible y acotado en Rd , entonces E es integrable. Proposición 7.12. Si E ⊂ Rd es integrable, para cada a ∈ Rd el conjunto a + E es integrable y m(a + E) = m(E) . d Teorema 7.13. Sea {fn }∞ n=1 una sucesión de funciones medibles en R que converge c.s. hacia la función f . Entonces f es medible. d Corolario 7.14. Sea {fn }∞ n=1 una sucesión de funciones medibles en R . ∞ P fn c.s., entonces f es medible. I ) Si f = n=1

II )

En el caso de que estén definidos c.s., sup{fn : n ∈ N} e ´ınf{fn : n ∈ N} son funciones medibles. ∞

d Corolario 7.15. Sea {En }∞ n=1 una sucesión de subconjuntos medibles de R . Entonces ∪ En

y

∞

n=1

∩ En son medibles.

n=1

Proposición 7.16. Sea f : Rd → R medible. Para cada a ∈ R los siguientes conjuntos son medibles: x ∈ Rd : f (x) ≤ a , x ∈ Rd : f (x) ≥ a , x ∈ Rd : f (x) = a , x ∈ Rd : f (x) > a , x ∈ Rd : f (x) < a , x ∈ Rd : f (x) 6= a . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

93

7.1. Funciones medibles y conjuntos medibles

Corolario 7.17. Si f1 , f2 , . . . , fn y g1 , g2 , . . . , gn son funciones medibles en Rd y para cada j = 1, 2, . . . , n se considera ∼j , cualquiera de las relaciones ≤, ≥, , = o 6=, entonces el conjunto x ∈ Rd : f1 (x) ∼1 g1 (x) , f2 (x) ∼2 g2 (x) , . . . , fn (x) ∼n gn (x) , es medible.

d Proposición 7.18. Sea {fn }∞ n=1 una sucesión de funciones medibles en R . I ) El conjunto x ∈ Rd : {fn (x)}∞ n=1 converge es medible. II ) Si α ∈ R, el conjunto x ∈ Rd : {fn (x)}∞ n=1 converge hacia α es medible

d Proposición 7.19. Una función f : R → R es medible si, y sólo si, para cada a ∈ R el conjunto d x ∈ R : f (x) < a es medible.

Observaciones 7.20. I)

El resultado anterior completa la proposición 7.16 pues incluye su recíproco. En la teoría abstracta de la medida las funciones medibles f se definen, una vez que se tiene el espacio de medida (la familia de los subconjuntos medibles) como aquellas tales que los n P ak χEk , denoconjuntos {f < a}, {f ≤ a}, etc., son medibles; las funciones del tipo k=1

minadas simples son medibles según esta definición, y cualquiera que sea límite c.s. de una sucesión de funciones simples también será medible. Conocida la medida de los conjuntos medibles, el proceso de integración es similar al que hemos presentado, jugando las funciones simples el mismo papel que en nuestro esquema han jugado las funciones escalonadas.

II )

Estamos ahora en condiciones de examinar comparativamente las teorías de la integral de Riemann y de Lebesgue: 1. En la teoría de Riemann (propia) se consideran funciones f acotadas en intervalos acotados I. La integrabilidad de f en I se establece en términos de particiones n

I = ∪ Ik en subintervalos de diámetro cada vez más pequeño, confiando en que la k=1

función “oscile poco” y que las sumas de Darboux n X

k=1

n X

y

´ınf{f (x) : x ∈ Ik } m(Ik )

k=1

sup{f (x) : x ∈ Ik } m(Ik )

disten poco entre sí (cada vez menos haciendo el diámetro de la partición más pequeño). La integral de Riemann es el límite común de las sumas de Darboux (límite creciente para las sumas inferiores y decreciente para las superiores). 2. En la teoría de Lebesgue es irrelevante que f sea acotada o que se anule fuera de un conjunto acotado. Pongamos que f ≥ 0 (esta suposición no supone ninguna limitación en el razonamiento pues |f | será integrable si lo es f , y permite visualizar mejor lo expuesto). La idea es considerar particiones de la imagen, p.e., si n ∈ N, entonces [0, ∞) = ∪ [(k − 1)/n, k/n) y los conjuntos An,k = {(k − 1)/n ≤ f < k/n} son k∈N

medibles. Las funciones

2

sn =

n X k−1

k=1

χAn,k

n

son funciones medibles y simples, además, sn

↑ f . Lo que importa, no es que los

n→∞

conjuntos An,k tengan medida grande o pequeña (lo que, por otra parte, no tiene nada que ver con su carácter de acotados o no), sino que las sumas Z

2

sn =

n X k−1

k=1

n

m(An,k )

permanezcan acotadas: el superior, que es también el límite, de las integrales es, por definición, la integral de f . U NIVERSIDAD DE VALLADOLID

R

sn

94

Tema 7. Medibilidad. Integración iterada

III)

Según 7.15 los conjuntos abiertos, los cerrados, los de medida nula, y los que obtengamos de ellos mediante uniones o intersecciones numerables son medibles. En realidad, es difícil imaginar conjuntos no medibles, al menos entre los que uno se encuentra en los modelos de la Ciencia y la Técnica. Vitali proporciona en 1905 el primer ejemplo (ver ejercicio 7.9), ahora bien, su construcción requiere del Axioma de Elección, un postulado equivalente al Lema de Zorn o al Principio de Buena Ordenación, que suele ser admitido por la mayoría de la comunidad matemática. La duda de si la existencia de conjuntos no medibles puede ser establecida independientemente de ese axioma no fue resuelta hasta 1971, cuando Solovay muestra que en la axiomática tradicional (la de Zermelo y Fraenkel) la existencia de conjuntos no medibles Lebesgue en R es un indecidible, es decir, una proposición tal que ella misma o su negación se pueden añadir al sistema axiomático resultando otro sistema consistente. En otras palabras: si admitimos el Axioma de Elección, entonces en R hay subconjuntos no medibles en el sentido de Lebesgue; si no lo admitimos, podemos afirmar que existen conjuntos no medibles o que no existen, lo que nos apetezca.

IV )

Según la proposición 7.19 la existencia de funciones no medibles va ligada a la existencia de conjuntos no medibles. Aún suponiendo su existencia es difícil toparse, en la práctica, con una de ellas. Nótese la gran ventaja respecto a la integral de Riemann: en ese otro caso no cabe siquiera preguntarse por la integrabilidad de una función que no sea continua c.s. (ver teorema 6.17).

7.2. Integración en conjuntos medibles Definición 7.21. Sean E un subconjunto medible de Rd y f : E → R. I ) Se dice que f es medible en E si f χE es medible en Rd . II )

Se dice que f es integrable en E si f χE es integrable en Rd . En este caso se define la integral de f en E como la integral de f χE en Rd y se representa f ∈ L 1 (E).

Notación: La integral de una función f en un conjunto E se denota por Z Z f (x) dx , f, etc. E

E

y también siguiendo las pautas indicadas en las observaciones 6.3.II y 6.21.IV. Observación 7.22. La integral en un subconjunto medible es, por definición la integral de una función en Rd , así que las propiedades generales de linealidad, monotonía, etc. relatadas en 6.4 son igualmente válidas para la integración en subconjuntos. En añadidura, se tienen las siguientes propiedades. Propiedades 7.23. Sean E y E1 , E2 , . . . , En subconjuntos medibles de Rd . I) II )

Si f ∈ L 1 (Rd ) entonces f|E ∈ L 1 (E).

n

Si f ∈ L 1 (Ek ) para cada k = 1, 2, . . . , n entonces f es integrable en ∪ Ek . Si además los k=1

conjuntos Ek son disjuntos dos a dos, o simplemente, si se tiene que Ek ∩ El es de medida nula para k 6= l, entonces se verifica que Z n Z X f= f. n ∪ Ek

k=1

k=1

Ek

III)

Si E integrable y f es medible en E y acotada c.s. en E, entonces f es integrable en E.

IV )

En particular si m(E) = 0 o si f = 0 en E, se tiene que c.s. Z f = 0. E

Recíprocamente, si f es medible en E y la integral de |f | en E es 0, ha de suceder necesariamente una de las dos cosas: m(E) = 0 o f = 0 en E. c.s.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

95

7.2. Integración en conjuntos medibles

Los siguientes resultados son consecuencia de los teoremas de paso al límite en la integral. En unos casos se trata simplemente de la convergencia c.s. en el conjunto medible E de una sucesión genérica de funciones medibles. En otros casos, estas funciones están dadas en términos de las funciones características de conjuntos (como en la observación 6.21.III). ∞ Nótese que si An ⊂ An+1 para todo n ∈ N, entonces χAn ↑ χA , siendo A = ∪ An . n=1

n→∞

Proposición 7.24. Sean E un subconjunto medible de R y una sucesión de funciones medibles que converge uniformemente en E hacia la función ϕ. d

{ϕn }∞ n=1

Si f ∈ L 1 (E) y f ϕn ∈ L 1 (E) para todo n ∈ N, entonces f ϕ ∈ L 1 (E) y Z Z f ϕ = l´ım f ϕn .

I)

n→∞

E

II )

E

En particular (tomando f = 1), si E es integrable y para cada n ∈ N se tiene que ϕn es integrable en E, entonces ϕ es integrable en E y Z Z ϕn . ϕ = l´ım E

n→∞

E

Teorema 7.25. Sean En , n ∈ N, subconjuntos medibles de Rd , disjuntos dos a dos. Pongamos ∞

E = ∪ En . Si f es integrable en E entonces n=1

I)

f es integrable en En para todo n. ∞ R P f es absolutamente convergente. II ) La serie numérica En n=1

III )

R

E

f=

∞ R P

n=1

En

f.

A modo de recíproco: Teorema 7.26. Sean En , n ∈ N, subconjuntos medibles de Rd , disjuntos dos a dos, y sea ∞

E = ∪ En . Se supone que f es una función medible en E, integrable en cada En , y tal que la n=1 ∞ R P |f | es convergente. Entonces f ∈ L 1 (E) y serie numérica En n=1

Z

f= E

∞ Z X

n=1

f. En

Corolario 7.27. Sean En , n ∈ N, subconjuntos integrables de Rd , disjuntos dos a dos. Si la ∞ ∞ P m(En ) es convergente, entonces E = ∪ En es integrable y serie numérica n=1

n=1

m(E) =

∞ X

m(En ).

n=1

7.2.1. Comentarios sobre espacios de medida La igualdad en el último corolario sigue vigente si convenimos en que un conjunto medible no integrable tiene medida ∞ y que la suma de una serie de términos positivos divergente es ∞ (incluyendo la posibilidad de que alguno de sus términos sea infinito); igual que para funciones medibles y no negativas, pero no integrables, se puede asignar no obstante el valor ∞ a su integral permaneciendo válidos los teoremas fundamentales de paso al límite bajo el signo integral (ver comentarios 6.2.1). De esta forma tenemos una medida, finita o infinita, asignada a cada conjunto medible. Esta situación, hablando de los espacios euclídeos, no es más que un caso particular de una teoría más general. Lo que se expone a continuación no pretende establecer un marco de trabajo, que sería propio de un curso de Análisis Real, sino que va dirigido a familiarizar al lector con una terminología y notación de uso corriente en posteriores estudios y a facilitarle una visión global en el ámbito de todas las matemáticas. U NIVERSIDAD DE VALLADOLID

96

Tema 7. Medibilidad. Integración iterada

Definición 7.28. Sea X un conjunto. Se dice que una subfamilia M de P(X) es una σ-álgebra en X si verifica: I) II ) III)

X ∈ M.

Si A ∈ M, entonces X \ A ∈ M. ∞

Si An ∈ M, n ∈ N entonces ∪ An ∈ M. n=1

En este caso se dice que el par (X, M) es un espacio medible y los elementos de la familia M se denominan conjuntos medibles. El prefijo σ se usa habitualmente para denotar procesos numerables (por ejemplo: un espacio σ-compacto es unión numerable de compactos, aunque él mismo no los sea, como los abiertos de Rn ). Si la última condición se limita a uniones finitas, entonces se habla de un álgebra de conjuntos. De los 3 axiomas de la definición se deduce que si M es σ-álgebra en X, entonces el conjunto vacío y las intersecciones numerables de conjuntos medibles son conjuntos medibles. Definición 7.29. Sea (X, M) un espacio medible. Una medida (positiva) en M es una aplicación µ: M → [0, ∞] tal que ∞ X ∞ µ(An ) µ( ∪ An ) = n=1

n=1

para cada familia numerable de conjuntos medibles {An : n ∈ N} con An ∩ Ak = Ø para n 6= k. Un espacio de medida es una terna (X, M, µ) donde X es un conjunto, M es una σ-álgebra en X, y µ es una medida en M. Ejemplos 7.30. I) II )

R Si en Rd se considera la familia M de los subconjuntos medibles y se define m(E) = E 1 (dando el valor ∞ si E no es integrable), entonces (Rd , M, m) es un espacio de medida. Si X es un conjunto y x0 ∈ X la aplicación definida en P(X) por 1 si x0 ∈ A, δ(A) = 0 si x0 ∈ / A, es una medida, denominada delta de Dirac soportada en x0 .

III)

La aplicación definida en P(N) por p(A) =

X 1 2n

n∈A

es un probabilidad, es decir, una medida positiva y finita cuya variación total, p(N), es igual a 1. IV )

Si ρ es una función medible, no negativa e integrable en los compactos de Rd , entonces la aplicación definida en los conjuntos medibles Lebesgue por Z µ(E) = ρ(x) dm(x) E

es una nueva medida; se dice que µ es absolutamente continua respecto de m y que ρ es la función de densidad de µ (o derivada de Radon-Nicodym) de µ respecto de m. R V ) Como en el apartado anterior, si además Rd ρ = 1, entonces µ es una probabilidad. Un caso notable, por su frecuente aparición, es el de la distribución de probabilidad normal o gaussiana en R: Z 2 1 √ e−x dx . p(E) = π E

En general, dados M ∈ R y σ > 0, la función de la forma Z 1 −(x−M )2/2σ 2 √ e p(E) = dx , E σ 2π es una probabilidad; cualquier variable aleatoria con esta distribución de probabilidad tiene esperanza igual a M y varianza igual a σ 2 .

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

97

7.2. Integración en conjuntos medibles

7.2.2. Conceptos físicos definidos por integrales No pretendemos aquí más que mostrar como la noción de integral interviene en los modelos de las ciencias experimentales más allá de la simple idea de área, volumen, etc. En numerosos modelos de la Física Matemática una magnitud µ definida en un subconjunto de Rp está subordinada a la medida mp en el sentido de que si mp (E) = 0 entonces µ(E) = 0. Por ejemplo, si µ(E) representa la masa presente en el subconjunto E de R3 , es lógico establecer, si se idealiza la materia como un medio continuo, que µ(E) = 0 si E tiene volumen 0. Esa subordinación o continuidad absoluta de µ respecto de m viene dada (la prueba queda fuera de los objetivos de este curso) por una densidad, concepto que se define a continuación, generalizando lo ya comentado en el ejemplo 7.30.IV. Definición 7.31. Sean A un subconjunto medible de Rp y µ una función de conjunto, que asigna a cada compacto K ⊆ A el número real µ(K) ≥ 0. Se dice que ρ: A → R es una función de densidad (o simplemente densidad) para µ si es medible, no negativa, e integrable en los compactos de A, y se verifica que: Z µ(K) = ρ(x) dx para todo compacto K ⊆ A. K

En estas condiciones, obviamente µ(K) = 0 si mp (K) = 0.

Las siguientes definiciones se establecen en R3 por ser ésta la situación más común, pero no hay problemas en generalizarlas a dimensión arbitraria. En lo que sigue A será un subconjunto de R3 y µ una medida dada en A por la densidad ρ en los términos de la definición precedente. Definición 7.32. Dado un conjunto compacto (o simplemente un conjunto medible y acotado) K ⊆ A con µ(K) > 0, el centro de K relativo a µ es el punto cK ∈ R3 dado por ZZZ ZZZ ZZZ 1 x ρ(x, y, z) dx dy dz , y ρ(x, y, z) dx dy dz , z ρ(x, y, z) dx dy dz . µ(K) K K K Observaciones 7.33. I ) Si ρ es una densidad de masa, cK se denomina también centro de masa de K; si µ representa la carga eléctrica, cK se llama centro de carga de K, etc. II )

III )

Para sólidos homogéneos (con densidad constante) el centro de masa viene dado por ZZZ ZZZ ZZZ 1 cK = x dx dy dz , y dx dy dz , z dx dy dz . m(K) K K K

En la definición anterior, las integrales normalizadas dividiendo por la medida del conjunto son el análogo continuo a las sumas ponderadas en los modelos discretos: si x1 , x2 , . . . , xn son puntos del espacio donde se concentran masas µ1 , µ2 , . . . , µn , entonces 1 µ1 x1 + µ2 x2 + . . . + µn xn c= µ1 + µ2 + . . . + µn es el centro de masas de dicho sistema; esto es, a efectos mecánicos, en estado de reposo, podemos considerar toda la masa µ = µ1 + µ2 + . . . + µn concentrada en el punto c.

Definición 7.34. Sea K ⊆ A un conjunto compacto (o simplemente un conjunto medible y acotado). Fijada una recta L de R3 (un eje de rotación) se define el momento de inercia de K respecto del eje L como la integral ZZZ RL2 (x) ρ(x) dx , K siendo RL la función distancia a L: RL (x) = m´ın kx − p k : p ∈ L .

Observación 7.35. El momento de inercia de un cuerpo cuantifica su resistencia a adquirir una aceleración angular. Cuanto más concentrada esté la masa del sólido cerca del eje de rotación, más pequeña será la función integrando (por eso los patinadores estiran sus brazos para disminuir la velocidad de giro o se encogen para aumentarla). n P µk RL2 (xk ) . En el caso discreto descrito en 7.33.III el momento de inercia viene dado por k=1

U NIVERSIDAD DE VALLADOLID

98

Tema 7. Medibilidad. Integración iterada

7.3. Integración iterada En el tema anterior ya hemos proporcionado recursos de cálculo para funciones de una variable. Lo que se expone ahora, reducir una integral múltiple a varias integrales en intervalos de la recta, viene a completar aquello, permitiendo en muchos casos, no sólo determinar el carácter integrable o no integrable de una función, sino también calcular el valor de su integral. Notación: Si x = (x1 , x2 , . . . , xp ) ∈ Rp , y = (y1 , y2 , . . . , yq ) ∈ Rq , representaremos por (x, y) al elemento de Rp+q dado por (x, y) = (x1 , . . . , xp , y1 , . . . , yq ). Esto está justificado por los isomorfismos lineales Rp+q ≃ Rp × Rq ≃ Rp ⊕ Rq . Definición 7.36. Sean E un subconjunto de Rp+q y f : Rp+q → R. I)

Se define la proyección de E en Rp como el subconjunto de Rp dado por Π1 (E) = {x ∈ Rp : (x, y) ∈ E para algún y ∈ Rq },

y se define la proyección de E en Rq como el subconjunto de Rq dado por Π2 (E) = {y ∈ Rq : (x, y) ∈ E para algún x ∈ Rp }. II )

Fijado x ∈ Rp se define la sección de E por x como el subconjunto de Rq dado por Ex = {y ∈ Rq : (x, y) ∈ E} .

Análogamente, para y ∈ Rq la sección de E por y es el subconjunto de Rp dado por Ey = {x ∈ Rp : (x, y) ∈ E},

III)

Para cada x ∈ Rp la sección de f por x es la función fx : Rq → R definida por fx (y) = f (x, y). q

Análogamente, si y ∈ R , la sección de f por y es la función x ∈ Rp 7→ fy (x) = f (x, y). Observaciones 7.37. I)

Si I es un intervalo de Rp+q es obvio que sus proyecciones son intervalos J1 = Π1 (I) ⊂ Rp y J2 = Π2 (I) ⊂ Rq . Además I = J1 × J2 .

II )

Las secciones de un conjunto E heredan algunas propiedades de él, pero en general hay que ser cauteloso. Por ejemplo, las secciones de un abierto son abiertas, las de un compacto son compactas, pero las de un conexo no necesariamente son conexas, ni todas las secciones de un conjunto medible en Rp+q son necesariamente medibles en Rp o Rq .

III)

Aunque las definición anterior se han dado en términos de un agrupamiento ordenado de las variables, no hay ningún inconveniente en generalizar estos conceptos fijando índices 1 ≤ i1 < i2 < . . . ip ≤ d = p + q y pensando en Rd como la suma directa de dos subespacios de dimensiones p y q (los asociados a las variables agrupadas en x = (xi1 , xi2 , . . . , xip ) e y = (xip+1 , xip+2 , . . . , xip+q ).

Las secciones de funciones o de conjuntos se comportan bien respecto a las operaciones habituales. Precisando más, se verifican las siguientes propiedades: Propiedades 7.38. Sean E , {Ei : i ∈ I} subconjuntos de Rp+q y f, g, {fn }∞ n=1 funciones definidas en Rp+q . I) II ) III)

|fx | = |f |x ; (f + )x = (fx )+ ; (f − )x = (fx )− .

p+q q Si {fn }∞ , entonces {(fn )x }∞ n=1 converge hacia f en R n=1 converge hacia fx en R .

(f + g)x = fx + gx ; (f g)x = fx gx ; (λ f )x = λ fx , λ ∈ R . ∪ Ei = ∪ (Ei )x . IV ) (χE )x = χEx ; i∈I

LATV

x

i∈I

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

99

7.3. Integración iterada

Teorema 7.39 (de Fubini para funciones escalonadas). Sea α una función escalonada en Rd = Rp+q . Para cada x ∈ Rp la sección αx : Rq → R es escalonada; la función definida por Z Z x ∈ Rp 7−→ ϕ(x) = αx (y) dy = α(x, y) dy Rq

Rq

p

es escalonada en R y además Z Z α= Rp+q

ϕ(x) dx = Rp

Z

Rp

Z

α(x, y) dy dx . Rq

Análogamente, intercambiando los papeles de x e y: Z Z Z α= α(x, y) dx dy . Rp+q

Rq

Rp

Teorema 7.40 (de Fubini para conjuntos de medida nula). Sea E un subconjunto de Rd = Rp+q de medida nula. Para casi todo x ∈ Rp la sección Ex es de medida nula en Rq . Análogamente, Ey es de medida nula en Rp para casi todo y ∈ Rq . Teorema 7.41 (de Fubini). Sea f una función integrable en Rd = Rp+q . Para casi todo x ∈ Rp la función fx es integrable en Rq . La función definida c.s. en Rp por Z Z f (x, y) dy fx (y) dy = ϕ(x) = Rq

Rq

p

es integrable en R y además Z Z f= Rp+q

ϕ(x) dx = Rp

Z

Rp

Z

Rq

f (x, y) dy dx .

Análogamente, intercambiando los papeles de x e y: Z Z Z f= f (x, y) dx dy . Rp+q

Rq

Rp

Corolario 7.42. Sea E un subconjunto medible de Rp+q . Para casi todo x ∈ Rp la sección Ex es un conjunto medible en Rq . Aplicando reiteradamente el teorema de Fubini se obtiene el siguiente resultado que nos permite reducir el cálculo de una integral en Rp al de p integrales en R. Corolario 7.43. Sea f una función integrable en Rp , entonces Z Z Z Z f (x1 , x2 , . . . , xp ) dx1 dx2 · · · dxp ··· f (x) dx = Rp

R

R

R

estando cada una de las funciones integrando definida c.s. en R. Lo mismo para cualquier permutación del orden de las variables. En particular, si E = I1 × I2 × · · · × Ip es un intervalo (no necesariamente acotado) de Rp , y aj < bj son los extremos de cada intervalo Ij ⊂ R y f es integrable en E. Entonces Z Z bp Z b2 Z b1 ··· f (x) dx = f (x1 , x2 , . . . , xp ) dx1 dx2 · · · dxp . E

ap

a2

a1

Observación 7.44. Las integrales que aparecen en los teoremas anteriores, operando paulatinamente sobre grupos de variables Z Z Z Z Z f (x, y) dy dx , ··· f (x1 , x2 , . . . , xp ) dx1 dx2 · · · dxp , etc. Rp

Rq

R

R

R

reciben el nombre común de integrales iteradas. El teorema de Fubini proporciona entonces un procedimiento iterativo de cálculo, pero bajo la premisa de la integrabilidad de la función. Pero el recíproco del teorema de Fubini no es cierto, precisando más: el hecho de que existan las integrales iteradas de una función no implica la integrabilidad de la misma. Esto U NIVERSIDAD DE VALLADOLID

100

Tema 7. Medibilidad. Integración iterada

no debe extrañarnos si pensamos en las nociones de serie condicionalmente convergente y de función numerablemente escalonada (ver ejercicios 7.13 y 7.14). Como en el caso mencionado de las series, el carácter de sumabilidad1 incondicional va asociado a la sumabilidad del valor absoluto o módulo. Esta consideración es la que establece el siguiente teorema que proporciona un criterio de integrabilidad. Teorema 7.45 (Criterio de Tonelli). Sea f una función medible en Rp+q . Supongamos que la integral iterada Z Z f (x, y) dy dx Rp

Rq

existe y es finita, esto es, que para casi todo x ∈ Rp la sección |f |x es integrable en Rq y que la función ψ definida c.s. en Rp por Z f (x, y) dy ψ(x) = Rq

p

es integrable en R . Entonces f es integrable en Rp+q .

Observaciones 7.46. I) II )

Por supuesto, análogo resultado se obtiene intercambiando los papeles de x e y en el teorema de Tonelli. La aplicación iterada, al estilo de 7.43, muestra que si f es medible en Rp y Z Z Z Z f (x) dx = ··· f (x1 , x2 , . . . , xp ) dx1 dx2 · · · dxp Rp

R

R

R

es finita, entonces f es integrable.

III)

En el teorema de Tonelli la hipótesis de medibilidad de f es esencial. Alrededor de 1920, Sierpinski probó, asumiendo el Axioma de Elección, la existencia de un conjunto A ⊂ R2 no medible en el sentido de Lebesgue y tal que toda recta del plano lo corta a lo sumo en dos puntos; en particular, todas las secciones de A son de medida nula y Z Z Z Z χA (x, y) dy dx = m1 (Ax ) dx = 0 dx = 0 , R

R

R

R

aunque 0 no es el área de A, de hecho, ni siquiera tiene sentido considerar m2 (A). 7.3.1. Ejemplos notables de aplicación

Sean E un subconjunto medible de Rd = Rp+q y f : E → R integrable. En teoría, la integral de f en E se puede calcular de forma iterada, pues si f ∗ = f χE es la extensión de f por 0 al resto del espacio Rd , se tiene que Z Z Z Z f (x, y) dx dy = f ∗ (x, y) dx dy = f ∗ (x, y) dy dx . Rp+q

E

Rp

Rq

Ahora bien, pensando en la eficiencia del cálculo, si x ∈ / Π1 (E) entonces Ex = Ø y f ∗ (x, y) = 0; ∗ también, aunque Ex 6= Ø, si y ∈ / Ex de nuevo es f (x, y) = 0. Esto sugiere simplificar así: Z Z Z f (x, y) dy dx . f (x, y) dx dy = E

Π1 (E)

Ex

El problema es que, aunque para casi todo x ∈ Rp el conjunto Ex es medible en Rq (ver corolario 7.42), nada garantiza que sea medible en Rp la proyección Π1 (E), así que esta condición ha de darse como hipótesis para poder proceder en la manera indicada. En la práctica, al tratar los problemas que suscitan las ciencias experimentales, los conjuntos que aparecen (p.e. como dominio de definición de las magnitudes físicas consideradas) suelen ser sencillos, tales que su frontera es una unión de variedades (curvas en R2 , superficies en R3 , etc.). En estas situaciones el problema de la integración iterada, antes que nada, pasa por determinar extremos de intervalos (las secciones de los conjuntos), hablando coloquialmente por “poner los límites de integración”. En los siguientes ejemplos se describen las situaciones más comunes en dimensiones 2 y 3. 1 El

LATV

término función sumable es sinónimo de función integrable, aunque con el tiempo va cayendo en desuso. Departamento de Álgebra, Análisis Matemático, Geometría y Topología

101

7.3. Integración iterada

Ejemplos 7.47. I)

Sean (a, b) un intervalo de R (acotado o no) y ϕ1 , ϕ2 funciones medibles en (a, b) tales que ϕ1 (x) ≤ ϕ2 (x) para cada x ∈ (a, b). El conjunto A de R2 definido por A = {(x, y) ∈ R2 : x ∈ (a, b) , ϕ1 (x) ≤ y ≤ ϕ2 (x)}

es medible (ver figura 7.1). Si f es una función integrable en A se tiene que ZZ Z b Z ϕ2 (x) f (x, y) dy dx . f (x, y) dx dy = ϕ1 (x)

a

A

Un resultado análogo se obtiene intercambiando los papeles de las variables x e y.

a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x)

a ≤ y ≤ b, ϕ1 (y) ≤ x ≤ ϕ2 (y)

Figura 7.1: Integración iterada en dos variables.

II )

Sean A ⊂ R2 medible y ψ1 , ψ2 funciones medibles en A tales que ψ1 (x, y) ≤ ψ2 (x, y) para cada (x, y) ∈ A . El conjunto E de R3 definido por E = {(x, y, z) ∈ R3 : (x, y) ∈ A , ψ1 (x, y) ≤ z ≤ ψ2 (x, y)}

es medible (ver figura 7.2). Si f es una función integrable en E se tiene que Z Z Z ψ2 (x,y) ZZZ f (x, y, z) dz dx dy . f (x, y, z) dx dy dz = A

E

(7.1)

ψ1 (x,y)

z E

x

A

y

Figura 7.2: E = {(x, y, z) ∈ R3 : (x, y) ∈ A , ψ1 (x, y) ≤ z ≤ ψ2 (x, y)}. III )

Si el conjunto A considerado en el caso anterior es a su vez del tipo considerado en el ejemplo 7.47.I, es decir, E = {(x, y, z) ∈ R3 : x ∈ (a, b) , ϕ1 (x) ≤ y ≤ ϕ2 (x) , ψ1 (x, y) ≤ z ≤ ψ2 (x, y)} ,

con ϕ1 , ϕ2 medibles en (a, b), ψ1 , ψ2 medibles en A, la integral doble que aparece en la igualdad (7.1) se calcula de nuevo iteradamente, resultando Z b Z ϕ2 (x) Z ψ2 (x,y) ZZZ f (x, y, z) dz dy dx . f (x, y, z) dx dy dz = a

E

IV )

ϕ1 (x)

ψ1 (x,y)

Si E es un subconjunto medible de R3 , entonces al agrupar las coordenadas en la forma (x, y), z , para una función f ∈ L 1 (E) se tiene que ZZZ Z ∞ ZZ f (x, y, z) dx dy dz , f= E

−∞

Ez

fórmula que se conoce con el nombre de integración por secciones planas.

U NIVERSIDAD DE VALLADOLID

102

Tema 7. Medibilidad. Integración iterada

Este método resulta recomendable cuando las secciones Ez son sencillas de describir y/o la función f no depende de (x, y): si f (x, y, z) = g(z) la integral anterior se escribe ZZZ Z ∞ Z ∞ ZZ g(z) m2 (Ez ) dz . g(z) dx dy dz = f= −∞

E

−∞

Ez

Supongamos que, además, E es acotado (integrable, por lo tanto) y, concretamente, que está contenido en el intervalo I = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ]. Entonces, para cada casi todo z ∈ [a3 , b3 ] el conjunto Ez = (x, y) ∈ R2 : (x, y, z) ∈ E ⊂ [a1 , b1 ] × [a2 , b2 ]

es medible, luego es integrable. Al aplicar lo anterior a la función constante igual a 1 se obtiene la fórmula conocida como principio de Cavalieri (ver figura 7.3), nombre dado en honor a este científico italiano que en el siglo XVII intuyó esta propiedad anticipándose al desarrollo del Cálculo Integral.

E=

∪

a3 ≤z≤b3

m3 (E) =

Z

Ez ×{z}

b3

m2 (Ez ) dz a3

Figura 7.3: Principio de Cavalieri. Nota: En Física el término “Principio” se usa con una acepción similar a la de “Axioma”; hoy en día, aunque se le siga denominando Principio, el de Cavalieri no es más que un corolario del teorema de Fubini.

Ejercicios 7.1 Sea f : Rd → R tal que para cada r ∈ Q, el conjunto Demostrar que f es medible.

x ∈ Rd : f (x) ≥ r

es medible.

7.2 Sean E un subconjunto de Rd y {En : n ∈ N} una partición de E en conjuntos medibles. Probar que una función f definida en E es medible si, y sólo si, sus restricciones f|En son medibles para todo n ∈ N. 7.3 (Desigualdad de Chebyshev) Sean E un conjunto medible de Rd y f una función integrable en E. Dado un número real c > 0 se considera el conjunto Ac = x ∈ E : |f (x)| ≥ c .

Probar que

m(Ac ) ≤

1 c

Z

Ac

|f | ≤

1 c

Z

E

|f | .

7.4 Demostrar que, si f ∈ L 1 (Rd ), el conjunto x ∈ Rd : f (x) 6= 0 es unión numerable de conjuntos de medida finita. 7.5 Sean E ⊂ Rd medible y f ∈ L 1 (E) con f (x) > 0 para casi todo x de E. Probar que Z 1 f /n = m(E) (se conviene que m(E) = ∞ si E no es integrable). l´ım n→∞

E

d 7.6 Sea {En }∞ n=1 una sucesión de conjuntos integrables de R tal que

∞ P

n=1

m(En ) < ∞ . De-

mostrar que el conjunto E = {x ∈ Rd : x ∈ En para infinitos n} es despreciable. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

103

Ejercicios

7.7 Sea f : Rd → R medible. Para cada n = 0, 1, 2, . . . se define En = x ∈ Rd : n < |f (x)| ≤ n + 1 . I)

Probar que, si f es integrable, entonces ∞ X

n=0

II )

n m(En ) < ∞ .

∞ Si el conjunto x ∈ Rd : |f (x)| > 0 = ∪ En es integrable (de medida finita), entonces la n=0

convergencia de la serie anterior implica que f es integrable.

7.8 Para cada n = 0, 1, 2, . . . sea En = (x, y) ∈ R2 : y ≥ 0 , n2 ≤ x2 + y 2 < (n + 1)2 . Probar que, para cada (x, y) ∈ En

5

2 2 /2 5 e−(x + y ) y 3 ≤ e−n (n + 1)3 ,

y deducir que la función

5

2 2 /2 f (x, y) = e−(x + y ) y 3

es integrable en el conjunto ∞ E = (x, y) ∈ R2 : y ≥ 0 = ∪ En . n=0

7.9 (El conjunto de Vitali) En el intervalo [0, 1] se define la relación binaria: xRy si, y sólo si, x − y ∈ Q .

El intervalo [0, 1] se escribe como unión disjunta de las clases de equivalencia que determina la relación R. Se elige un punto de cada clase de equivalencia y se considera el conjunto A de los puntos elegidos. El conjunto A no es medible. La prueba se realiza por reducción al absurdo siguiendo el esquema que se relata continuación: I) II ) III )

R es, efectivamente, una relación de equivalencia.

Si se supone que A es medible entonces también lo es cualquier trasladado, y con igual medida: m(x + A) = m(A). Si r, s ∈ Q con r 6= s se tiene que (r + A) ∩ (s + A) = Ø.

Ahora, dada cualquier numeración {r1 , r2 , . . . , rn , . . .} de Q ∩ [−1, 1] se considera An = rn + A ∞

y B = ∪ An ; se tiene que [0, 1] ⊂ B ⊂ [−1, 2] . Si A fuese medible se tendría que n=1

m([0, 1]) = 1 ≤ m(B) =

∞ X

n=1

m(An ) ≤ 3 = m([−1, 2]) .

7.10 Haciendo uso del conjunto de Vitali demostrar la existencia de: I)

Una función f no medible (resp. no integrable) en R, pero tal que |f | es medible (resp. integrable).

II )

Un conjunto medible E de R2 tal que su proyección π1 (E) = ∪ {x : (x, y) ∈ E} no es y∈R

medible en R (ver ejercicio 5.10).

III )

Un conjunto medible E de R2 tal que la sección Ex = {y : (x, y) ∈ E} es no medible para una infinidad de abscisas x ∈ R.

7.11 Sea f : R → [0, ∞) una función medible, y sea Ω = (x, y) ∈ R2 : x ∈ R, 0 ≤ y ≤ f (x) . Probar que Ω es medible y que

m2 (Ω) = U NIVERSIDAD DE VALLADOLID

Z

f (x) dx . R

104

Tema 7. Medibilidad. Integración iterada

7.12 Sea f : R → R una función medible. Probar que su grafo Γ(f ) = x, f (x) : x ∈ R

es un conjunto de medida nula en R2 .

7.13 Sea f la función numerablemente escalonada en R2 definida por X χ(n,n+1]×(n,n+1] − χ(n,n+1]×(n−1,n] . f= n∈Z

Calcular, si existen, las integrales iteradas de f . ¿Es integrable en R2 esta función? 7.14 Se considera la función definida c.s. en R2 por xy f (x, y) = 2 . (x + y 2 )2 Demostrar que las integrales iteradas de f existen y son iguales. ¿Es f integrable en R2 ? 7.15 En los siguientes casos comprobar que la función f es integrable en el intervalo I y calcular su integral: I = [0, 2] × [0, 2] , f (x, y) = x⌊y+1⌋ y ⌊x+1⌋ . x si x > y, II ) I = [0, 1] × [0, 1] , f (x, y) = y 2 si x ≤ y. III) I = [0, π] × [0, 1] , f (x, y) = |y − sen(x)| . I)

IV )

V)

I = [0, 1] × [0, 1] , f (x, y) = |y − e−x | .

I = [2, 3] × [0, 1] , f (x, y) = (x − y)⌊2 y⌋ .

y 3 − 2 x y 2 + x2 y + x − 1 . (x − y)2 (x − 1) VII) I = [0, 2] × [0, 2] , f (x, y) = |y − 2 x| . p |2 x − y 2 | . VIII) I = [0, 2] × [0, 2] , f (x, y) = VI )

I = [2, 3] × [0, 1] , f (x, y) =

IX)

I = [−1, 1] × [−1, 1] , f (x, y) = m´ax{x, y} . (x + y)−1 si x ≥ y ; X ) I = [1, 2] × [1, 2] , f (x, y) = 0 si x < y .

7.16 Sean a, b números reales con 0 < a < b e I = [0, 1] × [a, b]. Considerando la integral en I de la función f (x, y) = xy , deducir que Z 1 b b + 1 x − xa dx = log . log(x) a+1 0 7.17 Mediante el estudio de la integral de la función f (x, y) =

1 (1 + y) (1 + x2 y)

en el intervalo [0, 1] × [0, 1] deducir que Z 1 x2 + 1 π2 1 dx = log . 2 2 16 0 x −1 7.18 Recordemos que, si s, t ∈ R, se define la exponencial del número complejo s + i t por es+it = es cos(t) + i sen(t) . I)

Calcular el valor de la integral de la función compleja f definida por f (x, y) = ei2πx ei2πy

II )

LATV

en un rectángulo compacto [a, b] × [c, d] de R2 .

Deducir que si {Ik : 1 ≤ k ≤ m} es una partición del intervalo I de R2 tal que cada subintervalo Ik tiene al menos un lado de longitud entera, entonces I tiene al menos un lado de longitud entera. Departamento de Álgebra, Análisis Matemático, Geometría y Topología

105

Ejercicios

7.19 Sea f : R → R una función continua y par (f (t) = f (−t) para cada t ∈ R). Si a > 0 y A = [0, a] × [0, a], pruébese la igualdad ZZ Z a (a − t) f (t) dt . f (x − y) dx dy = 2 0

A

Deducir el valor de la integral de la función |x − y| cos(x − y) en el intervalo [0, π/2] × [0, π/2] .

7.20 Calcular: ZZ √ y √ dx dy . I) x (0,1)×(0,1) ZZ dx dy √ II ) . x+y (0,1)×(0,1) ZZ dx dy . III ) 2 ) (1 + y 2 ) (1 + x 2 R ZZ IV ) x e−xy dx dy . (1,∞)×(1,∞)

7.21 En cada uno de los siguientes supuestos estudiar la integrabilidad de la función f en el abierto I: f (x, y) = (x y)−α , α > 0 . 1 II ) I = (0, 1) × (1, ∞) , f (x, y) = α β , α, β > 0 . x y 1 p III ) I = (1, ∞) × (1, ∞) , f (x, y) = sen , p > 0. xy 1 . IV ) I = (0, 1) × (0, 1) , f (x, y) = p 1 − x2 y 2 I)

V)

VI )

I = (0, 1) × (0, 1) ,

x2 + y 2 + x2 y 3 . x3 + y 3 + x7 y 5 + 1 x2 f (x, y) = . 1 + y 2 x4

I = (1, ∞) × (1, ∞) , f (x, y) =

I = (1, ∞) × (1, ∞) ,

7.22 Sean f, g: [0, ∞) → R funciones continuas, estrictamente crecientes, con f (0) = g(0) = 0 y tales que f ◦ g = g ◦ f = Id[0,∞) , es decir, una es la inversa de la otra. I)

Probar que si a, b > 0 los conjuntos K1 = (x, y) ∈ R2 : 0 ≤ x ≤ a, 0 ≤ y ≤ f (x)

y

son medibles y [0, a] × [0, b] ⊂ K1 ∪ K2 . Z b Z a g(y) dy . f (x) dx + II ) Deducir que a b ≤ 0

III )

K2 = (x, y) ∈ R2 : 0 ≤ y ≤ b, 0 ≤ x ≤ g(y)

0

Considerando adecuadas funciones potenciales demostrar que si p, q son números reales mayores que 1 y tales que 1/p + 1/q = 1, entonces se verifica la desigualdad de Young: ab ≤

7.23 Calcular

RR

bq ap + . p q

f en los siguientes casos: √ −x2/y . I ) K = {(x, y) ∈ R2 : 1 ≤ y ≤ 2 , 0 ≤ x ≤ y } , f (x, y) = x e

II ) III ) IV )

V) VI )

K

K = {(x, y) ∈ R2 : x2 ≤ y ≤ 1} , f (x, y) = x2 + y 2 .

K = {(x, y) ∈ R2 : x + y ≥ 2 , x2 + (y − 1)2 ≤ 1} , f (x, y) = x . K = {(x, y) ∈ R2 : y ≥ x2 , x ≥ y 2 } , f (x, y) = x2 + 4 y 2 .

K = {(x, y) ∈ R2 : 0 ≤ x ≤ 2 , 0 ≤ y ≤ 2 − x} , f (x, y) = ⌊x + y⌋ .

K = {(x, y) ∈ R2 : x ≥ 0 , x2 + (y − 1)2 ≤ 1} , f (x, y) = |x + y − 2| .

U NIVERSIDAD DE VALLADOLID

106

Tema 7. Medibilidad. Integración iterada

π x K = {(x, y) ∈ R2 : x ≤ y 2 , y ≤ x , 0 ≤ y ≤ 2} , f (x, y) = sen . y √ VIII) K = {(x, y) ∈ R2 : x2 + y 2 ≤ a2 } , f (x, y) = a2 − x2 , siendo a > 0. VII)

IX)

K = {(x, y) ∈ R2 : y ≥ 0 , y 3 ≤ x ≤ y 2 } , f (x, y) = e

.

K = {(x, y) ∈ R : 1 ≤ y ≤ x , 0 ≤ x ≤ 2} , f (x, y) = x2 + y 2 . XI) K = (x, y) ∈ R2 : y ≤ 2 , x/2 ≤ y ≤ x , f (x, y) = y . XII) K = (x, y) ∈ R2 : 0 ≤ x ≤ 1 , 0 ≤ y ≤ 2 x , f (x, y) = |y − x| . X)

2

x/y

2

7.24 Si D es el círculo limitado por la circunferencia de ecuación x2 + y 2 − R y = 0, calcular las siguientes integrales: ZZ p R − y dx dy . I) Z ZD II ) y dx dy . D

7.25 En las siguientes situaciones comprobar que la función f es integrable en el conjunto E y calcular la integral (1 − y)c , siendo 0 < c < 1; E = {(x, y) ∈ R2 : 0 < x < 1 , 0 < y < x} . I ) f (x, y) = (x − y)c II ) f (x, y) = x y , E = (x, y) ∈ R2 : x ≥ 0 , y ≥ 0 , 1 ≤ x2 + y 2 ≤ 4 . 1 , E = {(x, y) ∈ R2 : 0 < x < 1 , 0 < y < x} . III) f (x, y) = x 1 IV ) f (x, y) = √ , E = {(x, y) ∈ R2 : 0 < x , 0 < y , x + y < 4} . 4−x−y 7.26 Estudiar la integrabilidad de la función f (x, y) = x , en los siguientes conjuntos: n 1 o 2 I ) A = (x, y) ∈ R : x > 0 , 0 < y < . 1 + x4 2 II ) B = (x, y) ∈ R : x > 0 , arctg(x) < y < π/2 . 7.27 Estudiar la integrabilidad de f en V en los siguientes casos: √ n x 1o I ) f (x, y) = . , V = (x, y) ∈ R2 : x > 0 , x < y < x + y x 1 II ) f (x, y) = 4 , V = (x, y) ∈ R2 : y > x2 + 1 . x + y2 sen(ex y) x , V = (x, y) ∈ R2 : x > 1 , 1 < ex y < e /2 . III) f (x, y) = x3 y y e /x sen(x) , V = (x, y) ∈ R2 : 0 < y < x < 1 . IV ) f (x, y) = 2 1+y x V) VI ) VII) VIII) IX) X)

LATV

e−(

x/y )2

, V = (x, y) ∈ R2 : 0 < y < 1 , x > y . y sen(x y) , V = (x, y) ∈ R2 : x > 0 , arctg(x) < y < π/2 . f (x, y) = xy 1 f (x, y) = √ , V = (x, y) ∈ R2 : 0 < y < x < y + e−y . y n 1 o . f (x, y) = xα y cos(x y) , V = (x, y) ∈ R2 : x > 0 , |y| < x+1 x − cos(y) f (x, y) = , V = (x, y) ∈ R2 : 1 < x , 0 < y < x . 2 4 y +x √ 1 f (x, y) = α , V = (x, y) ∈ R2 : x > 1 , x2 − 1 < y < x . x y f (x, y) =

ey

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

107

Ejercicios

7.28 En R3 se considera el cubo unidad C = [0, 1] × [0, 1] × [0, 1] . Calcular la integral en C de las siguientes funciones: I) II )

f (x, y, z) =

z (y z − x2 − x4 ) . 1 + x2

f (x, y, z) = |x + y + z − 1| .

III )

f (x, y, z) = m´ax{x, y, z} .

IV )

f (x, y, z) = x2 y cos(x y z) .

V) VI )

f (x, y, z) = |x2 + y 2 + z 2 − 1| . f (x, y, z) = x |y − z| .

7.29 Sean r, h > 0.

Demostrar la fórmula del área de un círculo de radio r: m2 B(x0 , r) = π r2 . 4 3 II ) Deducir la fórmula para el volumen de una bola de R3 : m3 B(x0 , r) = π r . 3 III ) Deducir la fórmula del volumen para sólidos de revolución E, obtenidos al girar alrededor del eje OX la gráfica, Γ(f ) = {(x, y) : y = f (x)}, de la función positiva f : (a, b) → (0, ∞): Z b f (x)2 dx . m3 (E) = π I)

a

En particular:

1. El volumen de un cilindro de altura h y radio de la base r es π r2 h . 1 2. El volumen de un cono de altura h y radio de la base r es π r2 h . 3 Nota: Supóngase, de momento, que estos conjuntos son simétricos respecto a uno de los ejes coordenados. En el tema siguiente constataremos lo que dicta la intuición: la medida de Lebesgue, al igual que la métrica en Rn , es invariante por traslaciones, giros y simetrías. 7.30 Calcular la integral de f en K en los siguientes casos: √ I ) K = {(x, y, z) ∈ R3 : 1 ≤ x ≤ 3 , 1 ≤ y ≤ 3 , 0 ≤ z ≤ x y } , f (x, y, z) = z − x y . p √ II ) K = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 1 , 0 ≤ y ≤ x − x2 , 0 ≤ z ≤ x2 + y 2 } , f (x, y, z) = z y x2 + y 2 . III )

K = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 2 , 0 ≤ z ≤ y 2 ≤ 4} , f (x, y, z) = z ⌊x⌋ .

IV )

K = {(x, y, z) ∈ R3 : 0 ≤ y , y 2 ≤ x2 + z 2 ≤ 4} , f (x, y, z) =

V)

1 . y+2

K = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ R2 , x2 + y 2 + (z − R)2 ≤ R2 } , f (x, y, z) = z 2 .

7.31 Probar que la función f (x, y, z) =

e−y(z+1) sen(y) 1 + z x2

es integrable en el conjunto V = (x, y, z) ∈ R3 : 0 < x < 1 , 0 < y , 0 < z < 1/x .

7.32 Sea P el sólido limitado por el tetraedro cuyas caras yacen en los tres planos coordenados y el plano de ecuación x + 2 y + 3 z = 6 . I) II )

Determinar el volumen de P . Calcular el centro de masa de P .

III )

Calcular la integral en P de la función f (x, y, z) = x y z .

IV )

Calcular la integral en P de la función g(x, y, z) = |x + y − 3| .

U NIVERSIDAD DE VALLADOLID

108

Tema 7. Medibilidad. Integración iterada

7.33 Un sólido acotado K está limitado por la superficie de ecuación z = x2 − y 2 y los planos de ecuaciones z = 0 , x = 1 , x = 3 . I) II ) III)

Calcular el volumen de K. Calcular el centro de masa de K. Demostrar que la función f (x, y, z) = ⌊x⌋ es integrable en K y calcular su integral.

7.34 Sea K el compacto contenido en el primer octante (x ≥ 0, y ≥ 0, z ≥ 0) y limitado por los planos de ecuaciones x + y = 2 , x + 2 y = 6 , y el cilindro de ecuación y 2 + z 2 = 4 . Calcular ZZZ z dx dy dz . K

7.35 Si K es el compacto contenido en el primer octante y limitado por las dos superficies de ecuaciones y 2 = x − x2 y z 2 = 4 x , calcular ZZZ x2 y z 3 dx dy dz . K

7.36 Sea E el sólido de R3 limitado por el paraboloide de revolución de ecuación x2 +y 2 +z = 4 , y el plano de ecuación z = 0 . Calcular el centro de masa de E en los dos supuestos siguientes: I) II )

La densidad de masa de E es constante (E es homogéneo). La densidad de masa de E, que decrece con la altura, está dada por ρ(x, y, z) =

1 . 1 + z/16

7.37 Se considera el compacto de R3 K = (x, y, z) ∈ R3 : 0 ≤ x ≤ y ≤ 1 , 0 ≤ z , x + y + z ≤ 2 . I)

II )

Expresar la integral de una función f continua en K como integral iterada, al menos de dos formas distintas.

Calcular el centro de masa de K.

7.38 Se considera el subconjunto de R3 K = (x, y, z) ∈ R3 : |x| + |y| ≤ 1 , z ≥ 0 , x2 + y 2 + z 2 ≤ 1 . I)

Calcular la integral en K de la función f (x, y, z) = z x2 .

II )

Calcular la integral en K de la función f (x, y, z) = y z 2 .

7.39 Sean a, b, c números reales positivos. 2 2 I ) Demostrar que el área del conjunto (x, y) ∈ R2 : x /a2 + y /b2 ≤ 1 es igual a π a b. II )

Mediante el método de secciones planas calcular el volumen del subconjunto de R3 limitado por el elipsoide de ecuación x2 y2 z2 + 2 + 2 = 1. 2 a b c

7.40 Sea r > 0. Se considera el conjunto K = (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ r2 , x2 + y 2 ≤ z .

Calcular el centro de masa de K.

Tema 8

Integración por cambio de variables Como en muchas otras situaciones, el germen de la teoría que presentamos ahora es el estudio de casos particulares surgidos, sobre todo, de los modelos de la Física Teórica, siendo el aparato matemático concebido, en principio, de forma heurística hasta que la madurez de la teoría que lo sustenta permite establecer un enunciado y prueba globales. En este sentido, el cambio de variables es casi tan antiguo como la propia noción de integral. Por mencionar algunos hitos: hacia 1769 Euler, en su desarrollo de la integral doble, ya contempla una fórmula de índole geométrica del cambio de variable; poco después, en 1773 Lagrange usa un cambio de variable en una integral triple, obligado por el estudio de elipsoides, objeto de su trabajo en ese momento; en el manejo de integrales de superficie Gauss usa en 1813 cambios de variables para integrales dobles; Ostrogradski enuncia en 1836 una primera generalización del teorema del cambio de variables a dimensión arbitraria y dos años después publica la primera prueba para el caso de integrales dobles en términos de “diferenciales”; Jacobi y Catalan publican en 1841 sendos artículos independientes con referencias al teorema general del cambio de variables en dimensión arbitraria. Por cierto, es bastante común el nombre teorema del jacobiano para referirse al teorema del cambio de variables. El punto final de esta teoría se puede atribuir a E. Cartan, uno de los padres de la geometría diferencial, quien en las postrimerías del s. XIX establece con rigor las nociones de elementos de área, formas diferenciales1 , etc., lo que zanja definitivamente el teorema general del cambio de variables para la integral múltiple de Riemann. La prueba del teorema del cambio de variables para la integral de Lebesgue se puede ver como una simple adaptación del referido a la integral de Riemann: salvo en la forma en que se concibe la convergencia de las sucesiones de funciones escalonadas, hasta ese momento todo es igual.

8.1. Nociones previas En primer lugar, recordaremos conceptos que son tratados en un primer curso de Cálculo en una variable y de Álgebra Lineal, nociones elementales, pero fundamentales para el posterior desarrollo de la teoría. Asimismo, comenzaremos contemplando algunas nociones topológicas, ya zanjadas en los primeros temas o inmediatas a partir de aquellas. Lema 8.1. Sean U y V abiertos de Rd y ϕ: U ↔ V un difeomorfismo. Si U es conexo también lo es V y la función Jϕ tiene signo constante en U . Lema 8.2. Sean U y V abiertos de Rd y ϕ un difeomorfismo de U sobre V . I ) Un subconjunto K ⊂ U es compacto si, y sólo si, el conjunto ϕ(K) ⊂ V es compacto. II ) Si K ⊂ U es compacto, entonces Fr ϕ(K) es ϕ Fr(K) .

Observación 8.3. La correspondencia entre las fronteras de un conjunto y su transformado sirve en muchos casos para determinar el segundo conjunto; por ejemplo, si el compacto K de R2 está delimitado por las curvas Γ1 ,. . . ,Γm , entonces ϕ(K) está delimitado por las curvas ϕ(Γ1 ),. . . ,ϕ(Γm ).

1 Hoy en día todavía es frecuente encontrar en textos de Física razonamientos heurísticos basados en la consideración de “diferenciales” como incrementos pequeños de las magnitudes: p.e., el volumen de un sólido de revolución se puede obtener tomando rebanadas infinitesimales del conjunto, que son casi cilindros, y sumando sus volúmenes.

109

110

Tema 8. Integración por cambio de variables

8.1.1. Cambios de variable en una dimensión Consideremos intervalos de la recta I, J de cualquier naturaleza (acotados o no, abiertos o no) y ϕ: I → J una biyección de clase C 1 y tal ϕ−1 : J → I también es derivable (por tanto, que 1 ′ −1 −1 ′ también de clase C ). Puesto que ϕ (ϕ (x) (ϕ ) (x) = 1 para todo x ∈ J, la función continua ϕ′ no se anula nunca y debe tener signo constante en el conexo I (i.e., ϕ es estrictamente monótona). El teorema fundamental del Cálculo (la regla de Barrow, si se prefiere) establece que si f es una función definida en J, nula fuera de un compacto [a, b] ⊂ J y f es continua o f es escalonada, entonces Z β Z ϕ−1 (b) Z b (8.1) f ϕ(y) ϕ′ (y) dy f ϕ(y) ϕ′ (y) dy = f (x) dx = a

ϕ−1 (a)

α

−1

siendo [α, β] = ϕ ([a, b]) ⊂ I. La fórmula (8.1) es válida también para integrales impropias, si más que pasar al límite, pudiendo ser infinitos cualquiera de los extremos a o b o de sus correspondientes α y β; por ejemplo, si ϕ′ > 0, esto es, si ϕ es creciente: α = ϕ(a+ ) = l´ım+ ϕ(y) ; y→a

β = ϕ(b− ) = l´ım− ϕ(y) . y→b

También es válida para funciones integrables en general (aunque la prueba es más laboriosa la idea es simple: si es cierto para funciones escalonadas lo es para sus límites). Así, si E es cualquier intervalo contenido en I (nótese que ϕ(E) es también un intervalo, en virtud del teorema de Bolzano) podemos escribir Z Z f (x) dx = (8.2) f ϕ(y) ϕ′ (y) dy . ϕ(E)

E

En cualquier caso, el factor ϕ′ (y) mide la tasa de variación de las medidas (longitudes) de los intervalos ϕ(E) respecto a la de los originales. Explícitamente: si denotamos por Ez al intervalo [y, z] entonces, por definición de derivada, se tiene que ′ ϕ (y) = l´ım ϕ(z) − ϕ(y) = l´ım m1 ϕ(Ez ) z−y m1 (Ez ) z→y + z→y +

El objetivo de este tema es generalizar (8.2) al caso de dimensión arbitraria y a conjuntos medibles E cualesquiera. 8.1.2. Representación y descomposición de isomorfismos lineales Los resultados y comentarios siguientes tienen su interpretación matricial, concretamente en lo que se refiere a las operaciones con filas o columnas de una matriz cuadrada, y cómo afectan a su determinante. La motivación de su estudio es la misma que en situaciones más pragmáticas (tal como el método de eliminación gaussiana en la resolución de sistemas lineales): simplificar la disquisición teórica posterior.

Definición 8.4. Una transformación elemental en Rd es un isomorfismo lineal del espacio vectorial Rd en si mismo de uno de los tres tipos siguientes: E1.- Ri,λ (x1 , . . . , xi , . . . , xd ) = (x1 , . . . , λ xi , . . . , xd ) , λ ∈ R, λ 6= 0, 1 ≤ i ≤ d. E2.- Si,j (x1 , . . . , xi , . . . , xd ) = (x1 , . . . , xi + xj , . . . , xd ) , 1 ≤ i, j ≤ d.

E3.- Ti,j (x1 , . . . , xi , . . . , xj , . . . , xd ) = (x1 , . . . , xj , . . . , xi , . . . , xd ) , 1 ≤ i < j ≤ d.

Observación 8.5. Las transformaciones Ri,λ (homotecias en una dirección) son transforma−1 ciones con jacobiano igual a λ y con inversa Ri,λ = Ri,1/λ . Las transformaciones Si,j tienen jacobiano igual a 1 y su inversa es −1 Si,j = Rj,−1 ◦ Si,j ◦ Rj,−1 .

Las transformaciones Ti,j (transposiciones de coordenadas) tienen jacobiano igual a −1 y son sus propias inversas: Ti,j ◦ Ti,j = IdRd . Lema 8.6. Todo isomorfismo lineal ϕ: Rd → Rd es composición de un número finito de transformaciones elementales. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

111

8.2. Teorema del cambio de variables

8.2. Teorema del cambio de variables Comenzaremos enunciando el teorema general y alguna de las consecuencias directas. Teorema 8.7 (del cambio de variables). Sean U, V abiertos de Rd y ϕ un difeomorfismo de U en V . Si E ⊂ V es un conjunto medible y f es una función definida c.s. e integrable en E, entonces ϕ−1 (E) es medible, la función (f ◦ ϕ) |Jϕ| es integrable en ϕ−1 (E) y se tiene que Z Z f (x) dx = f ϕ(y) |Jϕ(y)| dy . (8.3) ϕ−1 (E)

E

En lo que R U , V y ϕ serán como en el enunciado anterior. Recordemos que por R sigue definición E f = V f χE , así que el enunciado anterior es equivalente al siguiente:

Teorema 8.8 (del cambio de variables, 2a. versión). Si f es una función definida c.s. en V . Entonces f ∈ L 1 (V ) si, y sólo si, (f ◦ ϕ) |Jϕ| ∈ L 1 (U ), además se tiene que Z Z f= (f ◦ ϕ) |Jϕ| . (8.4) V

U

Con el convenio habitual de asignar el valor ∞ a la integral de una función medible y no negativa, pero no integrable, lo mismo que a la medida de un conjunto medible pero no integrable, el resultado anterior se materializa en los siguientes. Corolario 8.9. Si f es una función medible en V Entonces Z Z |f | = (|f | ◦ ϕ) |Jϕ| . V

U

Corolario 8.10. Si E ⊂ V es medible también lo es ϕ−1 (E) ⊂ U y Z Z m(E) = 1= |Jϕ| . E

(8.5)

ϕ−1 (E)

8.2.1. Notas sobre la demostración del teorema del cambio de variables Los siguientes pasos o etapas proporcionan un esquema organizado, una disección de la prueba del teorema 8.7 avanzando a medida que se complican los objetos tratados, ya sean los conjuntos donde se integra o la naturaleza de los difeomorfismos. Paso 1 Conservación de la medibilidad Lema 8.11. Si N ⊂ U es de medida nula, entonces ϕ(N ) ⊂ V es de medida nula. (ver ejercicio 5.22.II) Así pues, la fórmula (8.5) es válida para los conjuntos despreciables, ya que ϕ−1 es también cambio de variables de V sobre U . Corolario 8.12. Si A es un conjunto cuadrable y tal que A = A ∪ Fr(A) ⊂ U , entonces ϕ(A) es cuadrable. En particular, si A es un subconjunto de U elemental y cerrado, entonces ϕ(A) es cuadrable (aunque no necesariamente elemental). Corolario 8.13. Si f : V → R es medible, entonces f ◦ ϕ: U → R es medible. Por tanto, también lo es (f ◦ ϕ)|Jϕ|: U → R. Paso 2 Caso de transformaciones lineales Lema 8.14. Si el teorema 8.7 se verifica para difeomorfismos ϕ: U → V y ψ: V → W , entonces también se verifica para γ = ψ ◦ ϕ: U → W . Lema 8.15. El teorema 8.7 se verifica para transformaciones elementales y funciones escalonadas. Corolario 8.16. El teorema 8.7 es cierto para isomorfismos lineales ϕ: U = Rd → V = Rd . U NIVERSIDAD DE VALLADOLID

112

Tema 8. Integración por cambio de variables

Paso 3 Estimación de las medidas de los conjuntos transformados Lema 8.17. Sea I un intervalo compacto contenido en U . Se tiene que Z Z m ϕ(I) = 1 ≤ |Jϕ| . I

ϕ(I)

A partir de este resultado (aunque no sea necesario para completar la prueba), es natural postular que la misma desigualdad se verifica para cualquier conjunto medible E ⊂ U : Z m ϕ(E) ≤ |Jϕ| . E

Lo que es evidente es que para funciones escalonadas y no negativas definidas en U , n P aj χIj , se tiene que α= j=1

Z

V

α ◦ ϕ−1 ≤

Z

U

(α ◦ ϕ−1 ◦ ϕ) |Jϕ| =

Z

U

α |Jϕ| .

Paso 4 Conclusión del caso general Es suficiente abordar el caso de funciones no negativas pues de las relaciones f = f+ − f− ,

|f | = f + + f − ,

se sigue para funciones reales; y luego de f = Re(f ) + i Im(f ) para el caso complejo. Lema 8.18. Sea f : V → [0, ∞) una función medible. Si (f ◦ϕ) |Jϕ| es integrable en U , entonces f es integrable en V y se verifica que Z Z f ϕ(y) |Jϕ(y)| dy . f (x) dx ≤ U

V

Finalmente, prestando atención al difeomorfismo ψ = ϕ−1 y a su inverso ψ −1 = ϕ, ahora con la función medible en U y no negativa g = (f ◦ ϕ) |Jϕ|, se tiene que Z Z Z Z f (x) dx ≤ f ϕ(y) |Jϕ(y)| dy = g(y) dy ≤ g ψ(x) |Jψ(x)| dx V U V Z ZU −1 −1 −1 f (x) dx . f ϕ ϕ (x) Jϕ(ϕ (x)) Jϕ (x) dx = = V

V

Si (f ◦ ϕ) |Jϕ| no es integrable en U pero f ≥ 0 c.s. la fórmula (8.4) sigue siendo válida: la igualdad formal ∞ = ∞ significa que tampoco puede ser integrable f en V .

8.3. Cambios de variables usuales Los resultados que se presentan a continuación se utilizan, en la mayoría de los casos, para transformar integrales en determinados conjuntos en integrales en intervalos de Rd , a las que es fácilmente aplicable el teorema de Fubini. 8.3.1. Cambios de referencia afín Teorema 8.19. Sean b = (b1 , b2 , . . . , bn ) ∈ Rn , y n vectores v i = (ai1 , ai2 , . . . , ain ), 1 ≤ i ≤ n, linealmente independientes en Rn . La aplicación g: Rn → Rn definida por y = g(x) = g(x1 , x2 , . . . , xn ) = b +

n X

xi v i

i=1

es un difeomorfismo cuyo jacobiano, igual en todos los puntos, es Jg(x) = det aij 1≤i,j≤n .

Observaciones 8.20. I)

LATV

La imagen del cubo unidad C = [0, 1] × . . . × [0, 1] por la aplicación g (un paralelogramo en R2 , un paralelepípedo en R3 , etc.) tiene medida det aij 1≤i,j≤n . Nótese que no estamos sino afirmando las fórmulas que se establecen como definición en Geometría Analítica. Departamento de Álgebra, Análisis Matemático, Geometría y Topología

8.3. Cambios de variables usuales II )

113

Cuando g conserva la distancia euclídea, esto es, kg(x) − g(y)k = kx − yk para todos x, y ∈ Rn , la matriz aij 1≤i,j≤n tiene determinante igual a ±1, pues su inversa es su traspuesta (las transformaciones afines de este tipo reciben el nombre de isometrías o movimientos y son composiciones de traslaciones, giros y simetrías). Entonces en cada punto x ∈ Rn se tiene que |Jg(x)| = 1, y el teorema del cambio de variables asegura que m(E) = m g(E) para cada compacto medible E ⊂ Rn . Así, por ejemplo, las clásicas fórmulas para las áreas de las superficies poligonales son válidas independientemente de la posición en que se encuentren ubicadas (ver ejercicio 8.3.I).

8.3.2. Coordenadas polares Teorema 8.21. Sea α ∈ R y consideremos los abiertos Uα = (0, ∞) × (α, α + 2π) , Vα = R2 \ t cos(α), t sen(α) : t ≥ 0 . La aplicación g: Uα → Vα definida por

(x, y) = g(r, θ) = r cos(θ), r sen(θ) ,

es un difeomorfismo; además,

|Jg(r, θ)| = r . Observación 8.22. La coordenada r no es otra cosa que la norma euclídea de (x, y) = g(r, θ), así que este cambio puede resultar útil en el cálculo de integrales en círculos, ya que g (0, R) × (α, α + 2π) y B(0, R)

difieren en un conjunto de medida nula (un segmento); o de integrales en sectores circulares, que son imagen de conjuntos del tipo (0, R) × (β, γ). Lo mismo se puede decir respecto del cálculo de integrales de funciones que dependan únicamente de la norma euclídea. Componiendo con traslaciones, esto es, considerando transformaciones del tipo x = (x, y) = g(r, θ) = a1 + r cos(θ), a2 + r sen(θ) , se parametrizan, excepto subconjuntos de medida nula (segmentos), discos centrados en un punto a = (a1 , a2 ) ∈ R2 ; en este caso se verifica que r = kx − ak (ver figura 8.1). Y

x

θ

r

a

X

(0,0)

Figura 8.1:

R

x = (x, y) = (a1 + r cos(θ), a2 + r sen(θ)).

8.3.3. Coordenadas cilíndricas Teorema 8.23. Sean α ∈ R y Uα , Vα los abiertos de R3 Uα = (0, ∞) × (α, α + 2π) × R , Vα = R3 \ t cos(α), t sen(α), z : z ∈ R , t ≥ 0 . La aplicación g: Uα → Vα definida por

(x, y, z) = g(r, θ, w) = r cos(θ), r sen(θ), w ,

es un difeomorfismo; además,

|Jg(r, θ, w)| = r . U NIVERSIDAD DE VALLADOLID

114

Tema 8. Integración por cambio de variables

Observación 8.24. Este tipo de cambios transforma los intervalos (0, R) × (α, α + 2π) × (a, b) en cilindros (sólidos) con eje de simetría el eje OZ, cuya base tiene radio R y comprendidos entre los planos z = a y z = b, salvo una porción de un plano (que es de medida nula en R3 ). El teorema presentado es adecuado para aquellos conjuntos que presenten una simetría respecto al eje OZ (ver figura 8.2) pero, por supuesto, una permutación adecuada de las coordenadas permite tratar volúmenes de revolución respecto de los otros ejes, y lo mismo se puede decir, al componer con traslaciones, cuando la base de estos cilindros está desplazada del origen. Z

x

w

r θ

Y

X

Figura 8.2:

x = (x, y, z) = (r cos(θ), r sen(θ), w).

8.3.4. Coordenadas esféricas Cuando un punto x = (x, y, z) de R3 se determina por su distancia al origen r y dos ángulos θ, φ respecto a determinados subespacios lineales se obtienen las denominadas parametrizaciones esféricas. Presentamos seguidamente dos versiones. Teorema 8.25. I)

Sean α ∈ R y Uα , Vα los abiertos de R3 Uα

=

Vα

=

(0, ∞) × (α, α + 2π) × (0, π) , R3 \ t cos(α), t sen(α), z : z ∈ R , t ≥ 0 .

La aplicación g: Uα → Vα definida por

(x, y, z) = g(r, θ, φ) = r cos(θ) sen(φ), r sen(θ) sen(φ), r cos(φ) ,

es un difeomorfismo; además,

|Jg(r, θ, φ)| = r2 sen(φ) . II )

Sean α ∈ R y Uα , Vα los abiertos de R3 Uα

=

Vα

=

(0, ∞) × (α, α + 2π) × − π/2, π/2 , R3 \ t cos(α), t sen(α), z : z ∈ R, t ≥ 0 .

La aplicación g: Uα → Vα definida por

(x, y, z) = g(r, θ, φ) = r cos(θ) cos(φ), r sen(θ) cos(φ), r sen(φ) ,

es un difeomorfismo; además,

|Jg(r, θ, φ)| = r2 cos(φ) . Observación 8.26. Este tipo de cambios transforma intervalos del tipo (0, R) × (α, α + 2π) × (β, β + π) ,

( β = 0, −π/2 resp.)

en bolas de radio R (excepto una porción de plano), y los del tipo (0, R) × (α, α + 2π) × (β, γ) , LATV

0 < γ −β < π,

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

115

8.3. Cambios de variables usuales

en sectores esféricos (sólidos). De nuevo, al componer con traslaciones, por ejemplo, (x, y, z) = g(r, θ, φ) = a1 + r cos(θ) cos(φ), a2 + r sen(θ) cos(φ), a3 + r sen(φ) ,

se obtienen transformaciones que permiten parametrizar en intervalos bolas centradas en un punto a = (a1 , a2 , a3 ) ∈ R3 (en este caso r = k(x, y, z) − (a1 , a2 , a3 )k). En la figura 8.3 se ilustra la situación relativa al primero de los dos cambios citados. En este caso, para r y θ fijos, al variar el ángulo φ desde 0 hasta π se recorre un meridiano, desde el “polo norte” hasta el “polo sur”, de la esfera centrada en 0 y de radio r. Este cambio, que podríamos denominar estándar, es el usado habitualmente en los textos de Física e Ingeniería. De hecho los ángulos θ y φ se denominan azimutal y polar, respectivamente, nomenclatura heredada obviamente de la Astronomía. Z

x φ

r

θ

Y

X

Figura 8.3:

x = (x, y, z) = (r cos(θ) sen(φ), r sen(θ) sen(φ), r cos(φ)).

8.3.5. Coordenadas esféricas generalizadas Si dado un punto x ∈ R4 se describe su proyección en R3 mediante coordenadas esféricas (un radio y dos ángulos), sólo necesitamos un tercer ángulo para determinar el punto x. Luego, los puntos de R5 se pueden representar mediante sus proyecciones en R4 y un cuarto ángulo, y así sucesivamente. Esta idea se materializa de forma rigurosa como sigue: Teorema 8.27. Para n ≥ 2 se define la aplicación ϕn de Rn en Rn dada por (x1 , x2 , . . . , xn ) = ϕn (r, θ1 , θ2 , . . . , θn−1 ), siendo x1 x2 x3 x4 .. . xn−2 xn−1 xn

= = = =

r sen(θ1 ) sen(θ2 ) · · · sen(θn−1 ), r cos(θ1 ) sen(θ2 ) · · · sen(θn−1 ), r cos(θ2 ) sen(θ3 ) · · · sen(θn−1 ), r cos(θ3 ) sen(θ4 ) · · · sen(θn−1 ), .. .

= r cos(θn−3 ) sen(θn−2 ) sen(θn−1 ), = r cos(θn−2 ) sen(θn−1 ), = r cos(θn−1 ).

Entonces ϕn es un difeomorfismo de clase C ∞ entre el abierto (0, ∞) × (α, α + 2π) × (0, π) × · · · × (0, π)

n

y todo R excepto un semihiperplano (de medida nula en Rn ). Además Jϕn (r, θ1 , θ2 , . . . , θn−1 ) = rn−1 sen(θ2 ) sen2 (θ3 ) · · · senn−2 (θn−1 ) .

Observación 8.28. El interés de estos cambios de variable se dirige a los casos en que el conjunto donde se integra y/o la función a integrar son simétricos respecto al origen. Como en los cambios citados anteriormente, componiendo con traslaciones obtenemos cambios de coordenadas adecuados para problemas que presenten simetría respecto de otro punto. En particular, la medida de la bola n-dimensional de radio R es Z π Z 2π Z π Z π Z R Z senn−2 (θn−1 ) dθn−1 dθ1 sen(θ2 ) dθ2 sen2 (θ3 ) dθ3 · · · rn−1 dr 1= B(0,R)

0

U NIVERSIDAD DE VALLADOLID

0

0

0

0

116

Tema 8. Integración por cambio de variables

8.3.6. Transformación de símplices en cubos Consideremos un punto P0 ∈ Rn y vectores v i = (ai1 , ai2 , . . . , ain ), 1 ≤ i ≤ n, linealmente independientes en Rn , o si se prefiere, n + 1 puntos: P0 , P1 = P0 + v 1 , . . . , Pn = P0 + v n , de manera que no estén contenidos en ningún subespacio afín propio (tres puntos no alineados en R2 , cuatro puntos no coplanarios en R3 , etc.). El conjunto convexo más pequeño que contiene a los n + 1 puntos (la envolvente convexa del conjunto {P0 , P1 , . . . , Pn }) se denomina también símplice o simplex de vértices P0 , P1 , . . . , Pn . Este conjunto viene dado por o n n P ti = 1 , ti ≥ 0 para todo i S = t0 P0 + t1 P1 + . . . + tn Pn ∈ Rn : =

n

i=0

P0 + λ1 v 1 + . . . + λn v n ∈ Rn :

n P

i=1

λi ≤ 1 , λi ≥ 0 para todo i

o

((t0 , t1 , . . . , tn ) son las denominadas coordenadas baricéntricas). Los símplices en R2 son los triángulos, en R3 los tetraedros, etc. Es evidente que mediante una transformación afín, descritas en el teorema 8.19, todo símplice se puede obtener a partir del símplice estándar, esto es, el de vértices: P0 = (0, 0, 0, . . . , 0) , P1 = (1, 0, 0, . . . , 0) , P2 = (0, 1, 0, . . . , 0) , . . . , Pn = (0, 0, 0, . . . , 1) , es decir el conjunto n P xi ≤ 1 , xi ≥ 0 para todo i Tn = (x1 , x2 , . . . , xn ) ∈ Rn : i=1

que es cuadrable (su frontera es unión de n + 1 símplices en subespacios de dimensión n − 1), así que a todos los efectos de integración podemos considerar indistintamente Tn o cualquier subconjunto comprendido entre Tn su interior Θn . Teorema 8.29. Sean Θn e In los abiertos de R3 n P xi < 1 , xi > 0 para todo i Θn = (x1 , x2 , . . . , xn ) ∈ Rn :

(símplice)

i=1

In

=

(0, 1)n = (x1 , x2 , . . . , xn ) ∈ Rn : 0 < xi < 1 para todo i}

(cubo) .

La aplicación g: In → Θn dada por (x1 , x2 , . . . , xn ) = g(u1 , u2 , . . . , un ), donde x1 + x2 + x3 + . . . + xn x2 + x3 + . . . + xn

= = .. .

u1 , u1 u2 ,

xn−1 + xn xn

= =

u1 u2 · · · un−1 , u1 u2 · · · un−1 un ,

x1 x2

= = .. .

u1 (1 − u2 ) , u1 u2 (1 − u3 ) ,

xn−1 xn

= =

u1 u2 · · · un−1 (1 − un ) , u1 u2 · · · un−1 un

es decir,

es un difeomorfismo; además, 2 un−1 . Jg(u1 , u2 , . . . , un ) = u1n−1 u2n−2 · · · un−2

Observación 8.30. Aunque no es difícil calcular la medida de los símplices Θn , es bastante laborioso. El cambio de variables indicado reduce considerablemente los cálculos pues Z Z m(Θn ) = 1= Jg(u1 , u2 , . . . , un ) du1 . . . dun =

Z

Θn 1 0

In

u1n−1 du1

Z

1

0

u2n−2 du2

···

Z

1

un−1 dun−1 0

Z

1

1 dun = 0

1 . n!

En general, componiendo con cambios de referencia afín, es inmediato concluir que el símplice determinado por n vectores v i = (ai1 , ai2 , . . . , ain ) (independientemente del punto P0 , origen de la referencia) tiene medida det aij 1≤i,j≤n . n! LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

117

Ejercicios

Ejercicios 8.1 Sean k, n ∈ N con k ≤ n, y fijados k índices 1 ≤ i1 < i2 < . . . < ik ≤ n, consideremos el subespacio “coordenado” L = (x1 , x2 , . . . , xn ) ∈ Rn : xij = 0 para todo j = 1, 2, . . . , k .

Consideremos también un subconjunto E medible en Rn y simétrico respecto a L, es decir, tal que x ∈ E si, y sólo si, Λx ∈ E, siendo Λ la aplicación lineal representada en la base estándar por la matriz diagonal cuyos elementos son λii = −1 si i = ij para algún j y λii = 1 en caso contrario. Probar que si f es una función integrable en E y tal que f (Λx) = −f (x) para cada x ∈ E, entonces la integral de f en E es nula (nótese que si k = n nos estamos refiriendo a conjuntos simétricos respecto del origen y a funciones “impares”, f (−x) = −f (x)). Como aplicación, calcular:

I)

2

La integral en R de la función f (x) = sen(x) e−x .

La integral de la función f (x, y) = x y 2 en la bola B(0, r). 2 2 III ) La integral de f (x, y, z) = x3 y 3 e−z(x +y ) en E = (x, y, z) ∈ R3 : |x| + |y| < 1 , 0 < z . II )

8.2 Estudiar la integrabilidad de la función f en el conjunto E en los casos siguientes: I)

II ) III ) IV )

E = (0, ∞) × (0, ∞) ,

f (x, y) =

E = (x, y) ∈ R2 : 0 < y < x ,

e−(x+y) . x+y 2

f (x, y) =

e−(x−y) . x2 − y 2

E = {(x, y) ∈ R2 : x ≥ 0 , y ≥ 0 , x + y ≤ 2} ,

f (x, y) = e

E = {(x, y) ∈ R2 : x > 0 , y > 0 , x + y < a} , a > 0,

(y−x)/(y+x)

f (x, y) = p

8.3

. 3y

1 + (x + y)3

.

I)

Mediante traslaciones y giros, deducir que el área de un triángulo es la mitad del producto de la longitud de uno de sus lados por la altura trazada desde el vértice opuesto a él, independientemente de la posición que ocupe en el plano R2 .

II )

Sean T el triángulo de vértices (0, 0), (1, 0) y (1, 1), y ϕ la transformación de R2 en R2 dada por ϕ(x, y) = (x − 2 y, 2 x + y) . Determinar el área del conjunto ϕ(T ).

8.4 En cada una de las siguientes situaciones estudiar la integrabilidad de la función f en el conjunto D: p sen x2 + y 2 . I ) D = B(0, 1) \ {0} , f (x, y) = x2 + y 2 1 a , a ∈ R . II ) D = B(0, 1) \ {0} , f (x, y) = 2 x + y2 III ) D = B(0, 1) \ {0} , f (x, y) = log(x2 + y 2 ) log 1 − (x2 + y 2 ) . IV )

V)

VI ) VII ) VIII)

D = B(0, 2) ,

f (x, y) = p

D = R2 , f (x, y) =

1

4 − x2 − y 2

1 p p2 + x 2 + y 2

.

(p > 0).

D = (x, y) ∈ R2 : x > 0 , y > 0 , x2 + y 2 < 9 ,

(x2 − y 2 ) x − 2 x y 2 . x2 + y 2 1 f (x, y) = 2 . (x + y 2 )3/2

f (x, y) =

D = {(x, y) ∈ R2 : x ≤ y , x + y ≥ 1 , x2 + y 2 ≤ 1} ,

D = {(x, y) ∈ R2 : x ≥ 0 , x2 + y 2 ≤ 2 y , x2 + y 2 ≤ 1} ,

U NIVERSIDAD DE VALLADOLID

f (x, y) = log(x2 + y 2 ) .

118

Tema 8. Integración por cambio de variables 2

2

8.5 Demostrar que la función f (x, y) = e−(x +y ) es integrable en R2 y calcular su integral. Deducir de lo anterior que Z ∞ √ 2 e−x dx = π . −∞

8.6 Demostrar que la función f es integrable en el conjunto D y calcular su integral en los siguientes casos: 1 . I ) D = (x, y) ∈ R2 : x2 + y 2 < 2 R x , con R > 0 ; f (x, y) = p 2 4 R − x2 − y 2 II )

D es el conjunto de puntos del primer cuadrante interiores a la curva (lemniscata) de a ecuación implícita (x2 + y 2 )2 = a2 (x2 − y 2 ) , a > 0; f (x, y) = p . a2 − x 2 − y 2

8.7 Sea D = (x, y) ∈ R2 : y ≥ 0 , x2 + y 2 ≤ 1 . Calcular Z (x + y)2 p dx dy . 1 + x2 + y 2 D 8.8 Hallar el valor de

Z p D

donde D es el conjunto

2 a x − x2 − y 2 dx dy,

D = {(x, y) ∈ R2 : x2 + y 2 − 2 a x ≤ 0} . R 8.9 Calcular D (x2 +y 2 ) dx dy , donde D es la porción del recinto interior a la curva (lemniscata) dada en coordenadas polares por ρ2 = a2 cos(2 θ), contenido en el semiplano {x ≥ 0}.

Nota: Parametrizar una curva plana en coordenadas polares consiste en dar para cada ángulo θ de un intervalo I un valor ρ = ϕ(θ) ≥ 0 (un módulo o distancia al origen), de manera que los puntos de la curva son precisamente aquellos de la forma (x, y) = γ(θ) = ϕ(θ) cos(θ), ϕ(θ) sen(θ) , θ ∈ I ; nótese que kγ(θ)k = ϕ(θ) (consultar, p.e., el texto [23] para un estudio más pormenorizado).

8.10 Calcular el área del recinto plano limitado por la curva parametrizada en coordenadas polares por ρ = sen(2 θ). 8.11 Sea S el recinto plano limitado por la curva (cardioide) parametrizada en coordenadas polares por ρ = 1 + cos(θ). I)

Calcular el área de S. Z II ) Calcular (x + y) dx dy . S

8.12 Sea a > 1. Calcular la integral de f (x, y) = x y en los siguientes conjuntos: I ) K = (x, y) ∈ R2 : x/a ≤ y ≤ x , 1/x ≤ y ≤ a/x . II ) K = (x, y) ∈ R2 : x2 ≤ y ≤ a x2 , y 2 ≤ x ≤ a y 2 .

8.13 Sea S el recinto plano situado en el primer cuadrante y limitado por las curvas de ecuaciones y − x = 0, y 2 − x2 = 1, x y = a, x y = b, donde 0 < a < b. Utilizando un cambio de variable que transforme S en un rectángulo, calcular Z x y 2 y 2 − x2 (x + y 2 ) dx dy . S

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

119

Ejercicios

8.14 Sea k > 0. Se consideran los abiertos U = (u, v) ∈ R2 : v > 0 , u > 0 , 0 < u < k v , V = (0, ∞) × (0, k), y la aplicación ϕ: U → V dada por ϕ(u, v) = x(u, v), y(u, v) = u v, u/v . Probar que ϕ es un difeomorfismo, deducir que la función u3 cos u/v f (u, v) = 3/2 du dv 2 v u2 v 2 + u /v 2 es integrable en U calcular su integral.

8.15 Sean a, b > 1. Calcular el área del conjunto n bo 1 K = (x, y) ∈ R2 : x2 ≤ y ≤ a x2 , ≤ y ≤ . x x 8.16 Calcular

Z

(x + y) dx dy D

siendo D el conjunto limitado, en el primer cuadrante, por las curvas de ecuaciones xy = 4,

xy = 2,

y = x − 3,

y = x + 3.

8.17 Calcular la integral de la función f en el conjunto K en las situaciones siguientes: p I ) K = (x, y, z) ∈ R3 : x ≥ 0 , y ≥ 0 , x2 + y 2 ≤ 4 , 0 ≤ z ≤ 2 − x2 + y 2 , f (x, y, z) = |z x − z y| . p p x2 + y 2 ≤ z ≤ 3 , f (x, y, z) = x2 + y 2 + z 2 . II ) K = (x, y, z) ∈ R3 : III )

K es el conjunto limitado por el plano z = 0 y las superficies de ecuaciones x2 + y 2 = 1, x2 + y 2 = 4, z = 6 − x2 − y 2 ; f (x, y, z) = ez .

8.18 Dado r > 0, considérense los conjuntos de revolución siguientes: 1. Una bola B de radio r. 2. Un cilindro sólido C con base circular de radio r y de igual volumen que la bola B. 3. Un cono sólido D con base circular de radio r y de igual volumen que B y C. Calcular el momento de inercia de los tres sólidos respecto de su eje de simetría. 8.19 Hallar el volumen de los subconjuntos de R3 dados por las siguientes relaciones (en las que a, b, c y d son constantes positivas): I) II ) III ) IV ) V) VI ) VII )

a2 . 4 x 2 + y 2 + z 2 ≤ a2 , x 2 + y 2 ≤ a y . y2 z2 z x2 y2 x2 + + ≤ 1, 0 ≤ ≤ + . a2 b2 c2 c a2 b2 y2 x2 z x2 + 2 < 1, + < 1. z > 0, 2 a b a2 c y2 x2 y2 x2 + 2 < 1, 0 < z < 2 + 2 . a2 b c d x2 y2 z2 x2 y2 z2 + + < 1 , z > 0 , + < . a2 b2 c2 a2 b2 c2 y2 z x2 + 2 + = 1, z > 0. 2 a b c x 2 + y 2 + z 2 ≤ a2 ,

x2 + y 2 ≥

8.20 Sean a, b, c > 0. Se considera el subconjunto A de los puntos (x, y, z) ∈ R3 que satisfacen las condiciones y2 z2 x2 y z2 x2 + + ≤ 1 , − + 2 ≤ 0. a2 b2 c2 a2 b c Calcular la integral en A de la función f (x, y, z) = y . U NIVERSIDAD DE VALLADOLID

120

Tema 8. Integración por cambio de variables

8.21 Mediante un cambio similar a las coordenadas cilíndricas calcular Z x2 y 2 z dx dy dz , K

siendo K el sólido limitado por el cono de ecuación x2 + y 2 = x z, y los planos de ecuaciones z = 0, z = c, donde c > 0. 8.22 Sean a, b números reales, con 0 < a < b, y K = (x, y, z) ∈ R3 : a2 ≤ x2 + y 2 + z 2 ≤ b2 . Calcular la integral en K de la función 1

f (x, y, z) =

x2 + y 2 + z 2

3/2 .

8.23 Se considera el conjunto C = (x, y, z) ∈ R3 : z > 1 , x2 + y 2 < 1 . Estudiar, en función de los parámetros reales α y β, la integrabilidad en C de la función α z − x2 − y 2 . f (x, y, z) = 1 + zβ 8.24 Sea V = (x, y, z) ∈ R3 : x2 + y 2 + z 2 > 1 . I)

Estudiar, en función del número real α, la integrabilidad en V de la función f (x, y, z) =

II )

1 x2

+ y2 + z2

Demuéstrese que es integrable en V la función 2

g(x, y, z) =

α .

2

cos(x) e−(x +y +z p x2 + y 2 + z 2

2

)

.

8.25 Sea V el abierto de R3 contenido en el primer octante (0, ∞) × (0, ∞) × (0, ∞) , interior al cilindro de ecuación x2 + y 2 − a x = 0 y al elipsoide de ecuación b2 (x2 + y 2 ) + a2 z 2 = a2 b2 , donde a y b son constantes reales positivas. Demostrar que la función f (x, y, z) = es integrable en V y calcular su integral.

1 a2 − x 2 − y 2

8.26 Si A es el subconjunto de R3 dado por A = (x, y, z) ∈ R3 : x > 0, y > 0, z > 0, 1 < x2 + y 2 + z 2 < 2 z 2 ,

demostrar que la función

f (x, y, z) = es integrable en A y calcular su integral.

1

1+

x2

+ y2 + z2

3

8.27 Sea a > 0. Se considera el conjunto T = (x, y) ∈ R2 : x ≥ 0 , y ≥ 0 , x + y ≤ a . Probar que y la función f (x, y) = e /(x+y) es integrable en T y calcular su integral. 8.28 Sea T = (x, y, z) ∈ R3 : x ≥ 0 , y ≥ 0 , z ≥ 0 , x + y + z ≤ 1 . Calcular la integral en T de las siguientes funciones: I)

f (x, y, z) = x y z(1 − x − y − z) dx dy dz . 1 II ) g(x, y, z) = . (1 + x + y + z)3

8.29 Sea K = (x, y, z) ∈ R3 : x ≥ 0 , y ≤ 0 , z ≥ 0 , 4 x − 2 y + z ≤ 2 . Calcular la integral en K de la función f (x, y, z) = x y z (2 − 4 x + 2 y − z) . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

121

Ejercicios

8.30 Sea a > 0. Calcúlese la integral Z

D

dx dy dz , (x + y + z)2 + a2

3

siendo D el subconjunto de R

D = {(x, y, z) ∈ R3 : x > 0 , y > 0 , z > 0 , x + y + z < a} . 8.31 Se considera el subconjunto de R3 M = (x, y, z) ∈ R3 : 0 < x , 0 < y < 1 , 0 < z , x + z < 1 . Calcúlese el volumen de g(M ), donde

g(x, y, z) = e2z + e2y , e2x − e2z , x − y .

8.32 Consideremos el conjunto V de R3 dado por n o 1 1 1 1 1 V = (x, y, z) ∈ R3 : x > 0 , y > 0 , z > 0 , 2 + 2 + 2 < 4 , 2 + 2 > 1 . x y z x z

Demostrar que la función

f (x, y, z) =

x2

1 y2 z2

es integrable en V y calcular su integral. 8.33 Sean a > 0 y V = (x, y, z) ∈ R3 : x > 0 , y > 0 , z > 0 , 1/x + 1/y + 1/z < a2 . Demostrar que la función 1 f (x, y, z) = p 3 x y3 z3 es integrable en V y calcular su integral.

8.34 Demostrar que la función f (x, y, z) = x3 y 3 z 3 es integrable en el abierto V = (x, y, z) ∈ R3 : x > 0 , y > 0 , z > 0 , x2 y 2 + x2 z 2 + y 2 z 2 < 1

y calcular su integral.

8.35 Sea K = (x, y, z) ∈ R3 : x ≤ y 2 ≤ 2 x , y ≤ z 2 ≤ 3 y , z ≤ x2 ≤ 4 z . Probar que K es compacto y calcular Z x y z dx dy dz . K

8.36 Dado el conjunto D = {(x, y, z) ∈ R3 : a y 2 ≤ z ≤ b y 2 , α x ≤ z ≤ β x , z ≤ h , y > 0} ,

con 0 < a < b, 0 < α < β y h > 0, calcular Z

x2 dx dy dz . D

8.37 Sean V = (0, ∞) × (0, ∞) × (0, ∞) y p, q, r números reales positivos con 1/p + 1/q + 1/r < 1 . Demostrar que es integrable en V la función f (x, y, z) =

1 1 + xp + y q + z r

(el cálculo de la integral, mediante las funciones eulerianas, se propone en el ejercicio 9.19). Sugerencia: Realizar primero el cambio de variables entre el abierto V y si mismo definido por

xp = u2 , y q = v 2 , z r = w 2 .

U NIVERSIDAD DE VALLADOLID

122

Tema 8. Integración por cambio de variables

8.38 Sea V = función

(x, y, z) ∈ R3 : x > 0 , y > 0 , 1/x2 + 1/y 2 < 1 , 0 < z < 1 . Demostrar que la z . f (x, y, z) = x y (x2 + y 2 )

es integrable en V y calcular su integral. 8.39 Consideremos el subconjunto de R7 V = (x1 , x2 , . . . , x7 ) ∈ R7 : xi > 0 para todo i , x12 + x22 < 4 , x3 + x4 + x5 < 1 , x62 + x72 < 1 .

Calcular la integral en V de la función

f (x1 , x2 , . . . , x7 ) =

x1 x2 (x3 + x4 + x5 )2 p . x62 + x72

8.40 Dado n ∈ N se consideran los abiertos de Rn+1 n o n X xi < 1 . V = (0, ∞)n+1 , U = (0, ∞) × Θn = (x0 , x1 , x2 , . . . , xn ) : xi > 0 para todo i , i=1

I)

Comprobar que la aplicación (x0 , x1 , x2 , . . . , xn ) = ϕ(y0 , y1 , y2 , . . . , yn ) definida por x 0 = y0 +

n X

yi =

i=1

y0 = x 0 − x 0

n X

yi ;

n X

xi ;

xi =

i=0

yi , x0

i = 1, 2, . . . , n

es decir, yi = x 0 x i ,

i = 1, 2, . . . , n .

i=1

es un difeomorfismo de V sobre U . II )

Sean a0 , a1 , a2 , . . . , an números positivos. Integrando en V la función f (y0 , y1 , y2 , . . . , yn ) = e−(a0 y0 +a1 y1 +...+an yn ) deducir que

Z

dx1 dx2 . . . dxn Θn

a0 + (a1 − a0 )x1 + . . . + (an − a0 )xn

n+1 =

1 . n! a0 a1 a2 · · · an

Tema 9

Integrales paramétricas La aparición, históricamente hablando, de la materia que abordamos ahora es casi tan antigua como las mismas nociones de derivación e integración, y se puede datar en la denominada regla integral de Leibniz: Z b Z b ∂F d (x, y) dy . (9.1) F (x, y) dy = dx a a ∂x En la expresión anterior, atendiendo al papel que juegan en la integral, se distinguen claramente dos tipos de variables: una respecto de la que se integra, la ‘ y ’, quedando la otra, ‘ x ’, como un parámetro libre, teniendo de hecho una ecuación funcional que describe la derivada Rb de la función f (x) = a F (x, y) dy como una nueva integral. Esta regla de derivación y generalizaciones más sofisticadas, como la Fórmula de Expansión de Euler o la Ecuación del Transporte de Reynolds, se han venido usando en la Física Matemática bajo el supuesto de que las magnitudes físicas son tan regulares como sea necesario. Asimismo, este tipo de parámetros libres aparecen en las transformadas integrales, herramientas muy útiles y de uso frecuente tanto en el aspecto teórico como en el aplicado. Lo que nos preocupa es establecer condiciones bajo las cuales sea lícito intercambiar el orden de la derivada con la integral, como en la fórmula (9.1). Más general, consideremos una función definida para los x en un conjunto A ⊂ Rm de la forma Z f (x) = F (x, y) dy , (9.2) E

p

donde E es un subconjunto medible de R . Las integrales que aparecen en (9.2) se denominan genéricamente integrales dependientes de parámetros o integrales paramétricas. Nos interesa establecer cuando es lícito escribir el límite de las integrales como la integral del límite. La clave está en que todo límite se puede escribir en forma secuencial, de manera que si {xn }∞ n=1 converge hacia x0 , entonces Z Z Z l´ım f (x) = l´ım F (x, y) dy = l´ım F (xn , y) dy = l´ım fn (y) dy . x→x0

x→x0

E

n→∞

E

n→∞

E

El último límite evoca, sin duda, los teoremas de Levi y Lebesgue.

9.1. Continuidad y derivación de integrales paramétricas Teorema 9.1 (de continuidad de integrales pareamétricas). Sean A un subconjunto de Rm , E un subconjunto medible de Rp , y F (x, y) una función real definida en A × E ⊂ Rm+p . Sea x0 un punto de A, y supongamos que: I ) Para cada x ∈ A la función Fx , definida por Fx (y) = F (x, y), es integrable en E. II )

III )

Para casi todo y ∈ E la función Fy , definida por Fy (x) = F (x, y), es continua en x0 .

Existen un entorno V de x0 y una función integrable g : E → R tales que |F (x, y)| ≤ g(y)

para todo x ∈ V ∩ A y casi todo y ∈ E .

Entonces la función f , definida de A en R por Z F (x, y) dy, f (x) = E

es continua en x0 .

123

124

Tema 9. Integrales paramétricas

Observación 9.2. Como ya se avanzó en la introducción, en el teorema anterior la clave está en el teorema de la convergencia dominada y la caracterización secuencial del límite, de manera que este resultado se puede generalizar, palabra por palabra, al caso de que A sea un espacio métrico, pues en todos ellos las nociones de continuidad y “continuidad secuencial” son equivalentes. Asimismo, el conjunto medible E y la correspondiente integral en él se pueden sustituir por cualquier integración en la que se satisfaga el teorema de la convergencia dominada; pues bien, resulta que para toda medida positiva (ver definición 7.29) la correspondiente integración “en el sentido de Lebesgue” verifica tal propiedad. Corolario 9.3. Sean A un subconjunto de Rm , E un subconjunto de Rp , y F (x, y) una función real definida en A × E ⊂ Rm+p . Supongamos que: I)

II ) III)

Para cada x ∈ A la función Fx , definida por Fx (y) = F (x, y), es integrable en E.

Para casi todo y ∈ E la función Fy , definida por Fy (x) = F (x, y), es continua en A.

Existe una función integrable g : E → R tal que

para todo x ∈ A y casi todo y ∈ E. R Entonces la función f , definida de A en R por f (x) = E F (x, y) dy, es continua en A. |F (x, y)| ≤ g(y)

Teorema 9.4 (de derivación de integrales paramétricas). Sean A un abierto de Rm , E ⊂ Rp medible, y F una función real definida en A × E ⊂ Rm+p . Supongamos que: I)

II )

III)

Para cada x ∈ A la función Fx , definida por Fx (y) = F (x, y), es integrable en E.

Para casi todo y ∈ E la función Fy , definida por Fy (x) = F (x, y), admite derivada parcial continua respecto de xj en A. Para cada x ∈ A la función y 7→

∂F (x, y) es medible en E y existe una función gj ∂xj

integrable en E tal que Dj Fy (x) = ∂F (x, y) ≤ gj (y) ∂xj

para todo x ∈ A y casi todo y ∈ E .

R Entonces la función f , definida en A por f (x) = E F (x, y) dy, admite derivada parcial continua respecto de xj en A, y se tiene que Z Z ∂F ∂ (x, y) dy, x ∈ A. F (x, y) dy = Dj f (x) = ∂xj E ∂x j E Corolario 9.5. Si en el teorema anterior las condiciones ii) y iii) se verifican para cada índice j = 1, 2, . . . , m, entonces f es de clase C 1 en A y se tiene que Z ∂f ∂F (x) = (x, y) dy, j = 1, 2, . . . , m . ∂xj E ∂xj Observaciones 9.6. I)

El mismo comentario realizado en la observación 9.2, sobre el espacio E donde se integra, es válido en el caso del teorema de derivación; obviamente, lo que no es posible es cambiar el abierto A por cualquier otro subconjunto de un espacio métrico.

II )

El teorema de derivación puede ser aplicado a las derivadas sucesivas cuando la función F (x, y) es suficientemente regular y así, por ejemplo, si se verifican las condiciones pertinentes, Z ∂ k1 +k2 +...+km f ∂ k1 +k2 +...+km F (x) = (x, y) dy . km k2 k1 ∂xk11 ∂xk22 . . . ∂xkmm E ∂x1 ∂x2 . . . ∂xm

III)

En la práctica puede suceder que, aún cuando la función f esté definida por la integral paramétrica (9.2) en todos los puntos x del abierto A y se verifiquen las hipótesis I) y II ) del teorema 9.4, sea imposible satisfacer la condición III ) del mismo. No obstante, la

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

9.1. Continuidad y derivación de integrales paramétricas

125

derivabilidad es una cuestión local, de manera que el abierto A del enunciado puede ser sustituido por un entorno adecuado del punto x0 donde se quiera estudiar tal cuestión. Por ejemplo: si F (x, y) = e−xy , x ∈ A = (0, 1), y ∈ E = (0, ∞). Resulta que ∂F (x, y) = −y e−xy ∂x que es integrable para todo x > 0, pero la mínima función g definida en E que satisface ∂F (x, y) = y e−xy ≤ g(y) para todos x ∈ A, y ∈ E ∂x es la función g(y) = y, no integrable en E. No obstante, considerando 0 < δ < 1 y el abierto Vδ = (δ, 1) ⊂ A, se tiene que y e−xy ≤ y e−δy = g(y)

para todos x ∈ Vδ , y ∈ E , R∞ lo que garantiza la derivabilidad de f (x) = 0 e−xy dy en el intervalo Vδ , como esto es R∞ válido para cada δ > 0 se concluye la derivabilidad de f en A y que f ′ (x) = 0 −y e−xy dy .

Cabría preguntarse si, al igual que hemos contemplado la continuidad y derivabilidad de integrales paramétricas, ¿sería pertinente contemplar la integrabilidad de tales objetos? La respuesta es obvia, basta con plantear la integral para reconocer algo familiar: Z Z Z f (x) dx = F (x, y) dy dx . A

A

E

9.1.1. Integrales flechadas dependientes de parámetros En los teoremas 9.1 y 9.4 la clave para poder intercambiar integrales y límites (de las funciones o de los cocientes incrementales) es la acotación uniforme por funciones integrables con vistas a la aplicación del teorema de la convergencia dominada. En la concepción de la integral de Riemann las sucesiones de funciones escalonadas aproximan a las funciones uniformemente c.s., de manera que es lógico elucubrar que esta condición más fuerte deba aparecer en las hipótesis de enunciados similares a los citados pero para funciones integrables en el sentido de Riemann. También, aún cuando se trate con funciones integrables en el sentido de Lebesgue, por ejemplo, en cada intervalo [a, β] con β < b, puede existir el límite Z →b Z β f (y) dy = l´ım f (y) dy (9.3) β→b−

a

a

y no ser f integrable en [a, b), como sucede con Z β Z →∞ sen(y) sen(y) dy = l´ım dy . β→∞ 0 y y 0

Los límites de integrales como el de (9.3) se denominan integrales flechadas e incluyen, por supuesto, a las integrales impropias de Riemann convergentes, pero no absolutamente convergentes. Nos ocupamos ahora de los problemas de continuidad y derivabilidad de integrales flechadas paramétricas. Aunque todos los enunciados se establezcan para intervalos abiertos por la derecha, obviamente no hay ninguna dificultad en adaptarlos a intervalos abiertos por la izquierda o intervalos abiertos, acotados o no. En realidad los resultados sobre continuidad y derivabilidad que vamos a exponer son variantes de los teoremas 4.16 y 4.32 expuestos a propósito de sucesiones de funciones uniformemente convergentes, de ahí que empecemos dando la noción de convergencia uniforme para integrales flechadas. Definición 9.7. Sean Λ un conjunto, [a, b) ⊂ R y para cada λ ∈ Λ una función Fλ : [a, b) → R integrable en cada intervalo [a, β], a < β < b. Se dice que la familia de integrales flechadas R →b Fλ (x) dx es uniformemente convergente en Λ si para cada λ ∈ Λ la correspondiente integral a flechada converge y cualquiera que sea ε > 0 existe β0 ∈ (a, b) de manera que Z γ Z →b Z β Fλ (y) dy < ε para todos β ∈ (β0 , b) , λ ∈ Λ . Fλ (y) dy = l´ım+ Fλ (y) dy − a

a

U NIVERSIDAD DE VALLADOLID

γ→b

β

126

Tema 9. Integrales paramétricas

Teorema 9.8 (de continuidad para integrales flechadas). Sean A un subconjunto de Rm , [a, b) un intervalo de R y para cada x ∈ A una función Fx : [a, b) → R tal que Fx ∈ L 1 ([a, β]) para cada a < β < b. Sea x0 un punto de A, y supongamos que: Rβ I ) Para cada β ∈ (a, b) la aplicación x ∈ A 7→ a Fx (y) dy es continua en x0 . R →b II ) Existe un entorno V de x0 tal que la familia de integrales flechadas a Fx (y) dy es uniformemente convergente en V ∩ A. R →b Entonces la función f , definida de A en R por f (x) = a Fx (y) dy es continua en x0 .

Teorema 9.9 (de derivabilidad para integrales flechadas). Sean A un abierto de Rm , [a, b) un intervalo de R y una función F : A × [a, b) → R tal que para cada x ∈ A se tiene que Fx ∈ L 1 ([a, β]) cualquiera que sea a < β < b. Se supone además que: Rβ I ) Para cada β ∈ (a, b) la aplicación x ∈ A 7→ a Fx (y) dy admite derivada parcial continua respecto de xj en A y su derivada es Z β Z β ∂F (x, y) dy . Fx (y) dy = Dj ∂x j a a R →b II ) Para cada x ∈ A la integral flechada a Fx (y) dy converge. Z →b ∂F (x, y) dy es uniformemente convergente en A. III) La familia de integrales flechadas ∂x j a R →b Entonces, la función definida en A por f (x) = a Fx (y) dy tiene derivada parcial continua respecto de xj en A y se tiene que Z β ∂f ∂F (x) = (x, y) dy . ∂xj ∂x j a

9.2. Integrales eulerianas Las denominadas, en honor a Euler, funciones eulerianas Gamma (Γ) y Beta (B) están definidas por integrales paramétricas, y al igual que las trigonométricas, de Bessel, integrales elípticas, etc., son trascendentes (no algebraicas), pero están perfectamente tabuladas, y resultan de gran utilidad en el estudio de numerosos problemas. Además, una gama bastante amplia de integrales se pueden expresar en función de ellas. Definición 9.10 (Función Gamma). Para cada t ∈ (0, ∞) se define Z ∞ e−x xt−1 dx. Γ(t) = 0

Propiedades 9.11. I) II )

Γ(t) está definida y es positiva para todo t > 0. Γ(t) es de clase C ∞ en (0, ∞) y además, para cada n ∈ N, Z ∞ (n) e−x xt−1 (log(x))n dx. Γ (t) = 0

III) IV )

Γ(t) = (t − 1) Γ(t − 1) para todo t > 1.

Γ(1) = 1 , Γ(n) = (n − 1)!, n ≥ 2 (ver figura 9.1). √ 1 (2n)! √ V ) Γ 1/2 = π, y Γ n + π, n ∈ N. = 2n 2 2 n! VI ) l´ım Γ(t) = +∞ y l´ım Γ(t) = +∞; más aún, + t→+∞

t→0

Γ(t + 1) √ = 1. (Fórmula de Stirling) e−t tt 2πt De esta relación, para m, p naturales, se deduce que l´ım

t→+∞

Γ(m + α) = 1, m→∞ mα Γ(m) l´ım

LATV

(m + p)! = 1, m→∞ m! mp l´ım

1 · 3 · · · (2m − 1) √ 1 m= √ . m→∞ 2 · 4 · · · 2m π l´ım

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

127

9.2. Integrales eulerianas VII)

Fórmula de multiplicación de Gauss: 1 m − 1 (m−1)/2 √ m Γ(m t) , m ∈ N . mmt Γ(t) Γ t + ···Γ t + = (2π) m m Como caso particular, para m = 2 se obtiene la denominada fórmula de duplicación de Legendre: √ 1 π Γ(t) Γ t + = 2t−1 Γ(2t). 2 2 24

6

2 1 1

2

3

4

5

Figura 9.1: La función Γ interpola al factorial.

Definición 9.12 (Función Beta). Para cada (u, v) ∈ (0, ∞) × (0, ∞) se define Z 1 xu−1 (1 − x)v−1 dx. B(u, v) = 0

Propiedades 9.13. I) II )

III ) IV )

B(u, v) está bien definida para todo (u, v) ∈ (0, ∞) × (0, ∞).

La función B es de clase C ∞ en (0, ∞) × (0, ∞), y para todos n, m ∈ N se tiene que Z 1 n m ∂ n+m B log(x) log(1 − x) xu−1 (1 − x)v−1 dx. (u, v) = n m ∂u ∂v 0

B(u, v) = B(v, u) para todo (u, v) ∈ (0, ∞) × (0, ∞).

Para cada (u, v) ∈ (0, ∞) × (0, ∞) se tiene que B(u, v) =

V)

VI )

Γ(u) Γ(v) . Γ(u + v)

Fórmula de los complementos: Para cada θ ∈ (0, 1), π π B(θ, 1 − θ) = , es decir, Γ(θ) Γ(1 − θ) = . sen(θπ) sen(θπ) Fórmula de duplicación: B(u, u) =

U NIVERSIDAD DE VALLADOLID

1 22u−1

B(u, 1/2) .

128

Tema 9. Integrales paramétricas

Las propiedades de las dos funciones anteriores permiten expresar una amplia gama de integrales en función de ellas realizando simples cambios de variable. En la tabla 9.1 se relacionan una serie de integrales que mediante cambios de variable se expresan en términos de las funciones eulerianas. Se indica la integral, su solución y el cambio de variable realizado, así como los valores de los parámetros para los que la función es integrable. Integral

Cambio de variable

{Parámetros admisibles} Z ∞ q + 1 p 1 e−ax xq dx = I Γ (q+1)/p p 0 pa p, a > 0, q > −1 Z a q ap+qr+1 p + 1 B ,q + 1 xp ar − xr dx = II r r 0 p, q > −1, a, r > 0 Z b (x − a)p (b − x)q dx = (b − a)p+q+1 B(p + 1, q + 1) III

a xp = y

x r = ar y

x = a + (b − a) y

a

IV

V

Z

p, q > −1 b

(x − a)p (b − x)q (b − a)p+q+1 B(p + 1, q + 1) dx = |x − c|p+q+2 |a − c|q+1 |b − c|p+1 a p, q > −1, c ∈ / [a, b]

Z

x=

a(b − c) + c(a − b)y (b − c) + (a − b)y

α+1

xα b( p −q) α + 1 α + 1 q dx = , q − B α+1 p p a xp + b 0 pa p n a, b, p > 0, α > −1, o ∞

b a xp

+b

=y

q > (α + 1)/p

VI

Z

π/2

0

VII

Z

senp (θ) cosq (θ) dθ =

p, q > −1 π/2

p

q

1 p + 1 q + 1 B , 2 2 2

cos (θ) sen (θ) dθ p+q +1 = 0 a cos2 (θ)+b sen2 (θ) 2 p, q > −1, a, b > 0

B

p + 1 q + 1 , 2 2 p+1 q+1 2a 2 b 2

sen2 (θ) = y

sen2 (θ) =

ay (a − b) y + b

Tabla 9.1: Integrales reducibles a las eulerianas.

9.3. Convolución de funciones. Aplicaciones Nos ocupamos ahora de una serie de resultados que, aunque en apariencia sorprendentes, son consecuencia más o menos directa de los teoremas de integración iterada, cambio de variables e integrales paramétricas. En lo que sigue, juega un papel importante la noción de soporte de una función, a lo que prestamos atención en primer lugar. De forma coloquial, aunque se consideren funciones definidas en todo el espacio (prolongándolas por 0 fuera de su dominio original), convendrá a menudo establecer qué puntos aportan realmente algo a la integral. Definición 9.14. Si g es una función definida en Rn , se dice que un abierto V de Rn es de anulación casi siempre de g si el conjunto {x ∈ V : g(x) 6= 0} es de medida nula. Si Θg es la unión de todos los abiertos de anulación c.s. de g, se llamará soporte esencial de g y se denotará por sop(g) , al complementario en Rn de Θg . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

9.3. Convolución de funciones. Aplicaciones

129

Observación 9.15. Si g es continua en todo Rn , el soporte esencial coincide con el soporte “topológico”, es decir, sop(g) = cl {x ∈ Rn : g(x) 6= 0} , razón por la que hemos denotado igual a ambos conjuntos. En general, si g es continua en el punto x0 y g(x0 ) 6= 0, entonces x0 ∈ sop(g); pero si g no es continua en x0 , puede suceder que x0 ∈ / sop(g) aunque g(x0 ) 6= 0. En otras palabras, para funciones no continuas el soporte esencial y el topológico no guardan ninguna relación: piénsese, por ejemplo, en la función χQ para la que cl {x ∈ R : χQ (x) 6= 0} = R, pero χQ es igual c.s. a la función idénticamente nula, luego su soporte esencial es el conjunto vacío. 9.3.1. Producto de convolución Definición 9.16. Sean f, g funciones medibles en Rn . Se define el producto de convolución, o simplemente la convolución, de f y g en un punto x ∈ Rn , denotado por (f ∗ g)(x) , como Z (f ∗ g)(x) = f (y) g(x − y) dy Rn

supuesta la existencia de dicha integral.

Proposición 9.17. Sean f, g, h funciones medibles en Rn . I)

Si existe (f ∗ g)(x), también existe (g ∗ f )(x); además (f ∗ g)(x) = (g ∗ f )(x) .

II )

Si existen (f ∗ g)(x) y (f ∗ h)(x), también existe f ∗ (g + h) (x) ; además f ∗ (g + h) (x) = (f ∗ g)(x) + (f ∗ h)(x) .

Notación: Si A, B son subconjuntos de Rn , y x0 ∈ Rn se denotan −A = {−x : x ∈ A} ;

x0 − A = {x0 − x : x ∈ A} ;

A + B = {x + y : x ∈ A , y ∈ B} .

Proposición 9.18. Sean f, g funciones medibles en Rn . I ) Si existe (f ∗ g)(x) y A = x − sop(f ) ∩ sop(g), entonces Z (f ∗ g)(x) = f (x − y) g(y) dy . A II )

Si f ∗ g está definida en todo Rn sop(f ∗ g) ⊆ sop(f )+sop(g) .

Hasta ahora no hemos dado condiciones suficientes para la existencia de la convolución de dos funciones. Lo que sigue va orientado en este sentido. Teorema 9.19. Si f es integrable en Rn y g es medible y acotada c.s. en Rn , entonces f ∗ g está definida en todo Rn y es uniformemente continua y acotada; concretamente Z |f | , para cada x ∈ Rn . |(f ∗ g)(x)| ≤ sup |g(y)| : y ∈ Rn Rn

Notación: Por C0 (Rn ) se denota al conjunto de funciones f continuas en Rn y que se anulan en el infinito, es decir, tales que l´ım f (x) = 0 . Estas funciones son uniformemente kxk→∞

continuas y acotadas en todo Rn . Proposición 9.20. Si f es integrable en Rn y g ∈ C0 (Rn ), entonces f ∗ g ∈ C0 (Rn ). El siguiente teorema es consecuencia de los de Fubini y Tonelli. Teorema 9.21. Sean f, g funciones integrables en Rn . Entonces: I) II )

f ∗ g está definida para casi todo x ∈ Rn .

f ∗ g (definida como se quiera en los puntos donde eventualmente no exista) es integrable en Rn .

U NIVERSIDAD DE VALLADOLID

130

Tema 9. Integrales paramétricas

Z Z Z Se verifica la igualdad f ∗g = f g. Rn Rn Rn Z Z Z IV ) Se verifica |f ∗ g| ≤ |f | |g| .

III)

Rn

Rn

Rn

Corolario 9.22. Si f, g, h son integrables en Rn , entonces (f ∗ g) ∗ h = f ∗ (g ∗ h)

casi siempre en Rn .

Definición 9.23. Sea V un abierto de Rn . Diremos que una función f medible en V es localmente integrable en V si para cada compacto K ⊂ V se tiene que f ∈ L 1 (K), es decir, si f es integrable en los compactos de V . Al conjunto de las funciones localmente integrables 1 en V lo denotaremos por Lloc (V ). Proposición 9.24. Sean f una función localmente integrable en Rn y g una función continua en Rn . Se supone que al menos una de ellas tiene soporte compacto. Entonces f ∗ g está definida en todo Rn . 9.3.2. Aproximaciones de la identidad. Regularización de funciones El estudio que abordamos ahora tiene especial interés en el problema de aproximación de funciones medibles por funciones regulares, además las técnicas de cálculo que aquí se presentan juegan un papel fundamental, tanto desde el punto de vista teórico (como en la teoría de distribuciones), como en el aplicado (p.e., en el filtrado de señales). Definición 9.25. Se llama aproximación de la identidad en Rn a toda sucesión {θk }∞ k=1 de funciones medibles en Rn verificando: I)

θk (x) ≥ 0 para todo x ∈ Rn

Para cada k ∈ N el conjunto sop(θk ) está contenido en una bola Bk centrada en 0 ∈ Rn y cuyo radio tiende a 0 cuando k tiende a ∞; en particular, l´ım m sop(θk ) = 0. k→∞ R R III) Para todo k ∈ N se tiene que Rn θk = sop(θ ) θk = 1. k II )

Es fácil construir aproximaciones de la identidad (basta elegir funciones escalonadas construidas adecuadamente); pero lo que es más interesante es la posibilidad de elegir estas funciones de clase C ∞ . A ello van dedicados los dos resultados siguientes. Lema 9.26. Se considera la función ψ definida en R por ( 1 2 e /(x −1) si |x| < 1, ψ(x) = 0 si |x| ≥ 1.

∞ Esta función es R no negativa y de clase C y, puesto que se anula fuera de [−1, 1], es integrable en R; sea a = R ψ > 0. Se define ϕ: R → R por ϕ = ψ/a y para n ∈ N se define θ: Rn → R por

θ(x1 , x2 , . . . , xn ) = ϕ(x1 ) ϕ(x2 ) · · · ϕ(xn ) .

Entonces la función θ es no negativa, de clase C ∞ e integrable en Rn con integral igual a 1. Corolario 9.27. Se considera la función θ definida en el lema anterior. Para cada k ∈ N se define θk (x) = k n θ(k x) , x ∈ Rn . n Entonces la sucesión {θk }∞ k=1 es una aproximación de la identidad en R compuesta por ∞ funciones de clase C .

Observación 9.28. Con la notación de los dos resultados precedentes. Notemos primero que θk (0) = k n θ(0) = k n ϕ(0) ϕ(0) · · · ϕ(0) = k n ϕ(0)n −→ ∞ . k→∞

Luego, si x 6= 0 existe un k0 ∈ N tal que θk (x) = 0 si k ≥ k0 y, en consecuencia, l´ım θk (x) = 0

(ver figura 9.2). LATV

k→∞

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

131

9.3. Convolución de funciones. Aplicaciones

Resumiendo: l´ım θk (x) =

0

si x 6= 0,

(9.4)

∞ si x = 0. Además, del teorema del cambio de variables, se deduce fácilmente que Z θk (x) dx = 1 para todo k . k→∞

(9.5)

Rn

4

Z

3

2

1

-2

0

-1

1

2

Y

X

θk , 1 ≤ k ≤ 5

θ2

Figura 9.2: Algunas funciones θk en R y R2 . n Teorema 9.29. Sea {θk }∞ k=1 una aproximación de la identidad en R . Si f es una función n localmente integrable en R y continua en 0 entonces Z f (0) = l´ım θk (x) f (−x) dx = l´ım θk ∗ f (0) . k→∞

k→∞

Rn

Observación 9.30. La denominada delta de Dirac en 0, que es el operador lineal definido por f 7−→ δ0 (f ) = f (0) , se define en muchos textos de Física, para representar la idea de impulso instantáneo y relajando el rigor matemático, a partir de las relaciones (9.4) y (9.5), como la “función” δ0 que tiene integral 1, que vale 0 en todos los puntos menos en 0, donde toma el valor ∞; esto es absurdo pues, con la misma relajación del rigor, podríamos establecer que Z Z Z 1= δ0 (x) dx = 2 δ0 (x) dx = 2 δ0 (x) dx = 2 . Rn

Rn

Rn

Lo que se ha obtenido muestra que la delta de Dirac, que es una de las llamadas distribuciones o funciones generalizadas, aunque no puede ser asociada a ninguna función, puede ser “aproximada” por funciones en el sentido ordinario. n Teorema 9.31. Sea {θk }∞ k=1 una aproximación de la identidad en R tal que todas las funcio∞ nes θk son de clase C .

I)

Si f es localmente integrable en Rn , entonces para k ∈ N está bien definida la función Z fk (x) = (f ∗ θk )(x) = f (y) θk (x − y) dy Rn

y es de clase C

II )

∞

n

en R .

Si además f es continua en Rn la sucesión {fk }∞ k=1 converge hacia f . De hecho, si K es converge uniformemente hacia f en K. un compacto de Rn , la sucesión {fk }∞ k=1

En el último teorema se ha establecido que toda función continua es límite uniforme en los compactos de funciones de clase C ∞ , pero todavía se puede mejorar: también es posible aproximar la derivadas. U NIVERSIDAD DE VALLADOLID

132

Tema 9. Integrales paramétricas

Lema 9.32. Sean f, g funciones de clase C 1 en Rn tales que sop(f ) o sop(g) es acotado (i.e. compacto). Entonces f ∗ g es de clase C 1 en Rn y para cada índice i = 1, 2, . . . , n se tiene que ∂(f ∗ g) ∂f ∂g = ∗g =f ∗ . ∂xi ∂xi ∂xi

Teorema 9.33. Sean f una función de clase C m en Rn y {θk }∞ k=1 una aproximación de la identidad en Rn por funciones de clase C ∞ . Entonces f ∗θk es de clase C ∞ en Rn para todo k ≥ 1; además, para cada familia de enteros no negativos j1 , j2 , . . . , jn con j1 +j2 +. . .+jn = α ≤ m o∞ n ∂ α (f ∗ θk ) converge uniformemente en los compactos la sucesión de funciones ∂xj11 ∂xj22 · · · ∂xjnn k=1 ∂αf de Rn hacia . j1 ∂x1 ∂xj22 · · · ∂xjnn Observación 9.34. A la vista de los resultados anteriores es fácil comprender porqué se llama también sucesión regularizante a cualquier aproximación de la identidad por funciones de clase C ∞ .

9.4. Transformadas integrales En el estudio de numerosos problemas de las Ciencias y la Técnica, aparecen transformaciones del siguiente tipo: a cada función f de un cierto espacio se le asigna una nueva función T f mediante la expresión Z T f (x) = K(x, y) f (y) dy, A

donde K es una función, denominada núcleo integral, y las variables x y y recorren ciertos subconjuntos en los espacios euclídeos apropiados. Estas aplicaciones f → T f reciben el nombre de transformadas integrales, y ejemplos de ellas son las transformaciones de Fourier, Laplace, Mellin, Hilbert, Hankel, Abel, etc.

Veremos la definición y propiedades fundamentales de dos de ellas, poniendo de relieve el papel que juegan las técnicas de integración (iterada, cambio de variables, integrales paramétricas) expuestas hasta el momento. 9.4.1. Transformación de Fourier Recordemos que para t ∈ R se define exp(i t) = eit := cos(t) + i sen(t) . Definición 9.35. Para cada función f ∈ L 1 (Rn ) se define su transformada de Fourier, denotada por fb o F(f ) , como la función fb: Rn → C dada por Z Z fb(ω) = fb(ω1 , ω2 , . . . ωn ) = e−i ω·x f (x) dx = e−i(ω1 x1 +ω2 x2 +...+ωn xn ) f (x1 , . . . , xn ) dx1 . . . dxn . Rn

Rn

Propiedades 9.36. Sean f y g funciones integrables en Rn . Se verifica: I)

La transformada de Fourier de f es una función acotada; concretamente, Z fb(ω) ≤ f (x) dx para cada ω ∈ Rn . Rn

II ) III)

fb ∈ C0 (Rn ) . En particular

l´ım fb(ω) = 0 (lema de Riemann-Lebesgue).

kωk→∞

La transformación de Fourier es lineal, es decir, si a, b ∈ C entonces F(a f + b g) = a F(f ) + b F(g) .

IV ) V)

LATV

Si λ ∈ R, λ > 0, y g(x) = f x/λ para cada x ∈ Rn , entonces gb(ω) = λn fb(λ ω) . Si g(x) = f (−x) para cada x ∈ Rn , entonces gb(ω) = fb(−ω) .

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

9.4. Transformadas integrales

VI ) VII) VIII) IX )

133

Si g(x) = f (x) para cada x ∈ Rn , entonces gb(ω) = fb(−ω) .

Si x0 ∈ Rn y g(x) = f (x − x0 ) para cada x ∈ Rn , entonces gb(ω) = fb(ω) e−i ω·x0 . Si ω 0 ∈ Rn y g(x) = f (x) ei ω0 ·x para cada x ∈ Rn , entonces gb(ω) = fb(ω − ω 0 ) .

Se supone que f es diferenciable en Rn y que Dj f es una función integrable y se anula b d en el infinito l´ım Dj f (x) = 0 . Entonces D j f (ω) = i ωj f (ω), es decir, kxk→∞

Z

e−i ω·x

Rn

∂f (x) dx = i ωj ∂xj

Z

e−i ω·x f (x) dx .

Rn

Teorema 9.37 (derivación de transformadas de Fourier). Si f ∈ L 1 (Rn ) y también la función x ∈ Rn 7→ kxk f (x) es integrable en Rn , entonces fb es diferenciable en Rn y para cada j = 1, 2, . . . , n se tiene que Dj fb(ω) = F(−i xj f (x)), es decir, Z ∂ fb (ω) = −i xj e−i(ω1 x1 +ω2 x2 +...+ωn xn ) f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn . ∂ωj n R Teorema 9.38 (transformada de Fourier de convoluciones). Sean f, g dos funciones integrables en Rn . Entonces F(f ∗ g) = F(f ) F(g) . 9.4.2. Transformación de Laplace Los objetos de la de la transformación de Laplace son funciones f definidas [0, ∞) e integrables en [0, b] para todo b > 0. Diremos que una de tales funciones es localmente integrable 1 en [0, ∞), y el espacio vectorial formado por ellas se denotará por Lloc (R+ ). Conviene observar que esta condición es algo más restrictiva que la de la integrabilidad local de f en el abierto (0, ∞), que no supone, por ejemplo, la integrabilidad en el compacto [0, 1] 6⊂ (0, ∞) . En térmi1 1 nos algebraicos Lloc (R+ ) es (isomorfo a) un subespacio lineal de Lloc (R), el de las funciones localmente integrables en R que se anulan c.s. en (−∞, 0), i.e, con soporte contenido en [0, ∞). Esta identificación se traduce en que en la práctica se hable, por ejemplo, de la transformada de la función coseno, entendiendo que en realidad nos referimos a su restricción a [0, ∞), o de modo más acorde con la notación que venimos usando, a la función definida en R por f (t) = cos(t)χ[0,∞) (t). 1 Definición 9.39. Sea f ∈ Lloc (R+ ) tal que existe un número real s de manera que la función −st f (t) e es integrable en [0, ∞). En ese caso, el ínfimo del conjunto n Df = s ∈ R : f (t) e−st dt es integrable en [0, ∞)

se denotará por σf (se conviene que es σf = −∞ si Df no está acotado inferiormente). Se dice entonces que f admite transformada de Laplace que es la función Lf definida en (σf , ∞) por Z ∞ f (t) e−st dt . (9.6) Lf (s) = 0

Observaciones 9.40. I)

El valor σf se denomina abscisa de convergencia de la transformada de Laplace. El nombre se comprende fácilmente si se piensa en que esto se formuló inicialmente en términos de la integral impropia de Riemann.

II )

La integral (9.6), dependiente del parámetro real s, se puede plantear para números complejos z. Casi todo lo que se expone a continuación se traslada, palabra por palabra a este caso más general, cambiando el dominio de definición, el intervalo Df , por un semiplano: {z ∈ C : s = Re(z) > σf } (nótese que |e−zt | = e− Re(z)t ). Aunque la potencia de la teoría de funciones de variable compleja proporciona herramientas más fructíferas que las que se presentan aquí, obviamente su estudio corresponde a un curso de variable compleja, fuera de las atribuciones de esta asignatura.

U NIVERSIDAD DE VALLADOLID

134

Tema 9. Integrales paramétricas

Propiedades 9.41. Sean f y g funciones que admiten transformada de Laplace. Se tiene que: I ) Si α, β ∈ C, entonces h = α f + β g admite transformada de Laplace, σh ≤ m´ ax{σf , σg } y L(α f + β g)(s) = α Lf (s) + β Lg(s) .

II )

Si b > 0 y h(t) = f (b t) , entonces h admite transformada de Laplace, σh = b σf y s 1 . Lh(s) = Lf b b f (t − t0 ) si t ≥ t0 , entonces h admite transformada de III) Si t0 > 0 y se define h(t) = 0 si 0 < t < t0 , Laplace, σh = σf y Lh(s) = e−t0 s Lf (s) . IV )

Si s0 ∈ R y h(t) = es0 t f (t), entonces h admite transformada de Laplace, σh = σf + s0 y Lh(s) = Lf (s − s0 ) .

Proposición 9.42 (valor final de la transformada de Laplace). Sea f una función que admite transformada de Laplace. Entonces: I ) Se verifica que l´ım Lf (s) = 0. s→∞

II )

Si además existe y es finito f (0+ ) = l´ım+ f (t), entonces se verifica que l´ım s Lf (s) = f (0+ ) . s→∞

t→0

Proposición 9.43 (derivación de transformadas de Laplace). Sea f una función que admite transformada de Laplace. Entonces, la función Lf es de clase C ∞ en el intervalo Df = (σf , ∞). Además, si para cada n natural se define gn (t) = (−t)n f (t), t > 0, entonces σgn = σf , y para cada s ∈ Df se tiene que Z ∞ (n) (−t)n f (t) e−st dt = L(gn )(s) . (s) = Lf 0

Proposición 9.44 (transformada de Laplace de las derivadas). Supongamos que f es de (j) clase C n en [0, ∞), y que para admite transformada de todo j ∈ {0, 1, . . . , n} la función f Laplace. Pongamos α = m´ax σf (j) , 0 ≤ j ≤ n . Entonces, para cada s > α se tiene que L f (n) (s) = sn Lf (s) − sn−1 f (0) − sn−2 f ′ (0) − . . . − sf (n−2) (0) − f (n−1) (0) .

De acuerdo con el convenio introducido inicialmente de que las funciones consideradas, si están definidas en todo R, se entenderán como nulas en (−∞, 0), resulta que para dos de estas funciones f y g se tendrán las siguientes igualdades para t ≥ 0: Z t Z ∞ Z t Z t f (t − x) g(x) dx ; f (t − x) g(x) dx = f (x) dx, (f ∗ g)(t) = f (x) dx = −∞

−∞

0

0

por otro lado, para t < 0 las integrales anteriores son nulas (ver propiedad 9.18.I).

1 Proposición 9.45 (transformada de Laplace del integrador). Sea f ∈ Lloc (R+ ) y que admite Rt transformada de Laplace. Entonces, la función g definida para t ≥ 0 por g(t) = 0 f (x) dx , admite transformada de Laplace, σg ≤ sup{0, σf } y 1 Lg(s) = Lf (s), para cada s > σg . s (Nótese que g es la única primitiva de f que se anula en −∞; en este ámbito de la transformada de Laplace g se suele denominar integrador de f )

Proposición 9.46 (transformada de Laplace de convoluciones). Sean f y g funciones que admiten transformada de Laplace. Se supone que al menos una de ellas es localmente acotada (i.e., acotada en cada intervalo compacto [0, b]). Entonces f ∗ g está definida para todo t ≥ 0 y se verifica: I ) La función f ∗ g es continua en [0, ∞). II )

III)

La función f ∗ g admite transformada de Laplace y σ(f ∗g) ≤ m´ax{σf , σg }.

Para cada s > σ(f ∗g) se tiene que

L(f ∗ g)(s) = Lf (s) · Lg(s) . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

135

Ejercicios

Ejercicios 9.1 Para cada t ∈ R se considera f (t) = I) II )

Z

∞

2

e−x cos(2 t x) dx . 0

Probar que f está bien definida y es derivable en R, con derivada f ′ (t) = −2 t f (t). Demostrar que la función

g(x, y) =

x2

p 2 2 x e−(x +y ) cos 2 t x2 + y 2 2 +y

es integrable en (0, ∞) × (0, ∞) y calcular su integral. 9.2 Demostrar que la función definida por Z ∞ sen(y) dy , e−xy f (x) = y 0

x > 0,

es derivable en (0, ∞), calcular su derivada y obtener una expresión explícita de f . 9.3 Demostrar que, aun cuando la función sen(y)/y no es integrable en (0, ∞), la función f definida, de forma similar al ejercicio anterior, por Z →∞ sen(y) e−xy f (x) = dy , x ∈ [0, ∞) , y 0

es continua en el cerrado [0, ∞). Deducir que Z →∞ π sen(y) dy = . y 2 0 9.4 Calcular, para x ∈ R, el valor de h(x) =

Z

∞ 0

1 − cos(x y) −y e dy . y2

9.5 Probar que está bien definida en [1, ∞) la función Z 1 t−1 x −1 f (t) = dx , log(x) 0

y que es derivable en (1, ∞). Obtener explícitamente el valor de f . 9.6 Demostrar que si a > 0, entonces √ Z ∞ π . exp − (x − a/x)2 dx = 2 0 9.7 Calcular el valor de la integral f (x) =

Z

∞ 0

arctg(x y) dy. y (1 + y 2 )

9.8 Demostrar que para cada α > 0 está bien definida la integral Z ∞ −αx 2 e − e−α x F (α) = dx x 0

y calcular su valor.

9.9 Si |λ| < 1 calcular

U NIVERSIDAD DE VALLADOLID

Z

π 0

log 1 + λ cos(x) dx . cos(x)

136

Tema 9. Integrales paramétricas

9.10 Se consideran n ∈ N y p ∈ R, p > −1. Demostrar que Z 1 (−1)n n! . xp logn (x) dx = (p + 1)n+1 0 9.11 Estudiando la derivabilidad de la función Z x log(1 + x t) f (x) = dt, 1 + t2 0 deducir el valor de

Z

1 0

x ≥ 0,

log(1 + t) dt. 1 + t2

9.12 Probar que si a, b > 0 se tiene que: Z ∞ −ax b e − e−bx I) ; dx = log x a 0 2 Z ∞ −ax (2 a)2a (2 b)2b e − e−bx . dx = log II ) x (a + b)2(a+b) 0 9.13 Sea c > 0. A partir de la función f (y) = obtener que Z

∞ 0

log(x) π log(c) dx = x2 + c2 2c

Z

∞ 0

Z

y

xy dx x2 + c2 ∞

0

√ log(x) x π dx = √ 2 log(c) + π . x2 + c2 2 2c

9.14 Probar que para cada y ∈ (−1, 1) se tiene que Z ∞ −yx π e . dx = cos yπ/2 −∞ Ch(x) Deducir el valor de la integral

Z

∞ −∞

−x

x e /2 dx . Ch(x)

9.15 Sean f : R → R continua y T = (x, y, z) ∈ R3 : x > 0 , y > 0 , z > 0 , x + y + z < 1 . I)

II )

Probar que si p > 0, q > 0 y r > 0 la función (x, y, z) 7→ xp−1 y q−1 z r−1 f (x + y + z) es integrable en T y Z Z Γ(p) Γ(q) Γ(r) 1 p+q+r−1 u f (u) du . xp−1 y q−1 z r−1 f (x + y + z) dx dy dz = Γ(p + q + r) 0 T

Para cada t ∈ R se define g(t) =

Z

1

T

xp−1 y q−1 z r−1 f t (x + y + z) dx dy dz .

Probar que si f es de clase C entonces g es derivable y determinar una expresión integral para g ′ . Calcular g ′ (2) en el caso p = q = r = 1/3 y f (u) = eu . 9.16 Probar que la función 1 1 − cos(x) cos(y) cos(z)

es integrable en (0, π) × (0, π) × (0, π) y calcular su integral.

Sugerencia: Realizar primero, en cada variable, el cambio típico para las fracciones racionales trigonométricas t = tg(x/2). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

137

Ejercicios

9.17 Utilizar las coordenadas esféricas generalizadas y las integrales eulerianas para obtener una fórmula cerrada de la medida de las bolas en Rn en función de su radio. 9.18 Sean p, q, r, m números reales positivos, y B la bola abierta de R3 centrada en 0 y de radio 1. Estudiar para qué valores de esos parámetros la siguiente integral es finita y calcular su valor: Z |x|p |y|q |z|r dx dy dz . 2 2 2 m B x +y +z

9.19 Sea V = (0, ∞) × (0, ∞) × (0, ∞) . Si p > 0, q > 0, r > 0 y 1/p + 1/q + 1/r < 1 calcular Z 1 dx dy dz (ver ejercicio 8.37). p q r V 1+x +y +z 9.20 (Funciones meseta) I)

Construcción mediante convoluciones: Sean a < b números reales. Mediante la convolución de los elementos de una sucesión regularizante con la función característica del intervalo [a − δ, b + δ], δ > 0, comprobar que paro todo r > 0 existe una función f de clase C ∞ en R tal que 1. 0 ≤ f (x) ≤ 1 para todo x ∈ R.

2. f (x) = 1 si x ∈ [a, b].

3. f (x) = 0 si x ∈ / [a − r, b + r]. A tales funciones f se les denomina funciones meseta. II )

Construcción explícita: 1 La función g(x) = e− /x χ(0,∞) (x) es de clase C ∞ en R. Sean c < a < b < d números reales (esto es, [a, b] ⊂ (c, d)). g(d − x) es de clase C ∞ en R, toma valores entre 0 y 1, g(x − b) + g(d − x) se anula para x ≥ d y vale 1 para x ≤ b. g(x − c) es de clase C ∞ en R, toma valores entre 0 y 1, se 2. La función hl (x) = g(x − c) + g(a − x) anula para x ≤ c y vale 1 para x ≥ a.

1. La función hr (x) =

3. La función f (x) = hl (x)hr (x) es de clase C ∞ en R, 0 ≤ f (x) ≤ 1 para todo x ∈ R, f (x) = 0 si x ∈ / [c, d] y f (x) = 1 si x ∈ [a, b].

9.21 (Densidad de Cc∞ (Rd ) en L1 (Rd )) n P aj χIj una función escalonada en Rd . Probar que para todo ε > 0 existe g de I ) Sea α = j=1 Z α(x) − g(x) dx < ε. clase C ∞ en Rd y de soporte compacto con Rd

Sugerencia: Aproximar las funciones características χIj por adecuadas funciones “meseta”, construidas a partir de las ya obtenidas en dimensión 1.

II )

∞ Deducir que para cada función f ∈ L 1 (Rd ) existe una Z sucesión {gn }n=1 de funciones de f (x) − gn (x) dx = 0 . clase C ∞ en Rd y de soporte compacto tal que l´ım n→∞

Rd

Nota: El subespacio vectorial de Cc (Rd ) constituido por las funciones de clase C ∞ se denota por Cc∞ (Rd ).

9.22 Sean I = [a, b] y J = [c, d] dos intervalos compactos de la recta y f = χI , g = χJ sus respectivas funciones características. I) II )

Calcular f ∗ g.

Calcular la transformada de Fourier de f ∗ g.

U NIVERSIDAD DE VALLADOLID

138

Tema 9. Integrales paramétricas

9.23 Considérese la función definida en casi todo punto de R por 1 f (x) = p χ[−1,1] (x) . |x|

Comprobar que f es integrable en R pero f ∗ f no está definida en todo punto. 9.24 Sea f una función continua en R y F una primitiva suya. Si g = χI es la función característica de un intervalo I = [a, b], calcular f ∗ g en función de F . 9.25 Para cada λ > 0 sea fλ la función definida en R por fλ (x) = e−λ x χ[0,∞) (x) . I) II )

Calcular fλ ∗ fµ .

Calcular la transformada de Fourier de fλ .

9.26 (Funciones gaussianas) I)

II )

−x2

Sea ϕ(x) = e /2 . Probar que la transformada de Fourier de ϕ satisface la ecuación diferencial ϕ b ′ (ω) + ω ϕ(ω) b = 0 . Deducir que √ √ −w2 ϕ(ω) b = 2π ϕ(ω) = 2π e /2 . Probar que la convolución de dos gaussianas es una gaussiana. Concretamente, si f (x) =

1 √

σ1 2π

e

−(x−µ1 )2/2σ 2 1

y

g(x) =

donde

σ=

entonces (f ∗ g)(x) =

1 −(x−µ)2/2σ 2 √ e , σ 2π

1 −(x−µ2 )2/2σ 2 2 √ e σ2 2π

q

σ12 + σ22

y

µ = µ1 + µ2 .

1 9.27 (Funciones de orden exponencial) Se dice que una función f ∈ Lloc (R+ ) es de orden exponencial si existen constantes M > 0, α ∈ R y b > 0 tales que

I)

|f (t)| ≤ M eα t

para casi todo t ≥ b.

(9.7)

1 Probar que si f ∈ Lloc (R+ ) es de orden exponencial, entonces f admite transformada de Laplace. En concreto, si se verifica (9.7) se tiene que σf ≤ α.

II )

Comprobar con un ejemplo (recurrir a funciones numerablemente escalonadas) que puede suceder que σf < α y f verifique (9.7) para α pero no para β < α.

III)

1 Proporcionar algún ejemplo que muestre que hay funciones de Lloc (R+ ) que admiten transformada de Laplace pero no son de orden exponencial.

1 9.28 Si la función f ∈ Lloc (R+ ) admite transformada de Laplace, aunque f no sea de orden Rt exponencial, el integrador g(t) = 0 f (x) dx siempre es de orden exponencial.

9.29 Sea H la función de Heaviside o escalón unidad, dada por H(t) = χ[0,∞) (t) .

Para las siguientes funciones (definidas tácitamente sólo cuando t ≥ 0), se pide determinar si admiten transformada de Laplace y, si procede, calcularla. En todos los casos a denota una constante positiva y b, c números reales. I ) f (t) = H(t) II ) f (t) = H(t − a) III ) f (t) = c H(t) − H(t−a) IV )

VII ) X) XIII ) XVI )

f (t) = ec t

f (t) = sen(c t) f (t) = tn ec t , n ∈ N

f (t) = e−b t cos(c t) Z t x cos(2x) dx f (t) =

V)

f (t) = Ch(c t)

VI )

f (t) = Sh(c t)

VIII )

f (t) = cos(c t)

IX )

f (t) = tn , n ∈ N

XI ) XIV ) XVII )

f (t) = e−t H(3 − t)

f (t) = e−b t sen(c t)

XII ) XV )

f (t) = H(t − a) ec t f (t) = e−t sen2 (t)

f (t) = et H(t−2) sen(t−2)

0

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

139

Ejercicios

1 9.30 Sea f : (0, ∞) → C una función de Lloc (R+ ) y periódica de periodo p > 0, es decir, tal que

f (t + p) = f (t),

t ≥ 0.

Probar que f admite transformada de Laplace, con σf ≤ 0. Demostrar que, si ϕ es la función ϕ(t) = f (t)χ[0,p] (t) = f (t) − H(t − p)f (t − p),

t ≥ 0,

entonces Lf se expresa en función de Lϕ mediante la fórmula Lf (s) = Aplíquese, en particular, a la función coseno:

Lϕ(s) . 1 − e−ps

ϕ(t) = cos(t) − H(t − 2π) cos(t − 2π) . 9.31 La función de error ‘erf’ y la función complementaria de error ‘erfc’ se definen por Z t 2 2 √ erf(t) = e−x dx, erfc(t) = 1 − erf(t) , t ≥ 0. π 0 Determinar las transformadas de Laplace de las funciones √ √ y g(t) = et f (t) = et erfc t . f (t) = erfc t

Sugerencia: Aplíquese el teorema de Fubini en las integrales iteradas que aparecen.

1 9.32 Sea g ∈ Lloc (R+ ) que admite transformada de Laplace y tal que la función h(t) = g(t)/t 1 también pertenece a Lloc (R+ ).

I) II )

Probar que h admite transformada de Laplace y que σh = σg . Pongamos Lg(s) = G(s). Demostrar que Lh(s) = H(s) siendo H la única primitiva de −G, Z H(s) = − G(s) ds + C0 , C0 ∈ C , para la que l´ım H(s) = 0. s→∞

Sugerencia: Aplíquense las proposiciones 9.42 y 9.43. III )

Sean a y b números reales. Se considera la función Z t ax e − cos(bx) dx, f (t) = x 0

t ≥ 0.

Si s > m´ax{a, 0}, deducir de lo anterior Lf (s).

1 9.33 Sea p > 0. Se considera la función fp ∈ Lloc (R+ ) definida por fp (t) = tp−1 (se sobreentiende que fp (t) = 0 para t ≤ 0).

I)

Demostrar que para s > 0 se tiene que

Lfp (s) = II ) III )

Γ(p) . sp

Dados p , q > 0 , mediante un cambio de variable lineal adecuado, escribir la convolución (fp ∗ fq )(t) como una integral extendida al intervalo (0, 1). Mediante la transformación de Laplace, deducir de los apartados anteriores la siguiente relación entre las funciones eulerianas B y Γ: B(p, q) =

Γ(p) Γ(q) , Γ(p + q)

p, q > 0 .

9.34 Sea n un número natural y sea f una función de clase C 2 en [0, ∞) tal que f , f ′ y f ′′ son de orden exponencial, y con f (0) = 1, f ′ (0) = −n. Hallar la transformada de Laplace de f supuesto que t f ′′ (t) + (1 − t) f ′ (t) + n f (t) = 0, t ≥ 0. U NIVERSIDAD DE VALLADOLID

140

Tema 9. Integrales paramétricas

9.35 Sea f una función de clase C 1 en [0, ∞), tal que f y f ′ son de orden exponencial, y con f (0) = 0. Sabiendo que Z t ex cos 2(t − x) f (x) dx = et f ′ (t) + f (t) − 1, t ≥ 0, 5 0

determinar la transformada de Laplace de f .

9.36 En los siguientes casos se pide calcular la transformada de Laplace de la función 1 f ∈ Lloc (R+ ) que satisface la correspondiente ecuación integro-diferencial: Z t cos(t − x) f (x) dx I ) f (t) = sen(t) + 2 II ) III) IV )

Z

0

t

ex cos(t − x) f (x) dx = t

0

f ′′ (t) + Z

t 0

Z

t

e2(t−x) f ′ (x) dx = e2t , siendo f (0) = 0, f ′ (0) = 1 0

f (t − x) f (x) dx = 8 sen(t) − t cos(t)

9.37 Para cada uno de los problemas de Cauchy que se relacionan a continuación se pide calcular la transformada de Laplace de la solución x(t): ( ′′ x (t) + x(t) = t I) x(0) = 0, x′ (0) = 1. ( x′′ (t) − 4 x′ (t) − 5 x(t) = 3 et II ) x(0) = 3, x′ (0) = 1. ( ′′ x (t) + x(t) = H(t) − 2 H(t − 1) + H(t − 2) III) x(0) = x′ (0) = 0. ( ′′ x (t) + x′ (t) = 3 cos(t) IV ) x(0) = 0, x′ (0) = −1. ( x(4) (t) + 3 x′′ (t) + 2 x(t) = e−t H(t − 2) V) x(0) = x′ (0) = x′′ (0) = 0, x′′′ (0) = −1. 9.38 Calcular la transformada de Laplace de las soluciones de los sistemas de ecuaciones diferenciales lineales de primer orden, con las condiciones iniciales indicadas, en las siguientes situaciones:  ′ 7 x (t) + y ′ (t) + 2 x(t) = 0   I) x′ (t) + 3 y ′ (t) + y(t) = 0   x(0) = 1, y(0) = 0.  ′ 5 x (t) + 2 y ′ (t) − 2 x(t) + y(t) = 2e−t   II ) −2 x′ (t) − y ′ (t) + x(t) = sen(t)   x(0) = 1, y(0) = −1.  ′ x (t) + y ′ (t) = 2 z(t)      y ′ (t) + z ′ (t) = 2 x(t) III)  x′ (t) + z ′ (t) = 2 y(t)     x(0) = 1, y(0) = −1, z(0) = 0

Tema 10

Extremos condicionados Para quien tiene conocimientos, aunque sean elementales, de Geometría Lineal y de Programación Lineal, debe ser muy fácil comprender la motivación de la teoría que presentamos ahora. En aquel caso se trata de estudiar los extremos de funciones lineales en politopos convexos (i.e., en intersecciones de semiespacios afines). Si consideramos funciones cualesquiera, no sólo las lineales, y subconjuntos más generales, el problema es, en general, irresoluble. Ahora bien, si las funciones y los conjuntos se pueden aproximar localmente por “objetos lineales”, es posible establecer condiciones necesarias y suficientes para la existencia de extremos de la restricción de la función al subconjunto. En cuanto a la mencionada aproximación lineal, para las funciones está todo dicho: estamos hablando de la noción de diferenciabilidad. Al referirnos a conjuntos, llegamos al concepto de variedad diferenciable. En realidad, esta teoría se puede presentar sin mencionar los aspectos geométricos, lo único que se necesita es el teorema de las funciones implícitas (véanse, por ejemplo, los textos [2], [15] o [32]), pero con un poco de esfuerzo adicional, la introducción del concepto de variedad diferenciable permite dar una visión geométrica, tanto del problema como de su solución. Otro aspecto similar al caso de variedades afines en Rn es que las variedades diferenciables pueden aparecer, en la práctica, descritas de forma paramétrica, como imágenes de funciones definidas en abiertos de Rd o de forma implícita, como conjuntos de ceros de aplicaciones de Rn en Rn−d ; en la primera situación los problemas se abordan de la forma habitual, replanteándolos en términos de funciones en abiertos de Rd , es la segunda la que nos preocupa, recordemos que podemos determinar si cierta aplicación define de forma implícita un grupo de variables en función de las restantes (teorema 3.21), pero eso no proporciona ningún algoritmo para calcularlas de forma explícita.

10.1.

Variedades diferenciables en Rn

Definición 10.1. Se dice que un subconjunto conexo S de Rn es una variedad (diferenciable) de clase C k (k ≥ 1) y de dimensión d, 1 ≤ d < n, si para cada punto p ∈ S existen, un abierto V de Rd , un entorno abierto U de p en Rn y una aplicación ϕ: V → U tales que I)

II )

ϕ es de clase de clase C k

en cada punto de V el rango de la matriz jacobiana igual a d.

III )

D j ϕi

1≤i≤n 1≤j≤d

es máximo, es decir,

ϕ es un homeomorfismo entre V y U ∩S, esto es, ϕ: V → U ∩S es biyectiva y ϕ−1 : U ∩S → V es continua.

El par (V, ϕ) se denomina carta o parametrización local de S en torno al punto p. Una familia de cartas locales {(Vi , ϕi ) : i ∈ I} tal que cada punto p ∈ S pertenece a la imagen de alguna de ellas, es decir, tal que S = ∪ ϕi (Vi ), i∈I

se denomina atlas de la variedad. Cuando para una variedad existe un atlas constituido por una sola carta local diremos que la variedad es simple o elemental. 141

142

Tema 10.

Extremos condicionados

Observaciones 10.2. I)

Las variedades de dimensión 1 reciben el nombre particular de curvas, y las de dimensión 2 el de superficies. Las variedades de dimensión n−1 en Rn se denominan hipersuperficies; nótese el paralelismo con la terminología del caso lineal, los hiperplanos.

II )

No hay inconveniente en considerar, sumergidas en Rn , variedades diferenciables de dimensión d = n, pero esto carece de interés por trivial, ya que estos objetos no son otros que los abiertos conexos de Rn .

III)

En la Geometría Diferencial abstracta el conjunto de puntos soporte de una variedad diferenciable es un espacio topológico Hausdorff S, sin necesidad de que tenga una estructura vectorial, y mucho menos euclídea, por lo que la condición de diferenciabilidad se estable en términos de una compatibilidad de cartas (ver 10.4.I). En este contexto no se dice que S es una variedad diferenciable, sino que S tiene una estructura diferenciable, esta estructura es un atlas de cartas compatibles.

IV )

Volviendo al contexto de los espacios euclídeos, la condición de que la diferencial de las parametrizaciones locales tenga rango máximo (es decir, que sean inmersiones, ver definición 3.23 y teorema 3.24) se traduce, coloquialmente hablando, en que localmente se puede deformar la variedad de forma suave (mediante difeomorfismos) para convertirla en una región de un subespacio lineal de la misma dimensión (ver figura 10.1).

←→

Figura 10.1: Las variedades diferenciables se “rectifican” mediante difeomorfismos.

Definición 10.3. Sean S una variedad diferenciable de dimensión d y de clase C k en Rn , p un punto de S y (V, ϕ) una carta local alrededor de dicho punto. Pongamos que p = ϕ(x), x = (x1 , x2 , . . . , xd ) ∈ V . El subespacio vectorial de Rn generado por los d vectores ∂ϕ (x), j = 1, 2, . . . , d, Dj ϕ(x) = ∂xj es decir, la imagen de la aplicación lineal ϕ′ (x), se denomina espacio tangente a la variedad S en el punto p y lo denotaremos por TS (p). Sus elementos se denominan vectores tangentes a S en dicho punto. Observaciones 10.4. I)

La definición anterior es coherente puesto que, si (W, γ) es otra carta alrededor de p, la imagen de la aplicación lineal γ ′ (γ −1 (p)) es la misma que la de ϕ′ (x). Aunque el razonamiento es igual, independientemente de la dimensión, para ilustrar esto pensemos en el caso de superficies en R3 , es decir, que (V, ϕ) y (W, γ) son parametrizaciones regulares de sendas superficies simples en R3 . En este caso el subconjunto M de S dado por M = ϕ(V ) ∩ γ(W ) ⊂ S es una superficie elemental que contiene al punto p, y que puede ser parametrizada en un entorno de dicho punto indistintamente por ϕ : ϕ−1 (M ) → M

o

γ : γ −1 (M ) → M

(véase la figura 10.2, en la que M es la parte sombreada de S). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

10.1.

143

Variedades diferenciables en Rn

Esas dos parametrizaciones locales de M son compatibles en el sentido que precisamos ahora: los teoremas de rango muestran que el cambio de carta (o cambio de parámetros) θ = γ −1 ◦ ϕ : ϕ−1 (M ) → γ −1 (M )

es un difeomorfismo de clase C 1 y, obviamente, ϕ = γ ◦ θ. Además, la regla de la cadena 2.12 establece que ϕ′ (x) = γ ′ θ(x) ◦ θ ′ (x) (10.1) para cada x ∈ ϕ−1 (M ) , y como θ ′ (x) es un isomorfismo lineal de R2 en R2 , la imagen ϕ′ (x)(R2 ) es la misma que γ ′ (θ(x))(R2 ). .

S M p

∧

γ

∧ ϕ V

W

γ −1 ◦ϕ −−−−−−→

Figura 10.2: Parametrizaciones de un entorno de un punto en una variedad II )

La segunda condición de la definición 10.1 garantiza que el espacio tangente a la variedad en un punto es un subespacio vectorial de dimensión d de Rn , ya que los d vectores Dj ϕ(x), j = 1, 2, . . . , d, son linealmente independientes.

III )

La noción de espacio tangente tiene una lectura más geométrica: dado un punto p de una variedad S, el subespacio afín T = p + TS (p) = p + v : v es vector tangente a S en p

es también una variedad diferenciable, aquella que, entre todas las lineales, mejor se aproxima localmente a S en el punto p (ver los siguientes ejemplos).

Ejemplos 10.5. Citamos aquí algunos casos sencillos y muy familiares. I)

Si L es un subespacio afín de Rn de dimensión algebraica d, cualquier subconjunto M no vacío, conexo y abierto en L (véase, M = U ∩ L con U abierto de Rn ) es una variedad diferenciable de clase C ∞ y dimensión d.

II )

Si función real definida y de clase C k en un intervalo I abierto de R, su grafo f es una k 2 x, f (x) : x ∈ I es una tangente en variedad (una curva) de clase C en R . El espacio cada punto p = x, f (x) es la recta engendrada por el vector v = 1, f ′ (x) .

III )

IV )

El grafo de la función valor absoluto no es una curva diferenciable; es imposible construir una carta diferenciable alrededor del punto (0, 0). Sin entrar en detalles técnicos, el razonamiento es el que dicta la intuición geométrica: existen tangentes “laterales”, pero con vectores directores distintos, a saber, v 1 = (1, 1) y v 2 = (1, −1). Si f es una función real definida y de clase C k en un abierto conexo A de R2 , su grafo k 3 x, y, f (x, y) : (x, y) ∈ A es una variedad (una superficie) de clase C en R . El espacio tangente en cada punto p = x, y, f (x, y) es el plano engendrado por los dos vectores v 1 = 1, 0, D1 f (x, y) y v 2 = 0, 1, D2 f (x, y) ,

(ver la observación 2.8.IV).

U NIVERSIDAD DE VALLADOLID

144

Tema 10.

10.1.1.

Extremos condicionados

Variedades definidas implícitamente

El siguiente resultado es consecuencia inmediata del teorema de las funciones implícitas. Teorema 10.6. Sean U un abierto de Rn y g: U → Rn−d (n > d) una aplicación de clase C k tal que el rango de la matriz jacobiana en cada punto de U es máximo. Se supone que el conjunto X = {x ∈ U : g(x) = 0} es no vacío. Entonces cada componente conexa S de X es una variedad diferenciable de dimensión d y clase C k . Observaciones 10.7. I)

Como en el caso de variedades lineales, el número entero n − d en el enunciado anterior se denomina codimensión de la variedad.

II )

También es cierto el recíproco del teorema anterior, precisando más, toda variedad diferenciable se puede describir localmente de forma implícita. A modo de compendio, mencionaremos que las propiedades locales que se exponen en la definición 10.1, en el teorema 10.6 y en el teorema 3.24, proporcionan definiciones equivalentes de variedad diferenciable. De hecho, según los gustos de los autores, se pueden encontrar en la literatura existente todas las variantes que consisten en adoptar una de ellas como definición y luego establecer la equivalencia con las restantes.

Ejemplos 10.8. I) II )

Las ramas de las secciones cónicas regulares son curvas diferenciables de clase C ∞ . Las hojas de las cuádricas regulares son superficies diferenciables de clase C ∞ .

III)

Toda esfera en Rn es una hipersuperficie de clase C ∞ .

IV )

El subconjunto de R4 dado por {(x, y, z, u) ∈ R4 : (x − 1)2 + (y − 2)2 + z 4 + u4 = 1} es una variedad de dimensión 3 de clase C ∞ en R4 (una hipersuperficie).

V)

El subconjunto de R4 definido por {(x, y, z, u) ∈ R4 : x2 + y 2 + z 2 = 1, x + u = 0} es variedad de dimensión 2, una superficie, de clase C ∞ en R4 .

Aunque la obtención de parametrizaciones explícitas de una variedad definida implícitamente puede ser imposible o, como poco, muy laborioso, es posible caracterizar el espacio tangente a una de tales variedades en uno de sus puntos a partir de las aplicación g que la define en el sentido del teorema 10.6. Proposición 10.9. Sea S una variedad diferenciable en Rn de dimensión d que viene definida implícitamente en un entorno del punto p ∈ S por las ecuaciones gi (x) = 0,

1 ≤ i ≤ n − d,

donde las funciones gi son de clase C k en un abierto U de Rn que contiene a dicho punto y tales que el rango de la matriz jacobiana Dj gi 1≤i≤n−d 1≤j≤n

es máximo en cada punto de U . Entonces el espacio tangente a la variedad en un punto x ∈ S ∩ U es precisamente el conjunto de vectores v que satisfacen gi ′ (x)(v) = 0,

i = 1, 2, . . . , n − d.

Es decir, los vectores fila de la matriz jacobiana de g = (g1 , g2 , . . . , gn−d ) en el punto x son una base del complemento ortogonal en Rn del espacio tangente a S en dicho punto.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

10.2.

10.2.

Extremos sujetos a condiciones de ligadura

145

Extremos sujetos a condiciones de ligadura

Tal como mencionábamos en la introducción, si se consideran una función numérica definida en un abierto A de Rn y un subconjunto S de A, es evidente que los máximos y mínimos locales de la restricción de f a S no tienen por qué coincidir con los extremos relativos de f en A. Además, el problema de determinar los extremos de f|S es, en general, extremadamente difícil. El planteamiento que presentamos ahora consiste en considerar que el subconjunto S está constituido por los puntos del abierto A que satisfacen unas determinadas condiciones de ligadura dadas por funciones diferenciables g1 , . . . , gm que determinan localmente una variedad diferenciable S = {x ∈ A : g1 (x) = g2 (x) = . . . = gm (x) = 0}, siendo el rango de la matriz

máximo (igual a m) para cada x ∈ S.

Dj gi (x)

1≤i≤m 1≤j≤n

Definición 10.10. En la situación descrita antes, si x0 ∈ S es un punto en el que f|S alcanza un extremo relativo, se dice que f presenta un extremo relativo en x0 , sujeto a las condiciones de ligadura g1 , . . . , gm . Según el teorema de la función implícita, en un entorno de cada punto x ∈ S se podrán despejar m variables en función de las restantes y, sustituyendo esas variables en la función f , es decir, parametrizando la variedad S, puede tratarse el problema de encontrar los extremos relativos de f|S en la forma ordinaria, estudiando una función definida en un abierto de Rn−m . Pero, insistimos, obtener la expresión explícita de las funciones determinadas por las condiciones de ligadura suele resultar imposible. El teorema de Lagrange permite soslayar esta dificultad: Teorema 10.11 (de los multiplicadores, de Lagrange). Sean A un abierto de Rn , f una función real de clase C 1 en A, y m condiciones de ligadura, gi (x1 , x2 , . . . , xn ) = 0,

i = 1, 2, . . . , m,

(10.2)

1

donde las funciones gi son también de clase C en A. Si f presenta un extremo sujeto a las condiciones de ligadura (10.2) en el punto x0 y el rango de la matriz Dj gi (x0 ) 1≤i≤m 1≤j≤n

es m, entonces existe una única m-upla de números reales λ1 , λ2 ,. . . , λm tales que f ′ (x0 ) − es decir, se verifican las relaciones Dj f (x0 ) −

m X

m X

λi gi ′ (x0 ) = 0 ,

(10.3)

i=1

λi Dj gi (x0 ) = 0,

j = 1, 2, . . . , n.

(10.4)

i=1

Las constantes λ1 , λ2 ,. . . , λm reciben el nombre de multiplicadores de Lagrange. Observaciones 10.12. I)

II )

El conjunto de ecuaciones dadas en (10.2) y en (10.4) constituye un sistema de n + m ecuaciones con n + m incógnitas (las n coordenadas del punto x0 y los m multiplicadores λi , 1 ≤ i ≤ m), cuya solución permite localizar los posibles extremos. Nótese que la condición (10.3) no establece que ∇f (x0 ) deba ser necesariamente nulo, sino que sea, en virtud de la proposición 10.9, un vector ortogonal a la variedad S en el punto x0 , es decir, combinación lineal de ∇g1 (x0 ), ∇g2 (x0 ), . . . , ∇gm (x0 ).

U NIVERSIDAD DE VALLADOLID

146 III)

Tema 10.

Extremos condicionados

Una vez localizados los “puntos críticos” se hace necesario, igual que en los problemas ordinarios de extremos, dar condiciones suficientes para poder garantizar que en estos puntos la función presenta un extremo. En contra de lo que en un principio podría tentarnos creer, el carácter de la matriz hessiana Hf (x0 ) no aporta ninguna información, este hecho se puede constatar con sencillos ejemplos (ver ejercicio 10.3). Además es obvio que de alguna forma deben intervenir las condiciones de ligadura; esto queda patente en los teoremas siguientes, que consisten, vagamente hablando, en aplicar la teoría de extremos ordinarios (ver teoremas 2.39 y 2.40) a la composición de una carta local ϕ con la función f . Formalmente, el problema consiste en estudiar el carácter de la hessiana de una función, f ◦ ϕ, de n − m variables, pero de nuevo, operativamente, se puede prescindir del conocimiento de parametrizaciones locales.

Definición 10.13. Con las mismas hipótesis y notación que en el teorema anterior. La función (auxiliar) L definida en A por m X λi gi (x), x ∈ A, (10.5) L(x) = f (x) − i=1

se denomina función lagrangiana asociada al problema de extremos condicionados. Nótese que la restricción de L a la variedad S es la misma que la de f : f|S = L|S .

Teorema 10.14 (condición necesaria de extremo). Sean A un abierto de Rn , x0 ∈ A, f 2 y g1 , g2 , . . . , gm , funciones clase C en A. Se supone que gi (x0 ) = 0, i = 1, 2, . . . , m , y que el rango de la matriz Dj gi (x0 ) 1≤i≤m,1≤j≤n es m . Supongamos también que x0 y λ1 , λ2 ,. . . , λm satisfacen (10.2) y (10.4) y consideremos la función lagrangiana L definida por (10.5). Si f alcanza un máximo (resp. mínimo) relativo en el punto x0 , sujeto a las condiciones g1 , g2 , . . . , gm , entonces la matriz hessiana de L en x0 , verifica para cada h ∈ Rn con

h HL(x0 ) ht ≤ 0,

(resp. h HL(x0 ) ht ≥ 0)

gi ′ (x0 )(h) = 0,

i = 1, 2, . . . , m.

Observaciones 10.15. I)

II )

En el lenguaje de la Geometría Diferencial la condición anterior se traduce, según se deduce de la proposición 10.9, en que la forma cuadrática h 7→ h HL(x0 ) ht sea semidefinida (negativa o positiva, respectivamente) en TS (x0 ), el espacio tangente a la variedad en el punto x0 , un subespacio vectorial de dimensión n − m < n.

Como corolario inmediato, si la restricción de la forma cuadrática h 7→ h HL(x0 ) ht a TS (x0 ) es indefinida, entonces la función f|S no puede presentar un extremo local en x0 .

Teorema 10.16 (condición suficiente de extremo). Sean A un abierto de Rn , x0 ∈ A, f 2 y g1 , g2 , . . . , gm , funciones clase C en A. Se supone que gi (x0 ) = 0, i = 1, 2, . . . , m , y que el rango de la matriz Dj gi (x0 ) 1≤i≤m,1≤j≤n es m . Supongamos también que x0 y λ1 , λ2 ,. . . , λm satisfacen (10.2) y (10.4) y consideremos la función lagrangiana L definida por (10.5). Es condición suficiente para que la función f presente un máximo (resp. mínimo) relativo en el punto x0 , sujeto a las condiciones g1 , g2 , . . . , gm , que la restricción a TS (x0 ) de la forma cuadrática asociada a HL(x0 ) sea definida negativa (resp. positiva), es decir, que h HL(x0 ) ht < 0, para cada h ∈ Rn con h 6= 0 y tal que

(resp. h HL(x0 ) ht > 0)

gi ′ (x0 )(h) = 0,

i = 1, 2, . . . , m.

Observación 10.17. Evidentemente, si la forma cuadrática asociada a HL(x0 ) es definida o semidefinida en todo Rn , también tiene el mismo carácter su restricción a todos los subespacios vectoriales, pero puede suceder que f presente un extremo relativo en x0 sujeto a las condiciones g1 , g2 , . . . , gm , siendo indefinida en Rn dicha forma cuadrática. Como siempre, pensar en las situaciones sencillas, incluido el caso de variedades afines es muy revelador (ver ejercicio 10.3). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

10.2.

10.2.1.

Extremos sujetos a condiciones de ligadura

147

El método de Kuhn-Tucker

La teoría de Lagrange permite resolver problemas de extremos (absolutos o relativos) más generales, en los cuales el conjunto donde está definida la función viene dado mediante condiciones de ligadura dadas por relaciones de igualdad o desigualdad: C = {x : gi (x) ∼ 0, i = 1, 2, . . . , m},

donde ∼ es cualquiera de las relaciones =, < o ≤.

Es usual encontrar en la literatura matemática ese método enunciado como teorema de Kuhn-Tucker. Ahora bien, aunque es posible dar demostraciones de este resultado sin necesidad de recurrir al concepto de variedad y al teorema de Lagrange 10.11, la algoritmia que proporciona no es otra que la de realizar una descomposición adecuada del conjunto. Nótese que si f alcanza un extremo local en un punto x ∈ C, también lo hará la restricción f|B a cualquier subconjunto B ⊂ C que contenga a x. Esa descomposición consiste en discriminar, primero entre el interior y la frontera; se trata, grosso modo (hay que ser precavidos al describir interior y frontera si las funciones gi no están definidas en todo Rn ), de distinguir entre los puntos en que todas las desigualdades gi (x) ∼ 0 son estrictas y los que verifican gi (x) = 0, para algún i.

Después, el método consiste en descomponer la frontera como unión de variedades de dimensión menor que n. Aquí es útil convenir que las variedades de dimensión 0 son los conjuntos unipuntuales, pues pueden aparecer en la frontera puntos “angulosos”, “no regulares”, tales como los vértices de un politopo. Esas variedades estarán dadas de forma implícita M = {x : gi (x) = 0, i ∈ I} ∩ {x : gi (x) < 0, i ∈ J}

siendo I ∪ J = {1, 2, . . . , m}, es decir, M es la variedad contenida en el abierto VJ = {x : gi (x) < 0, i ∈ J}

definida de forma implícita por las relaciones

gi = 0 ,

i∈I.

Ilustraremos esto con un par de ejemplos suficientemente significativos. Ejemplo 10.18. Pensemos en el problema de estudiar los extremos, locales o absolutos, de una función f en un sólido poliédrico P de R3 , siendo la función diferenciable en un abierto que contiene a dicho sólido. Los extremos se pueden localizar: I)

En el interior del conjunto. Esto conduce a un problema ordinario de extremos en dimensión 3, que se aborda según se expuso en el tema 2.

II )

En las caras del poliedro. Se puede aplicar el método de los multiplicadores de Lagrange o parametrizar esos planos y tratarlo como un problema ordinario en dimensión 2.

III )

En las aristas del poliedro. El tratamiento es análogo al del caso anterior, pero en dimensión 1.

IV )

En los vértices del poliedro. Aquí el estudio consiste simplemente en evaluar la función.

Ejemplo 10.19. Consideremos el subconjunto K de R3 limitado por el plano z = 0 y el hemisferio superior de la esfera de radio 1 centrada en el origen, esto es, K = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 ≤ 0, z ≥ 0}.

Puesto que K es compacto cualquier función f continua en K alcanzará sus extremos absolutos. Estos extremos serán también relativos y se encuentran en uno de los siguientes conjuntos (disjuntos dos a dos): I)

En el interior de K, es decir, en el conjunto ◦

K= {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 < 0, z > 0},

y se tiene un problema de extremos ordinarios en este abierto. U NIVERSIDAD DE VALLADOLID

148 II )

Tema 10.

Extremos condicionados

En la parte de su intersección con la esfera S1 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 = 0, z > 0}. En este caso se tiene una condición de ligadura g(x, y, z) = x2 + y 2 + z 2 − 1 = 0 en el abierto A = {(x, y, z) ∈ R3 : z > 0}, siendo g ′ (x) 6= 0 para cada x ∈ S1 .

III)

En la parte de su intersección con el plano

S2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 < 0, z = 0}. Se tiene ahora, en el abierto A = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 < 0}, una condición de ligadura g(x, y, z) = z = 0 con g ′ (x) 6= 0 para cada x ∈ S2 .

IV )

En la intersección de la esfera y el plano

C = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 = 0, z = 0}. En este caso se tienen dos condiciones de ligadura g1 (x, y, z) = x2 + y 2 + z 2 − 1 = 0 , g2 (x, y, z) = z = 0 definidas en el abierto A = R3 , siendo el rango de la matriz jacobiana de g = (g1 , g2 ) máximo en cada punto de C. Si la función f es de clase C 1 en un abierto que contiene a K, sus posibles extremos se localizan en cada uno de los cuatro casos según los métodos expuestos. Obsérvese que, al tratarse de un problema de extremos absolutos, no es necesario recurrir a los criterios suficientes de extremo; basta seleccionar de entre los candidatos hallados (puntos críticos en alguno de los cuatro conjuntos anteriores), aquéllos en que la función tome los valores máximo y mínimo.

Ejercicios 10.1 Sean S1 una variedad diferenciable de dimensión d1 en Rn y S2 una variedad diferenciable de dimensión d2 en Rm , ambas de clase C k . I)

II )

Demostrar que S = S1 × S2 es una variedad diferenciable, de la misma clase C k , y de dimensión d = d1 + d2 en Rn+m . Proporcionar, vía cartas locales de S1 y S2 , una base al espacio tangente TS (c) en un punto genérico c = (a, b) ∈ S.

Supongamos que en un entorno abierto A ⊂ Rn del punto a ∈ S1 la variedad S1 está definida implícitamente por la relación f 1 = 0 con f 1 de clase C k en A, y que en un entorno abierto B ⊂ Rm del punto b ∈ S1 la variedad S2 está definida implícitamente por la relación f 2 = 0 con f 2 de clase C k en B. Dar una representación implícita de S en un entorno de c = (a, b) ∈ Rn+m . Describir los vectores ortogonales a TS (c).

10.2 Sea S una superficie de clase C 1 en R3 dada de forma implícita por la ecuación g(x, y, z) = 0. Demostrar, haciendo uso del teorema de Lagrange, que si a ∈ R3 \S y la distancia d(a, S) se alcanza en un punto p ∈ S, entonces el vector determinado por a y p es ortogonal al plano tangente a S en p. Como aplicación, dedúzcase la fórmula que expresa la distancia de un punto a un plano en R3 en términos de uno de sus vectores directores. 10.3 Se considera la función definida en R2 por f (x, y) = x2 − y 2 . I)

Para cada α ∈ [0, 2π] estúdiese la existencia de extremos de f condicionados a la ligadura gα (x, y) = sen(α) x − cos(α) y = 0 .

II )

LATV

En los puntos “críticos” x0 que proporciona el método expuesto en el teorema 10.11, estúdiese el carácter de las formas cuadráticas Hf (x0 ) y HL(x0 ), donde L es la correspondiente función definida según (10.5). Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

10.4 Estudiar los extremos relativos de la función f (x, y) =

y2 x2 + 3 2

sujeta a la condición x2 + y 2 = 1 . 10.5 Estudiar los extremos locales de la función f (x, y) = 2 x + y en el conjunto D = {(x, y) ∈ R2 : x2 + y 2 ≤ 1, x + y ≤ 1}. 10.6 Determinar los extremos absolutos de la función f (x, y) = ex+y en el conjunto D = {(x, y) ∈ R2 : x2 + y 2 ≤ 1, x2 + (y − 1)2 ≤ 1}. 10.7 Hallar los extremos absolutos de la función f : K → R dada por f (x, y) = x y 2 (4 − x − y),

donde K es el conjunto

K = {(x, y) ∈ R2 : 0 ≤ x ≤ 4, 0 ≤ y ≤ 4, x y 2 ≥ 1}. 10.8 Determinar los extremos relativos de la función f (x, y, z) = x + z en la esfera de ecuación x2 + y 2 + z 2 = 1 . 10.9 Estudiar los extremos locales de la función f (x, y, z) = x2 + y 2 + z 2 sujeta a las condiciones

(

x2 + y 2 + z 2 + x z + x y + y z = 1, x + 2y − 3z = 0.

10.10 Estudiar los extremos relativos de la función sujeta a la condición

f (x, y, z) = 2 x y − z 2 x3 + y 3 +

z3 = 2. 2

10.11 Calcular los extremos relativos de la función f (x, y, z) = x + y + z en cada una de las componentes conexas del conjunto o n 1 1 1 (x, y, z) ∈ R3 : + + = 1 . x y z U NIVERSIDAD DE VALLADOLID

149

150

Tema 10.

Extremos condicionados

10.12 Determinar los extremos relativos de la función f (x, y, z) = x + y z + z en el conjunto

n

o (x, y, z) ∈ R3 : 2 + y 2 + z 2 ≤ x ≤ 4 .

10.13 Calcular el máximo y el mínimo absolutos de la función f (x, y, z) = x2 + y 2 + z en el conjunto K = {(x, y, z) ∈ R3 : x2 + y 2 = 8, x + y + z = 1}. 10.14 Encontrar el mayor y el menor valor de x3 + y 3 + z 3 sujeta a las condiciones ( 2 x + y 2 + z 2 = 1, x + y + z = 1.

10.15 Encontrar los puntos del conjunto A = {(x, y, z) : x + z = 1, 4 x2 + y 2 ≤ 16}

más próximos y más alejados del origen.

10.16 Sean H el subconjunto de R3 dado por H = (x, y, z) ∈ R3 : x2 + y 2 = z 2 + 2 , −2 ≤ z ≤ 2 ,

y f la función real definida en R3 por f (x, y, z) = x y . I) II )

Demostrar que f está acotada en H y alcanza sus extremos. Calcular los extremos absolutos de f en H, así como los puntos donde se alcanzan dichos extremos.

10.17 Se considera el conjunto K = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1, −1 ≤ z ≤ 1}.

Determinar los extremos absolutos en K de la función f (x, y, z) = ex

2

−2y 2 +z 3

.

10.18 Encontrar los extremos absolutos de la función f (x, y, z) = x2 + y 2 + z 2 + x + y + z en el conjunto K = {(x, y, z) : x2 + y 2 + z 2 ≤ 4, z ≤ 1}. 10.19 Sea f : R3 → R la función definida por

f (x, y, z) = x2 + y 2 + z 2 .

I)

Calcúlense los extremos absolutos de f sobre el conjunto M = {(x, y, z) ∈ R3 : x2 + z 2 = 25, x2 − y 2 = 9},

justificando su existencia. II )

¿Tiene la función f extremos absolutos en el conjunto N = {(x, y, z) ∈ R3 : x2 + z 2 ≤ 25, x2 − y 2 ≤ 9}?

Si los tiene, calcúlense. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

10.20 I ) Sea f : R3 → R definida por

151

f (x, y, z) = x y z.

Hallar el máximo y el mínimo absolutos de f en la esfera unidad. II )

Inscribir un paralelepípedo rectangular de volumen máximo en una esfera de diámetro d.

10.21 Calcular la distancia al origen del conjunto Q = {(x, y, z) ∈ R3 : x2 + 2xy + y 2 + z 2 = 1} . 10.22 Hallar los extremos absolutos de la función f : K → R dada por f (x, y, z) = x2 + yz,

donde K es el conjunto K = {(x, y, z) ∈ R3 : 0 ≤ z ≤ 1, x2 + y 2 ≤ z 2 }. 10.23 Demostrar que la función f (x, y, z) = x2 + 2y 2 + 3z 2 + 4x está acotada en el conjunto

K = (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 9, x + z ≤ 3

y alcanza en él sus extremos absolutos. Calcular dichos extremos.

10.24 I ) Calcular el máximo y el mínimo absolutos en la bola euclídea B(0, 1) de la función real f definida en Rn por f (x1 , . . . , xn ) = x1 x2 · · · xn . II )

Deducir que si a1 , . . . , an ≥ 0 se verifica que 1

(a1 a2 · · · an ) /n ≤ III )

a1 + . . . + an . n

De entre todos los rectángulos inscritos en una elipse, determinar el de área máxima.

10.25 Sea a = (a1 , a2 , . . . , an ) ∈ Rn , a 6= 0. Determinar el máximo de ha, xi = sujeta a la condición 2

kxk = mediante: I ) La desigualdad de Cauchy-Schwarz. II )

n X

ak x k ,

k=1

n X

xk 2 = 1,

k=1

El teorema de los multiplicadores de Lagrange.

10.26 Hallar el máximo y el mínimo de las distancias entre los puntos de las circunferencias de ecuaciones (x − 2)2 + (y − 2)2 = 1 y x2 + y 2 = 18 . 10.27 Usando el teorema de los multiplicadores de Lagrange, probar que de entre todos los triángulos inscritos en una circunferencia, los de mayor área son los equiláteros. 10.28 Determinar las dimensiones del paralelepípedo rectangular que, de entre todos los de volumen dado V0 , tenga mínima la suma de las áreas de sus caras. U NIVERSIDAD DE VALLADOLID

152

Tema 10.

Extremos condicionados

10.29 Utilizando el método de Lagrange, calcular: I)

La distancia de ξ ∈ Rn al hiperplano afín H de ecuación a1 x1 + a2 x2 + . . . + an xn = c. Comparar con el ejercicio 10.2.

II )

La distancia de un punto (ξ1 , ξ2 , ξ3 ) ∈ R3 a la recta intersección de los planos a0 + a1 x + a2 y + a3 z = 0, b0 + b1 x + b2 y + b3 z = 0.

10.30 (Teorema fundamental de la programación lineal) Sean n, m ∈ N. Se supone que, para i = 1, 2, . . . , m , se tiene funciones lineales gi de Rn en R y que βi son números reales. Entonces el conjunto (un politopo) m C = x ∈ Rn : gi (x) ≤ βi para todo i = 1, 2, . . . , m = ∩ x ∈ Rn : gi (x) ≤ βi i=1

es cerrado y convexo. Consideremos además una función lineal f : Rn → R. Utilizar el método de Kuhn-Tucker para deducir que, si f presenta algún extremo en C, lo hace en su frontera y que ese valor extremo es absoluto. Además los extremos se alcanzan, o bien en todos los puntos de una región convexa de una variedad afín contenida en Fr(C), o en un sólo punto, que es un vértice o punto extremal de C, esto es, que no puede ser escrito como combinación convexa propia de otros puntos de C distintos de él mismo.

Tema 11

Teoría de campos En términos abstractos un campo vectorial definido en un abierto U de Rn no es otra cosa que una aplicación de U en Rm . La teoría que exponemos aquí va dirigida a proporcionar un formalismo más adecuado a los modelos de la Física y de la Técnica, así como la interpretación en este contexto particular de los conceptos que se definen relacionados con la derivación, cuando esas aplicaciones representan magnitudes escalares o vectoriales. Como curiosidad, la voz latina ‘vector’, que viene a significar ‘portador’, fue introducida en Matemáticas a través de la Astronomía. También introducimos aquí algunas nociones geométricas que surgen al tratar conceptos físicos y que no se enmarcan en la teoría de variedades presentada en el tema anterior. Para designar a esta nueva clase más amplia de objetos utilizaremos el término de variedades paramétricas. De momento prestamos atención a las curvas. Las definiciones y propiedades se enuncian en espacios Rn de dimensión arbitraria, ya que la generalización no ofrece ninguna dificultad adicional, pero si el lector se encuentra más cómodo, puede pensar en R2 y R3 , los casos de aplicación habitual.

11.1.

Curvas paramétricas

Una curva diferenciable elemental Γ que se parametrice por una única carta (I, ϕ) es el conjunto imagen de la aplicación ϕ: I → Rn , con I = (a, b) intervalo abierto de R. Pero en ocasiones conviene extender este punto de vista. Por ejemplo, el orden natural de la recta real hace que, en ocasiones, interese extender la definición tomando como dominios de definición intervalos cerrados, añadiendo al conjunto imagen, la curva, sus puntos “extremos”, como al considerar arcos o caminos continuos (ver definición 1.109). También, en otras situaciones, como al considerar de trayectorias de un móvil, es necesario eliminar el carácter inyectivo de la parametrización: por ejemplo, se puede idealizar una pista de atletismo como una curva, pero en competiciones de media y larga distancia, los atletas, idealizados como objetos móviles unipuntuales (partículas), han de recorrerla varias veces (ver ejemplo 11.3.I). Definición 11.1. Se llama curva paramétrica en Rn de clase C k (k ≥ 0) a una aplicación ϕ definida en un intervalo I de la recta real, con valores en Rn y de clase C k en I. El conjunto imagen de ϕ se llama soporte de la curva y se denota por ϕ∗ . Se dice que ϕ es una parametrización del soporte de la curva paramétrica. Si I es un intervalo compacto, I = [a, b], los puntos ϕ(a) y ϕ(b) se denominan respectivamente el origen y el extremo de la curva; si dichos puntos coinciden, se dice que la curva es cerrada. Se dice que la curva paramétrica ϕ es simple si es inyectiva, o también, si la curva es cerrada, definida en el compacto [a, b], si es inyectiva en el intervalo semiabierto [a, b). Por último, si la curva paramétrica es de clase C k con k ≥ 1, se puede considerar para cada t ∈ I el vector ϕ′ (t). Se dice que un punto ϕ(t) de la curva es regular si ϕ′ (t) 6= 0, en cuyo caso se llama a éste último el vector tangente a la curva en el punto ϕ(t). Cuando todos los puntos de una curva son regulares, la curva se dice regular. Observaciones 11.2. I)

Nótese que en un punto p del soporte de una curva ϕ no simple podrían aparecer varios vectores tangentes ϕ′ (t), correspondientes a los diferentes valores de t tales que ϕ(t) = p. 153

154

Tema 11.

Teoría de campos

II )

Toda curva diferenciable elemental se puede ver como el soporte de una curva paramétrica regular, simple y de clase C k , con k ≥ 1; la parametrización es la que aparece en la única carta de un atlas adecuado. El recíproco no es cierto en general (ver ejemplo 11.3.II), salvo en situaciones especiales, por ejemplo, que la curva sea cerrada y coincidan las derivadas laterales en los extremos del intervalo de parametrización.

III)

Conviene resaltar que, incluso al tratar con variedades diferenciables, en ocasiones es importante no sólo el conjunto soporte, sino también su parametrización y las propiedades de la misma; por ejemplo, si idealizamos una pista de atletismo como el soporte de una curva, en una competición los atletas “parametrizan” el mismo soporte, utilizando el tiempo como parámetro, pero gana el que lo hace antes, es decir, en un intervalo de menor longitud. Es fácil comprender por qué se usa también el término trayectoria como sinónimo de soporte de una curva paramétrica.

Ejemplos 11.3. I)

La curva paramétrica dada por ϕ(t) = (cos(t), sen(t)),

II )

t ∈ I,

donde I es un intervalo es de clase C ∞ y regular, y su soporte está contenido en la circunferencia centrada en (0, 0) y de radio 1. Es sencillo probar que la curva es simple si, y sólo si, la longitud de I es menor o igual que 2π, y que la curva es cerrada si, y sólo si, I = [a, a + 2nπ], con a ∈ R, n ∈ N.

La curva paramétrica dada por

ϕ(t) = sen(2 t) cos(t) , sen(2 t) sen(t) ,

t ∈ (0, π) ,

es de clase C 1 , simple y regular, pero no define una variedad diferenciable; ningún entorno de (0, 0) ∈ ϕ∗ puede ser homeomorfo a un intervalo: ver la figura 11.1 en la que se han enmarcado, dentro de un disco centrado en (0, 0), las imágenes de intervalos (0, δ), (π/2 − δ, π/2 + δ) y (π − δ, π). En esa figura se realza también en trazo más oscuro la imagen de un intervalo (π/2 − ε, π/2 + ε), que sí es una variedad siempre que 0 < ε < π/2.

0 δ

π −ε 2

π +ε 2

−→ π−δ

π

Figura 11.1: Existen curvas paramétricas simples que no son variedades diferenciables. Un mismo conjunto puede aparecer como el soporte de diferentes curvas paramétricas. Puesto que será necesario en lo sucesivo trabajar con conceptos relativos a curvas paramétricas, es imprescindible saber hasta qué punto dichos conceptos son independientes de la parametrización que las origina, siendo suficiente el conocimiento del soporte para trabajar sin ambigüedad. En otras palabras, interesa conocer si dos parametrizaciones de un mismo soporte son “equivalentes” en este sentido. La siguiente definición va dirigida a fijar esta idea. Definición 11.4. Se dice que dos curvas paramétricas, ϕ1 : I1 → Rn equivalentes si existe un difeomorfismo θ de I1 en I2 de manera que

y ϕ2 : I2 → Rn , son

ϕ2 ◦ θ = ϕ 1 .

En esta situación, θ recibe el nombre de cambio de parámetro. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

11.2.

Campos escalares y vectoriales

155

Observaciones 11.5. I)

La definición anterior se extiende, generalizando la idea de difeomorfismo, a intervalos no abiertos en la forma habitual, al considerar las derivadas en los extremos se entiende que éstas son laterales.

II )

Resulta obvio que curvas paramétricas equivalentes tienen el mismo soporte; ahora bien, el recíproco no es cierto a menos que se impongan condiciones de regularidad; tal es el caso de las que son cartas de variedades, o las que aparecen en el siguiente resultado, también consecuencia de los teoremas del rango (véase la observación 10.4.I).

Teorema 11.6. Dos curvas paramétricas definidas en intervalos compactos, regulares, simples no cerradas y con el mismo soporte son equivalentes. Dos curvas paramétricas cerradas, regulares, simples, con el mismo soporte y con el mismo punto inicial, son equivalentes. Observaciones 11.7. I)

Con la notación de 11.4, por la regla de la cadena, si para un t ∈ I1 , ϕ2 es derivable en el punto θ(t), también lo es ϕ1 en t y ϕ′1 (t) = θ′ (t) ϕ′2 (θ(t)) .

(11.1)

′

Si las curvas son simples, dado que θ (t) 6= 0 para todo t ∈ I1 , es inmediato que un punto p del soporte (idéntico para ambas curvas) es regular o no independientemente de la parametrización escogida, y que, en caso de serlo, los vectores tangentes en p respecto a cada parametrización son proporcionales y determinan, por tanto, una misma dirección. II )

Cuando hablamos de curvas regulares y simples, como en el caso de las variedades diferenciables, el resultado anterior justifica la posibilidad de trabajar con ellas indicando únicamente su soporte. Pero esto no es otra cosa que la propiedad de compatibilidad de cartas expuesta de 10.4.I. Véase que la fórmula (11.1) es exactamente el caso particular de (10.1) para dimensión 1.

11.2.

Campos escalares y vectoriales

Definición 11.8. Sea U un conjunto abierto de Rn . I) II )

Un campo escalar de clase C k en U es cualquier función f : U → R de clase C k .

Un campo vectorial de clase C k en U es toda aplicación F : U → Rm , m > 1, de clase C k .

El índice k recorre el conjunto de los números enteros no negativos, entendiéndose que las aplicaciones de clase C 0 son las continuas. Ejemplos 11.9. I) II )

Son campos escalares la temperatura o la celeridad. Son campos vectoriales la velocidad o cualquier campo de fuerzas (gravitatorio, eléctrico, magnético, etc.).

Definición 11.10. Sea f un campo escalar en un abierto U de Rn . Para cada c ∈ R, el subconjunto Sc = {x ∈ U : f (x) = c} se denomina conjunto de nivel o conjunto isotímico de f . Observaciones 11.11. I)

Los conjuntos isotímicos (del griego iso=igual, timo=valor) pueden ser vacíos; esto ocurre obviamente cuando el campo f no toma el valor c en ningún punto.

U NIVERSIDAD DE VALLADOLID

156

Tema 11.

Teoría de campos

II )

Otras terminologías específicas son utilizadas para cada caso concreto: por ejemplo, si f representa la temperatura en cada punto de una región del plano o del espacio se habla de conjuntos isotérmicos. Situaciones muy familiares para todos son la descripción de la presión en meteorología mediante las curvas isobáricas o la representación de los desniveles del terreno en un mapa topográfico mediante las curvas de nivel.

III)

En algunas ocasiones el campo f representará el potencial de un campo de fuerzas y los conjuntos de nivel reciben también el nombre de variedades equipotenciales; el teorema 10.6 justifica el nombre de variedades cuando se dan las condiciones de regularidad pertinentes.

Definición 11.12. Sean U un abierto de Rn y F : U → Rn un campo vectorial continuo. I)

II )

Una línea de corriente o de flujo de F es una curva en U parametrizada en un intervalo I por una aplicación γ: I → U de clase C 1 y tal que γ ′ (t) = F γ(t) para cada t ∈ I .

Sea K un subconjunto de U y consideremos para cada x ∈ K la línea de flujo Φ(x, t) determinada por el problema de valores iniciales ′ γ (t) = F γ(t) , γ(t0 ) = x . La unión de todas estas líneas de flujo que en un instante inicial t0 pasan por puntos de K se denomina tubo de campo o de flujo de F de soporte K.

Observaciones 11.13. I)

La existencia de las líneas de campo viene garantizada de forma local por la regularidad del campo F ; éste es un problema de la teoría general de ecuaciones diferenciales.

II )

Si se supone que el campo F no se anula en ningún punto de U , las líneas de flujo de F son curvas regulares γ tales que su tangente en cada punto x0 = γ(t0 ) por el que pasan es la recta que determinan dicho punto y el vector F (x0 ). Si F representa un campo de fuerzas, el significado dinámico de estos conceptos es simple: las líneas de flujo son las trayectorias que recorre una partícula sometida a los efectos del campo F . Por ejemplo, para campos eléctricos las líneas de flujo son las trayectorias que describe una carga en la región donde actúa el campo, recorridas éstas en un sentido u otro según el signo de la carga. Otra situación familiar es la del campo gravitatorio terrestre; en este caso el campo es proporcional en cada punto al vector de posición tomando como origen de coordenadas el centro (de masa) de la Tierra. Las líneas de flujo son rectas que pasan por este punto, lo cual no significa otra cosa que los objetos situados en la atmósfera, libres de otras fuerzas (rozamiento, etc.), caen verticalmente hacia la superficie terrestre (ver ejercicio 11.9).

11.3.

Operadores diferenciales

Notación: Sea U un abierto de Rn . Al conjunto de las aplicaciones f de clase C k definidas en U con valores en Rp , f : U → Rp , lo denotaremos por C k (U, Rp ); si p = 1 escribimos C k (U ), simplemente. Estos espacios, dotados de la suma habitual de funciones y el producto de números reales por funciones, son espacios vectoriales. La palabra “operador” se utiliza para designar las aplicaciones lineales entre este tipo de espacios vectoriales, en distinción con el caso de los espacios euclídeos. Definición 11.14. Sea U un abierto de Rn . Una aplicación T : C k (U, Rp ) → C m (U, Rq ) que sea lineal, es decir, tal que para todas f, g ∈ C k (U, Rp ) y todo λ ∈ R se tenga que T (f + g) = T (f ) + T (g)

y

T (λ f ) = λ T (f ) ,

se denomina operador lineal o simplemente operador.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

11.3.

157

Operadores diferenciales

Ejemplo 11.15. La aplicación que a cada función f de clase C 1 en un abierto U de Rn le asigna la función ∂f/∂x1 es un operador definido en C 1 (U, R). Un operador de este tipo, definido mediante derivadas parciales, se dice diferencial. A continuación se presentan los operadores diferenciales usuales que se manejan en la Física y sus propiedades básicas. En realidad, exceptuando la notación, la nomenclatura y la interpretación en el contexto de la Física, no hay muchas novedades, ya que la mayoría de los resultados que se enuncian son redacciones equivalentes o consecuencias directas de las propiedades generales de las funciones diferenciables. 11.3.1.

Gradiente de un campo escalar

Definición 11.16. Sea f un campo escalar de clase C 1 en un abierto U de Rn . Se denomina gradiente de f al campo vectorial definido por ∂f ∂f ∂f ∇f (x) = (x), (x), . . . , (x) , x ∈ U . ∂x1 ∂x2 ∂xn Propiedades 11.17. Sean f, g campos escalares de clase C 1 en un abierto U de Rn y c un número real. Se verifica que: I) II ) III ) IV )

∇(f + g) = ∇f + ∇g .

∇(c f ) = c ∇f .

∇(f g) = f ∇g + g ∇f .

Si g(x) 6= 0 para cada x ∈ U , entonces ∇ f/g = (g∇f − f ∇g)/g 2 .

Observación 11.18. De las propiedades i) y ii) anteriores se deduce que el gradiente es un operador definido en el espacio de los campos escalares de clase C 1 en un abierto U que toma valores en el espacio de los campos vectoriales continuos en U ; más general: f ∈ C k (U, R) 7−→ ∇f ∈ C k−1 (U, Rn ) , Formalmente escribiremos ∇=

k ≥ 1.

∂ ∂ ∂ , ,..., . ∂x1 ∂x2 ∂xn

Definición 11.19. Sean U un abierto de Rn y F : U → Rn un campo vectorial continuo. Se dice que F es conservativo si existe un campo escalar f de clase C 1 en U tal que ∇f (x) = F (x)

para cada x ∈ U .

En este caso, se dice que el campo f es una función potencial o un potencial escalar de F . Observaciones 11.20. I)

En ciertos modelos físicos, si ∇f = F , se dice que −f es una función potencial de F . Esto no debe causar ningún trastorno o confusión, es simplemente otro convenio de notación.

II )

Veremos más adelante, al estudiar el concepto de integral curvilínea, que el adjetivo ‘conservativo’ tiene un significado físico preciso. Estudiaremos ahora cómo se relacionan para este tipo de campos las variedades equipotenciales y las líneas de campo. Denominemos Sc a las variedades equipotenciales de un campo escalar f de clase C 1 en un abierto U de Rn . Si x0 ∈ U , f (x0 ) = c y ∇f (x0 ) 6= 0, el teorema 10.6 garantiza que, en un entorno de dicho punto, el conjunto Sc es realmente una variedad regular, mientras que la proposición 10.9 establece que el vector ∇f (x) es un vector ortogonal al espacio tangente a la variedad en el punto x ∈ Sc ; pero por otra parte este vector también es tangente a la línea de flujo del campo F = ∇f que pasa por x. Resumiendo, las líneas de flujo del campo ∇f son ortogonales a la familia de variedades equipotenciales de f . Se presenta a continuación un ejemplo de fácil visualización.

U NIVERSIDAD DE VALLADOLID

158

Tema 11.

Teoría de campos

Ejemplo 11.21. Se considera el campo escalar definido en U = (0, ∞) × (0, ∞) ⊂ R2 por f (x, y) = x y .

∞

Obviamente f es de clase C en U y ∇f (x, y) = (y, x) 6= (0, 0) , (x, y) ∈ U . Las curvas equipotenciales de f son ramas de hipérbola n co , c > 0, Sc = (x, y) ∈ U : y = x y las líneas de flujo de F = ∇f son las soluciones de la ecuación diferencial x′ (t), y ′ (t) = ∇f x(t), y(t) = y(t), x(t) , que son de la forma

x(t), y(t) = C1 et + C2 e−t , C1 et − C2 e−t ,

C1 , C2 ∈ R ,

y sus soportes son también ramas de hipérbolas que se describen implícitamente por x2 − y 2 = k ,

k ∈ R.

La ilustración 11.2 muestra algunas curvas equipotenciales de f , el campo de direcciones de ∇f y varias líneas de flujo de este campo en una región acotada de U . 6

4

y

2 f=9

f=4 f=1

0 0

2

x

4

6

Figura 11.2: Curvas equipotenciales de f (x, y) = x y y líneas de flujo de ∇f . Nótese que si el campo f (x, y) = x y se considera definido en todo R2 , el único punto en el que ∇f (x, y) = (0, 0) es el origen, intersección de los dos ejes coordenados cuya unión es precisamente el conjunto de nivel S0 = {(x, y) : f (x, y) = 0} , en el que degeneran las hipérbolas Sc cuando c → 0, y que no puede ser el soporte de una curva diferenciable en ningún entorno de x0 = (0, 0). Observación 11.22. Si F es el gradiente de un campo escalar f de clase C 2 en un abierto U de Rn , entonces se sigue del lema de Schwarz que ∂2f ∂2f ∂Fj ∂Fi (x) = (x) = (x) = (x) , ∂xj ∂xj ∂xi ∂xi ∂xj ∂xi

1 ≤ i, j ≤ n ,

x∈U.

Sin embargo, el recíproco no es necesariamente cierto, a no ser que se impongan condiciones adicionales sobre la geometría de U ; concretamente que U sea simplemente conexo. De forma coloquial, el hecho de que U sea simplemente conexo viene a decir que toda curva cerrada en U se puede deformar dentro de U y de forma continua (homotópicamente) en un punto. No entraremos en detalles, ya que en los casos prácticos habituales esta propiedad viene dada por otra más fuerte: la de ser estrellado (ver ejemplos 1.110). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

11.3.

159

Operadores diferenciales

Proposición 11.23 (Lema de Poincaré). Sea F un campo vectorial de clase C 1 en un abierto estrellado U de Rn . Entonces F es el gradiente de un campo escalar en U si, y sólo si, ∂Fj ∂Fi (x) = (x) , ∂xj ∂xi

x∈U,

i, j = 1, 2, . . . , n .

(11.2)

Observaciones 11.24. I)

La demostración teórica de la existencia de potenciales requiere de la noción de integral curvilínea que veremos más adelante, aunque la resolución práctica se reduce en la mayoría de los casos a un cálculo elemental de primitivas. Describiremos el procedimiento en el caso de que el abierto U sea un intervalo de R2 (acotado o no) y F un campo vectorial de clase C 1 que satisface las condiciones (11.2): En primer lugar, si ha de ser ∇f = F , entonces ∂f/∂x = F1 en U , por lo que, fijando la segunda coordenada y = y0 , es decir, al restringirnos a las rectas con vector director (1, 0), se tiene una familia de problemas de cálculo de primitivas en una variable, todos ellos relativos al mismo intervalo de R, Z f (x, y) = fy (x) = F1 (x, y) dx + C ; ahora bien, el número C, la constante (respecto de x) de integración, depende de y, por lo que la función potencial f debe ser de la forma Z f (x, y) = F1 (x, y) dx + C(y) .

Para determinar esta función C se procede de la misma manera, fijando ahora la abscisa x y observando que debe ser Z Z ∂f ∂F1 ∂ F2 (x, y) = F1 (x, y) dx + C ′ (y) = (x, y) = (x, y) dx + C ′ (y) , ∂y ∂y ∂y obteniéndose la última igualdad del teorema de derivación de integrales paramétricas, aplicable por la regularidad de F . Puesto que se verifica (11.2), la ecuación anterior se escribe Z ∂F2 (x, y) dx + C ′ (y) = F2 (x, y) + K(y) + C ′ (y) , F2 (x, y) = ∂x siendo K la constante de integración que depende de y por la misma razón expuesta antes. Esto permite calcular C como una primitiva de la función −K(y). Este procedimiento se generaliza a dimensiones mayores, determinando en cada paso sucesivo una función (una constante procedente del cálculo de una primitiva) que depende de una variable menos que en el anterior. Esto muestra también que dos potenciales de un mismo campo conservativo (en general, en un abierto conexo) difieren en una constante. II )

Como ya se indicó, la hipótesis de que el abierto sea estrellado (simplemente conexo, en general) no puede ser suprimida; esto se ilustra con el siguiente ejemplo: Consideremos el abierto U = R2 \ {0} y el campo F definido en U por −y x . F (x, y) = F1 (x, y), F2 (x, y) = , x2 + y 2 x2 + y 2 Es obvio que F es de clase C ∞ en U y un simple cálculo muestra que ∂F2 ∂F1 y 2 − x2 (x, y) = (x, y) , 2 = ∂y ∂x x2 + y 2

(x, y) ∈ U .

Asimismo, en un entorno de cada punto (x0 , y0 ) ∈ U con x0 6= 0, la función f (x, y) = arctg y/x es tal que ∇f = F y, por ejemplo, en el semiplano Π = {(x, y) ∈ R2 : x > 0}, f es un potencial de F . El problema es que esta función no puede extenderse de forma continua a todo el abierto U ; nótese que f (x, y) representa el ángulo que el vector (x, y) forma con el eje de abscisas, y si se pretende definir esta función de forma continua a lo largo de la circunferencia unidad, partiendo del punto (1, 0), en el que vale 0, y tras realizar un giro de 2 π radianes, se volvería al punto (1, 0) y se obtendría en él el valor 2 π 6= 0. U NIVERSIDAD DE VALLADOLID

160

Tema 11.

11.3.2.

Teoría de campos

Rotacional de un campo vectorial

Definición 11.25. Sea F = (F1 , F2 , F3 ) un campo vectorial de clase C 1 en un abierto U de R3 . Se define el rotacional de F como el campo vectorial ∂F ∂F2 ∂F1 ∂F3 ∂F2 ∂F1 3 rot F (x) = (x) − (x), (x) − (x), (x) − (x) , x ∈ U . ∂y ∂z ∂z ∂x ∂x ∂y Observaciones 11.26. I) II )

En la terminología anglosajona el rotacional se representa curl F . El siguiente determinante simbólico es útil para recordar la fórmula que define el rotacional ({e1 , e2 , e3 } denota la base ortonormal estándar de R3 ): e1 e2 e3 rot F = ∂/∂x ∂/∂y ∂/∂z . F F2 F3 1 Por esta razón el rotacional del campo F también se representa por ∇ × F .

Propiedades 11.27. Sean F = (F1 , F2 , F3 ), G = (G1 , G2 , G3 ) dos campos vectoriales y f un campo escalar, todos ellos de clase C 1 en un abierto U de R3 . Se verifica que: I)

rot(F + G) = rot F + rot G .

II )

Si c ∈ R, rot(c F ) = c rot F .

III)

rot(f F ) = f rot F + ∇f × F .

Observación 11.28. De lo anterior se deduce que el rotacional es un operador diferencial de C k (U, R3 ) en C k−1 (U, R3 ), k ≥ 1. Proposición 11.29. Si f es un campo escalar de clase C 2 en un abierto U de R3 , entonces rot(∇f ) = 0 . Definición 11.30. Se dice que un campo F = (F1 , F2 , F3 ) de clase C 1 en un abierto U de R3 es irrotacional si su rotacional es idénticamente nulo en U , es decir, rot F (x) = 0 para cada x ∈ U . Un campo conservativo de clase C 1 es, en virtud de la proposición anterior, irrotacional. El recíproco viene dado por el lema de Poincaré, que en este caso se escribe: Proposición 11.31. Sea F = (F1 , F2 , F3 ) un campo vectorial de clase C 1 definido en un abierto estrellado U de R3 . Entonces F es conservativo si, y sólo si, es irrotacional. Observaciones 11.32. I)

El concepto de rotacional se puede extender al caso de campos planos de la siguiente forma: si F (x, y) = P (x, y), Q(x, y) es un campo de clase C 1 en un abierto de R2 se define ∂P ∂Q (x, y) − (x, y) . rot F (x, y) = rot P (x, y), Q(x, y), 0 = 0 , 0 , ∂x ∂y

Con este convenio el lema de Poincaré se enuncia para campos planos como en el resultado 11.31; en este caso la función potencial depende únicamente de (x, y).

II )

LATV

El adjetivo ‘irrotacional’ no significa que el campo, o más bien sus líneas de flujo, no presente giros (esto nos restringiría a los campos que varían en una sola dirección), sino que se aplica en un sentido local. Intentaremos ilustrar esto con un ejemplo: imaginemos que un fluido contenido en una región del espacio R3 se mueve debido a los efectos de un campo de fuerzas (por ejemplo, un gas ionizado sometido a un campo magnético). Si dicho campo es irrotacional, los movimientos de las moléculas del gas, es decir, las líneas de flujo del campo, no presentarán remolinos o turbulencias. Una discusión más precisa puede encontrarse, entre otros, en el texto de Marsden y Tromba [33].

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

11.3.

11.3.3.

161

Operadores diferenciales

Divergencia de un campo vectorial

Definición 11.33. Sea F = (F1 , F2 , . . . , Fn ) un campo vectorial de clase C 1 en un abierto U de Rn . Se define la divergencia de F como el campo escalar div F (x) =

n X ∂Fj j=1

Formalmente,

∂xj

(x) =

∂F1 ∂F2 ∂Fn (x) + (x) + . . . + (x) , ∂x1 ∂x2 ∂xn

x∈U.

∂ ∂ ∂ , ,..., · (F1 , F2 , . . . , Fn ) , ∂x1 ∂x2 ∂xn razón por la que la divergencia de F también se representa por ∇ · F . div F = ∇ · F =

Propiedades 11.34. Sean F , G: U → Rn dos campos vectoriales y f un campo escalar, todos ellos de clase C 1 en el abierto U de Rn . I)

div(F + G) = div F + div G .

II )

Si c ∈ R, div(c F ) = c div F .

III )

div(f F ) = f div F + ∇f · F .

Observación 11.35. De lo anterior se deduce que la divergencia es un operador diferencial de C k (U, Rn ) en C k−1 (U, R), k ≥ 1. Proposición 11.36. Si F = (F1 , F2 , F3 ) es un campo vectorial de clase C 2 en un abierto U de R3 , entonces div(rot F ) = 0 . Definición 11.37. Se dice que un campo F = (F1 , F2 , . . . , Fn ) de clase C 1 en un abierto U de Rn es solenoidal o incompresible si su divergencia es idénticamente nula en U , div F (x) = 0

para cada x ∈ U .

A modo de recíproco de la proposición 11.36 (nótese la imposición geométrica): Proposición 11.38. Sea F = (F1 , F2 , F3 ) un campo vectorial de clase C 1 definido en un abierto estrellado U de R3 . Entonces F es el rotacional de otro campo vectorial si, y sólo si, F es solenoidal. Observaciones 11.39. I)

El adjetivo ‘incompresible’ se refiere a una propiedad de conservación de los volúmenes. La discusión que a continuación presentamos en R3 se generaliza sin dificultad a cualquier dimensión: Consideremos un campo vectorial F = (F1 , F2 , F3 ) de clase C 1 en un abierto U de R3 y K un subconjunto compacto de U . Supongamos que existe T > 0 tal que para cada punto x ∈ K existe la línea de flujo Φ(x, t) dada por ( γ ′ (t) = F γ(t) , t ∈ [0, T ], γ(0) = x.

Si para t ∈ [0, T ] fijo, Jx Φ(x, t) denota el jacobiano de Φ(x, t) respecto de las variables espaciales x = (x, y, z), resulta que Jx Φ(x, t) es derivable respecto del tiempo en [0, T ] y d Jx Φ(x, t) = div F Φ(x, t) Jx Φ(x, t) . dt Para cada instante t ∈ [0, T ], denotemos por Kt al conjunto ‘transportado’ por el flujo Kt = {Φ(x, t) : x ∈ K}

(K0 = K) ;

resulta que Kt es compacto, su volumen m(Kt ) es una función derivable respecto del tiempo en el intervalo [0, T ], y se tiene que ZZZ ZZZ ZZZ d d div F (y) dy , div F Φ(x, t) Jx Φ(x, t) dx = 1 dy = m(Kt ) = dt dt Kt K Kt U NIVERSIDAD DE VALLADOLID

162

Tema 11.

Teoría de campos

relación denominada fórmula de expansión de Euler, que se obtiene aplicando el teorema del cambio de variables para integrales triples y el teorema de derivación de integrales paramétricas. En consecuencia, si div F = 0 en U , el volumen de cada conjunto Kt es constante y coincide con el volumen de K0 = K. El teorema de la divergencia o de Gauss, relativo a integrales de superficie, arrojará más luz sobre este punto. II )

Si F = (F1 , F2 , F3 ), G = (G1 , G2 , G3 ) son campos vectoriales en un abierto de R3 tales que rot G = F (G al menos de clase C 1 ) se dice que G es un potencial vectorial de F . Nótese la analogía que existe entre el resultado 11.31 y el 11.38.

III)

La proposición 11.38, al igual que la 11.23, es una versión particular de un teorema global (que también recibe el nombre de lema de Poincaré, ver teorema 13.58). Al igual que sucede con los potenciales escalares, la búsqueda de potenciales vectoriales en el caso de que el abierto sea un intervalo se reduce al cálculo de primitivas, evitando la consideración de integrales curvilíneas. El procedimiento que mostramos a continuación se basa en el siguiente hecho: “Si G = (G1 , G2 , G3 ) es un campo de clase C 1 en el abierto estrellado U de R3 tal que rot G = F , entonces, para cualquier campo escalar f de clase C 2 en U se tiene que rot(G + ∇f ) = rot G + rot(∇f ) = F (ver proposición 11.29). Recíprocamente, si G1 , G2 son dos potenciales vectoriales de F en U , entonces G1 − G2 es el gradiente de un campo escalar, es decir, un campo conservativo”. Si el campo F = (F1 , F2 , F3 ) es de clase C 1 y solenoidal en el intervalo U de R3 , la ecuación rot G = F es el sistema de ecuaciones en derivadas parciales  ∂G ∂G2 3    ∂y − ∂z = F1 ,     ∂G3 ∂G1 − = F2 ,  ∂z ∂x       ∂G2 − ∂G1 = F3 . ∂x ∂y

Podemos suponer, por ejemplo, que G3 = 0; en efecto, al fijarR las coordenadas (x, y), puesto que z varía en un intervalo, la primitiva f (x, y, z) = − G3 (x, y, z) dz define un campo f en U tal que ∂f/∂z = −G3 , y sumando a la incógnita G el campo ∇f se obtiene un problema similar, pero ahora relativo a un campo incógnita de la forma (G1 , G2 , 0). De esta forma el sistema anterior se simplifica y es posible dar unas primeras expresiones para G1 y G2 a partir de las dos primeras ecuaciones y trasladar éstas a la tercera: Z  ∂G2  = F1 −→ G2 = − F1 dz + C2 (x, y) , −   ∂z    Z  ∂G1 = F2 −→ G1 = F2 dz + C1 (x, y) ,  ∂z   Z  ∂F  ∂C2 ∂F2 ∂C1  1  ∂G2 − ∂G1 = F3 −→ dz + − + − = F3 , ∂x ∂y ∂x ∂y ∂x ∂y siendo C1 y C2 las correspondientes constantes (respecto de z) de integración. Podemos suponer a continuación, por la misma razón que antes, que C2 = 0, con lo que ya hemos determinado G3 y G2 . Después, teniendo en cuenta que F es solenoidal, la última ecuación se escribe como Z ∂C1 ∂C1 ∂F3 dz − = F3 , es decir, F3 + D(x, y) − = F3 , ∂z ∂y ∂y

lo que permite obtener C1 como una primitiva de D respecto de y, Z C1 (x, y) = D(x, y) dy + E(x) .

Así se encuentra un potencial vectorial de F ; los demás se obtienen sumando gradientes a éste, tal y como se ha señalado más arriba.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

11.3.

11.3.4.

163

Operadores diferenciales

Laplaciano de un campo escalar

Definición 11.40. Sea f un campo escalar de clase C 2 en un abierto U de Rn . Se define el laplaciano de f como el campo escalar ∆f (x) = Formalmente,

n X ∂2f ∂2f ∂2f ∂2f (x) + (x) + . . . + (x) = (x) , ∂xj2 ∂x12 ∂x22 ∂xn2 j=1

∆f = div(∇f ) =

x∈U.

∂ ∂ ∂ ∂f ∂f ∂f , ,..., · , ,..., , ∂x1 ∂x2 ∂xn ∂x1 ∂x2 ∂xn

razón por la cual el laplaciano también se denota por ∇2 f .

Propiedades 11.41. Sean f, g dos campos escalares de clase C 2 en un abierto U de Rn . Se verifica que: I ) ∆(f + g) = ∆f + ∆g . II ) III )

Si c ∈ R, ∆(c f ) = c ∆f .

∆(f g) = f ∆g + g ∆f + 2 ∇f · ∇g .

Observaciones 11.42. I)

II )

De lo anterior se deduce que el laplaciano es efectivamente un operador diferencial de C k (U ) en C k−2 (U ), denominado operador de Laplace. Éste aparece en el estudio de numerosos problemas físicos, tales como la ecuación del calor. Las funciones f de clase C 2 en un abierto U de Rn que satisfacen ∆f (x) = 0 para cada x ∈ U,

se denominan armónicas (en U ).

Observación 11.43. Los operadores definidos sobre campos escalares se aplican a menudo en el cálculo a campos vectoriales; se entiende en este caso que se hace coordenada a coordenada, por ejemplo: ∆F = ∆(F1 , F2 , F3 ) = ∆F1 , ∆F2 , ∆F3 .

También es usual utilizar la notación del Álgebra Lineal para la simplificación de expresiones; por ejemplo, si G = (G1 , G2 , G3 ) es un campo, G · ∇ es el operador diferencial que actúa sobre un campo F = (F1 , F2 , F3 ) de la siguiente forma: (G · ∇)F = G · ∇F1 , G · ∇F2 , G · ∇F3 .

En añadidura a las propiedades 11.17, 11.27, 11.34 y 11.41, se relacionan a continuación una serie de fórmulas que son de uso constante en la Física Matemática. Propiedades 11.44. Sean f , g campos escalares y F , G, H campos vectoriales en un abierto de R3 , que se suponen tan regulares como sea necesario. I ) F × (G × H) = (F · H)G − (F · G)H. II )

III ) IV ) V) VI ) VII) VIII) IX ) X) XI ) XII)

H · (F × G) = G · (H × F ) = F · (G × H). rot(f ∇f ) = 0.

div(∆F ) = ∆(div F ). div(f ∇g − g∇f ) = f ∇2 g − g∇2 f .

∇(F · G) = (F · ∇)G + (G · ∇)F + F × rot G + G × rot F . div(F × G) = G · rot F − F · rot G.

div(∇f × ∇g) = 0.

rot(rot F ) = ∇(div F ) − ∇2 F .

rot(F × G) = (div G) F − (div F ) G + (G · ∇)F − (F · ∇)G. rot(∆F ) = ∆(rot F ). ∇(∆f ) = ∆(∇f ).

U NIVERSIDAD DE VALLADOLID

164

Tema 11.

Teoría de campos

Ejercicios 11.1 Demostrar las fórmulas que se relatan en las propiedades 11.44. 11.2 Supongamos que una partícula sigue la trayectoria helicoidal γ(t) = cos(π t) , sen(π t) , 2 t

siendo t el parámetro tiempo, y que en el instante t1 = 1 deja de actuar el campo que la acelera y se mueve a partir de entonces inercialmente. ¿En qué punto se encuentra la partícula en el instante t2 = 3 ? 11.3 En los casos siguientes se pide describir las curvas equipotenciales del campo escalar f (x, y) y las líneas de flujo del campo ∇f (x, y): I)

II )

f (x, y) = x − y 2

f (x, y) = x2 + y 2

11.4 En los casos siguientes se pide describir las superficies equipotenciales del campo escalar f (x, y, z) y las líneas de flujo del campo ∇f (x, y, z): I)

II )

f (x, y, z) = x + y + z

f (x, y, z) = x2 + y 2 − z 2

11.5 Sean F y G los campos vectoriales definidos en R3 por y

F (x, y, z) = (x + 1, y − 1, z − 2)

G(x, y, z) = (1, 2 x, 0) .

Para cada uno de ellos se pide: I) II )

Calcular las líneas de flujo del campo. Determinar el tubo de campo de la circunferencia Γ dada por y 2 + z 2 = 1 , x = 0 .

11.6 Se consideran los campos definidos en R3 por F (x, y, z) = (1, −1, z)

y

G(x, y, z) = (1, x, 0) .

Para cada uno de los dos casos se pide calcular: I) II )

Las líneas de flujo del campo. El tubo de campo asociado al cuadrado K = {(x, y, z) : x = 0, 0 ≤ y ≤ 1, 0 ≤ z ≤ 1}.

11.7 Se consideran los campos definidos en R3 por F (x, y, z) = (x y, y z, x z) , Calcular: I ) ∇f

II )

∇×F

III )

G(x, y, z) = x2 , 0, z 2

(∇ · F ) G

IV )

(F · ∇) G

y V)

Repetir el ejercicio con los campos F (x, y, z) = z 2 , x + z, x + y , G(x, y, z) = x2 , y + z, z

f (x, y, z) = x z 2 + y .

F · (∇f ) y

y

Probar que en R3 \ {0} se tiene que: I)

II ) III) IV ) LATV

y

F × ∇f .

f (x, y, z) = sen(x + y − z) .

11.8 Se consideran los campos R(x, y, z) = (x, y, z) = x e1 + y e2 + z e3

VI )

r(x, y, z) = kR(x, y, z)k =

p

x2 + y 2 + z 2 .

∇(rn ) = n rn−2 R

∇(log(r)) = r−2 R

∇2 (rn ) = n (n + 1) rn−2 div(rn R) = (n + 3) rn

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

165

11.9 Con la notación del ejercicio anterior, considérese en R3 \ {0} un campo central newtoniano, esto es, de la forma R(x, y, z) F (x, y, z) = K 3 r (x, y, z) 3 con K ∈ R, K 6= 0. Supongamos que γ: [a, b] → R es una línea de flujo de F , es decir, ′ γ (t) = F γ(t) para cada t ∈ [a, b].

I)

Si p > 0, deducir la ecuación diferencial que se obtiene de la anterior al parametrizar la curva mediante el cambio de parámetro u = θ(t) definido por Z t kγ ′ (s)kp ds , t ∈ [a, b] . θ(t) = a

II )

Resolver la ecuación anterior para un valor adecuado de p e interpretar el significado físico de lo observado.

11.10 Hallar el valor de las constantes a, b, c, tales que el campo F (x, y, z) = (x + 2 y + a z, b x − 3 y − z, 4 x + c y + 2 z)

verifica que rot F = 0. Demostrar que para estos valores F es el gradiente de un campo escalar que se ha de calcular. 11.11 Estudiar para qué valores α, β el campo vectorial βy 2 F (x, y, z) = α x y, x + ln(z), z definido en el abierto U = (x, y, z) ∈ R3 : z > 0 , es conservativo. Calcular sus funciones potenciales cuando proceda. 11.12 Demostrar que el campo

y p F (x, y) = arctg x2 + y 2 , ln x es conservativo en (0, ∞) × R y calcular sus potenciales. 11.13 En cada uno de los siguientes casos demostrar que el campo F es conservativo en R3 y calcular una función potencial: I)

F (x, y, z) = (y z cos(xy), x z cos(xy), sen(xy)) II ) F (x, y, z) = y z + x y 2 , x z + x2 y, z + x y . 2 2 2 2 III ) F (x, y, z) = ey , 2 x y ey + ez , 2 y z ez IV )

F (x, y, z) = 2 x y z + z 2 − 2 y 2 + 1, z x2 − 4 x y, x2 y + 2 x z − 2 .

11.14 Determinar, si es posible, un abierto de R3 donde el campo y z yz x z xz x y xy + − 2 , + − 2 , + − 2 F (x, y, z) = z y x z x y y x z

sea conservativo y calcular un potencial.

11.15 Estudiar si existe una función ϕ de clase C 1 en R2 para la que el campo F (x, y, z) = y z + x2 y 3 , x z + x3 y 2 , ϕ(x, y) sea conservativo. En ese caso, calcular una función potencial.

11.16 En cada uno de los siguientes casos demostrar que el campo F es conservativo en R4 y calcular una función potencial: I ) F (x, y, z, t) = y (1 + z) , x (1 + z) + z (1 + t) , y (1 + x + t) , y z ty ty tz tz ty tz II ) F (x, y, z, t) = e + 2 x , x t e − e , −y t e , x y e − y z e . U NIVERSIDAD DE VALLADOLID

166

Tema 11.

Teoría de campos

11.17 Demostrar que los siguientes campos son solenoidales en R3 y calcular potenciales vectoriales de cada uno de ellos. I) II ) III) IV )

F (x, y, z) = (1 − 2 z, 1, e−y )

F (x, y, z) = (y sen(y z), −z cos(x z), −x cos(x y)). F (x, y, z) = (2 y z, 2 z x, 2 x y)

F (x, y, z) = (y − z, z − x, x − y).

11.18 Se considera el campo definido en R3 por F (x, y, z) = 1 − x2 , x y, x z . I)

II )

Encontrar campos G, H: R3 → R3 de la forma G = (0, G2 , G3 ) , H = (H1 , H2 , 0) y tales que rot G = rot H = F . Calcular un potencial del campo G − H .

−y 11.19 Indicar un abierto de R3 en el que el campo F (x, y, z) = 0, 0, 2 sea el rotacional de x otro campo G, y hallar dicho campo G. 11.20 Se considera el campo vectorial

F (x, y, z) = f (x) + 2 x y, y z − y 2 , g(z) − z cos(x) ,

donde f y g son funciones de clase C 1 en R. Encontrar f y g, si es posible, para que div F = 0 y calcular para estas funciones f y g un potencial vectorial de F . 11.21 Se considera el campo vectorial F (x, y, z) =

x2 z , y z 2 − x y z, f (z) 2

,

donde f es una función de clase C 1 en R. Encontrar f , si es posible, para que div F = 0, y calcular para este valor de f un potencial vectorial de F . 11.22 Si F = rot G y H = ∇h, demostrar que el campo h F es solenoidal si, y sólo si, H es perpendicular a F en todo punto (todos los campos considerados se suponen definidos y suficientemente regulares en un mismo abierto V de R3 ). 11.23 Sean F , G : R3 → R3 dos campos de clase C ∞ . Demostrar que si F y G son proporcionales (paralelos) en cada punto, entonces F · rot G = G · rot F . 11.24 Encontrar un campo vectorial F tal que div F = 2 x + y − 1

y

rot F = (0, 1, 0) .

Tema 12

Integrales de línea La materia que se trata en este capítulo está estrechamente relacionada con conceptos físicos tales como el de trabajo y otros similares en los que interviene la noción de transporte, que se formaliza definiendo la integral de un campo (por ejemplo, de fuerzas) a lo largo de una curva (la trayectoria recorrida por una partícula).

12.1.

Integración de campos escalares

Sean I = [a, b] un intervalo compacto de R y γ: I → Rn una curva paramétrica. Una aproximación a la curva se puede conseguir fijando una partición del intervalo I, P = {t0 = a < t1 < t2 < . . . < tm−1 < tm = b} ,

y construyendo la poligonal que une los puntos del soporte de la curva que son imágenes de los de la partición; dicha poligonal es la concatenación de los segmentos de extremos γ(tj−1 ) y γ(tj ), con j = 1, 2, . . . , m. Su longitud, dada por el valor long(γ, P ) =

m X j=1

kγ(tj ) − γ(tj−1 )k ,

será una aproximación a lo que se llamaría la longitud de la curva. Parece lógico que al refinar la partición de P la aproximación poligonal a la curva mejore; la longitud de la nueva poligonal es mayor que la de la original (en virtud de la desigualdad triangular; véase la figura 12.1). Así, podemos dar la siguiente definición. Definición 12.1. Se dice que la curva paramétrica γ: [a, b] → Rn es rectificable si sup long(γ, P ) : P es una partición de [a, b]

es finito. En este caso, se define la longitud de la curva, denotada por ‘long(γ)’, como este superior.

Figura 12.1: Dos poligonales con vértices sobre la misma curva. Observación 12.2. Si θ: I → J es un cambio de parámetro, con I y J intervalos compactos, es claro que una partición de I induce una partición de J, y viceversa, sin más que tomar las imágenes de los puntos de la partición sj = θ(tj ). Por lo tanto, dos curvas paramétricas equivalentes serán simultáneamente rectificables o no rectificables, y si lo son, tendrán la misma longitud. 167

168

Tema 12.

Integrales de línea

Deducimos entonces que si un conjunto es el soporte de una curva paramétrica regular, no cerrada y simple, definida en un intervalo compacto, se puede hablar de su longitud, pues en virtud del teorema 11.6 dos cualesquiera de tales parametrizaciones serán equivalentes y dan lugar a la misma longitud. Para el caso de conjuntos que sean soporte de curvas paramétricas cerradas regulares y simples, dos parametrizaciones serán equivalentes sólo si coinciden sus puntos extremos, pero se puede probar que cualquier parametrización con esas propiedades, independientemente de cuáles sean sus extremos, da lugar a la misma longitud, cantidad que por tanto se puede considerar asociada al conjunto. Por ejemplo, la longitud de la circunferencia de ecuación x2 + y 2 = 1 será 2π, independientemente del punto en que se empiece a recorrer. Veremos a continuación que para cierto tipo de curvas es posible dar una fórmula sencilla para el cálculo de su longitud. Definición 12.3. Sea γ: [a, b] → Rn una curva paramétrica continua. Se dice que la curva es de clase C k a trozos (k ≥ 1) si existe una partición del intervalo [a, b], P = {a = ξ0 < ξ1 < . . . < ξm−1 < ξm = b} ,

k

tal que γ es de clase C y regular en cada intervalo [ξj−1 , ξj ] , j = 1, 2, . . . , m (en lo extremos las derivadas son laterales). Cuando no se necesite precisar el orden k ≥ 1, nos referiremos a ellas simplemente por curva regular a trozos. Observación 12.4. Es sencillo comprobar que si una curva paramétrica es de clase C 1 a trozos, también lo es cualquier otra curva paramétrica equivalente a ella. Como consecuencia del teorema de los incrementos finitos y de las propiedades de la integral de Riemann, se obtiene el siguiente resultado. Proposición 12.5. Sea γ: [a, b] → Rn una curva paramétrica de clase C 1 a trozos. Supongamos que γ1 , γ2 , . . . , γn son sus componentes, γ = (γ1 , γ2 , . . . , γn ) . Entonces γ es rectificable y su longitud viene dada por Z bq Z b ′ (12.1) γ1′ (t)2 + γ2′ (t)2 + · · · + γn′ (t)2 dt . kγ (t)k dt = long(γ) = a

a

Observaciones 12.6. I)

La integral que aparece arriba se debe entender como la suma m Z ξj X kγ ′ (t)k dt j=1

ξj−1

cuando la aplicación γ no sea de clase C 1 en todo el intervalo [a, b], sino en cada uno de los subintervalos [ξj−1 , ξj ] asociados a la partición P . Este mismo comentario será aplicable a las integrales que aparezcan de ahora en adelante en las que intervenga una curva de clase C 1 a trozos. II )

Con la notación anterior, las restricciones γ j de γ a los intervalos [ξj−1 , ξj ], j = 1, 2, . . . , m, son de clase C k y regulares, y lo que representa el sumatorio anterior es lo que dicta el sentido común: la longitud de γ es la suma de las longitudes de las curvas γ j . En situaciones como ésta, en que el punto final de cada curva γ j es el punto inicial de γ j+1 , se dice que γ es la suma de las curvas γ j y se representa por γ = γ 1 + γ 2 + . . . + γ m . Basándose en esta construcción tiene sentido hablar también, formalmente, de la ‘suma’ conjuntista de curvas Γj (esto es, de variedades elementales de dimensión 1), denotada por Γ = Γ1 + Γ2 + . . . + Γm , mediante su consideración como unión de los soportes de sus respectivas parametrizaciones γ j .

III)

Evidentemente, la fórmula (12.1) tiene sentido como integral impropia de Riemann, o como integral de Lebesgue, lo que se prefiera, de una función continua a trozos (medible, por tanto) y no negativa. Con el convenio habitual de asignar el valor ∞ a la integral en el caso de que no converja es posible extender la definición de longitud al caso de curvas parametrizadas en intervalos no compactos. Esto da cabida a situaciones sencillas y familiares: por ejemplo, una recta en el plano es el soporte de una curva paramétrica (de hecho, es una variedad diferenciable simple) de longitud infinita. Lo mismo sucede con la espiral de Arquímedes, parametrizada por t ∈ (0, ∞) 7→ t cos(t), t sen(t) .

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

12.1. IV )

Integración de campos escalares

169

Como ya se ha dicho antes, curvas paramétricas equivalentes tienen la misma longitud. Para curvas de clase C 1 a trozos esto se sigue también del teorema del cambio de variable: nótese que si γ: I → Rn y ϕ: J → Rn son curvas paramétricas equivalentes y θ: I → J es el cambio de parámetro de manera que ϕ ◦ θ = γ, con θ′ (t) 6= 0 para cada t ∈ I, entonces, en virtud de la regla de la cadena, γ es de clase C 1 en el subintervalo [ξj−1 , ξj ] de I si, y sólo si, ϕ es de clase C 1 en el subintervalo [θ(ξj−1 ), θ(ξj )] de J, y por tanto, si t 6= ξj , se tiene que γ ′ (t) = θ′ (t) ϕ′ θ(t) y kγ ′ (t)k = |θ′ (t)| kϕ′ θ(t) k .

El mismo argumento se utiliza para demostrar el siguiente lema.

Lema 12.7. Sean U un abierto de Rn , f un campo escalar continuo en U y γ: [a, b] → U , ϕ: [c, d] → U dos curvas paramétricas equivalentes de clase C 1 a trozos. Entonces Z d Z b f ϕ(s) kϕ′ (s)k ds . f γ(t) kγ ′ (t)k dt = c

a

Este resultado garantiza que un cambio de parámetro no altera el valor de la integral que se introduce en la siguiente definición. Definición 12.8. Sean U un abierto de Rn , f un campo escalar continuo definido en U y γ: [a, b] → U una curva paramétrica de clase C 1 a trozos. Se define la integral del campo f a lo largo de γ por Z b f γ(t) kγ ′ (t)k dt , a

y se representa por

Z

f dr

o

γ

Z

f. γ

Observaciones 12.9. I)

→

Es habitual denotar por r o r al campo de vectores de posición y por r al campo escalar krk. La función definida en [a, b] por dr(t) = kγ ′ (t)k

recibe el nombre de elemento de longitud asociado a la curva γ y mide la variación de la longitud de arco respecto al parámetro t. Las consideraciones realizadas al principio de esta sección para motivar la definición de longitud de una curva justifican esta notación, que a su vez da significado a la primera notación adoptada para la integral de campo a lo largo de una curva. II )

Si el compacto C es el soporte de una curva paramétrica γ simple y de clase C 1 a trozos, el teorema 11.6 y el lema 12.7 justifican la posibilidad de hablar sin ambigüedad de la integral del campo f a lo largo de C, que denotamos por Z f dr, para referirnos a

Z

C

f dr. γ

Los siguientes ejemplos pueden ilustrar el significado y utilidad que tiene la integral curvilínea de campos escalares. Ejemplos 12.10. I)

Supongamos que el soporte de la curva paramétrica γ: [a, b] → R3 representa un alambre de material no homogéneo. Si para cada t ∈ [a, b] ponemos γ(t) = x(t), y(t), z(t) , y el número ρ(t) = ρ γ(t) representa la densidad de masa en el punto γ(t), es decir, ρ es la función de densidad, entonces se define la masa total presente en el alambre mediante el valor Z Z b p x′ (t)2 + y ′ (t)2 + z ′ (t)2 dt. ρ x(t), y(t), z(t) ρ dr = γ

U NIVERSIDAD DE VALLADOLID

a

170 II )

Tema 12.

Integrales de línea

Si se piensa en el soporte de la curva paramétrica plana γ(t) = x(t), y(t) como la base de una valla tal que en cada punto γ(t) tiene altura h(t) = h x(t), y(t) , la integral Z Z b p x′ (t)2 + y ′ (t)2 dt h x(t), y(t) h dr = γ

a

es la definición habitual del área de la valla.

Propiedades 12.11. Sean U un abierto de Rn , f, g campos escalares continuos en U y γ: [a, b] → U una curva paramétrica de clase C 1 a trozos. Se verifica que: Z Z Z I) (f + g) dr = f dr + g dr . γ γ γ Z Z II ) Si c ∈ R , (c f ) dr = c f dr . γ γ Z Z III) f dr ≤ |f | dr ≤ sup{|f (x)| : x ∈ γ ∗ } long(γ) . γ

12.2.

γ

Integración de campos vectoriales

A diferencia del estudio realizado anteriormente, en lo que sigue será necesario tener en cuenta el “sentido” en que se recorren las curvas. Por poner un ejemplo sencillo, subir o bajar, siguiendo un mismo recorrido rectilíneo, supone ganar o perder energía potencial. Cuando se trata de rectas es sencillo precisar esa noción de sentido, basta elegir un vector director de la recta v para marcar un sentido, o −v para el sentido opuesto. El orden de la recta real se transfiere a mediante la parametrización t ∈ R 7→ x0 + t v. El concepto de orientación generaliza a curvas cualesquiera lo anterior. La idea es bien simple cuando se trata con curvas regulares: se trata de repetir el mismo argumento en las rectas tangentes en cada punto de la curva. Definición 12.12. Sean γ: I → Rn y ϕ: J → Rn dos curvas paramétricas equivalentes y θ: I → J el cambio de parámetro para el que γ = ϕ ◦ θ . Se dice que las dos parametrizaciones tienen la misma orientación si si θ′ (t) > 0 para cada t ∈ I, y se dice que corresponden a orientaciones opuestas si θ′ (t) < 0 para cada t ∈ I. Observaciones 12.13. I)

Nótese que, en las condiciones de la definición anterior, la propiedad de Darboux para las derivadas garantiza que θ′ ha de tener signo constante.

II )

La noción de orientación tiene una fácil interpretación geométrica: vectores tangentes correspondientes a parametrizaciones de la misma orientación tienen el mismo sentido: γ ′ (t) = θ′ (t) ϕ′ (θ(t)) = θ′ (t) ϕ′ (θ(t)) . Al cambiar la orientación cambia el sentido del vector tangente. De forma coloquial, el soporte de la curva se recorre en un sentido u otro dependiendo de la orientación.

III)

Cabe preguntarse si dado un conjunto que sea el soporte de una curva paramétrica es siempre posible asignarle de forma natural una orientación (y por tanto la opuesta). La respuesta es, en general, negativa. Por ejemplo, el soporte de la curva descrita en el ejemplo 11.3.II (esa especie de 8 o ∞ inclinado), se puede recorrer de 4 formas, que consisten en elegir en cada una de las componentes conexas de ϕ∗ \ {(0, 0)} una orientación. El quid de la cuestión es que, mientras que ϕ∗ no es una variedad diferenciable, cada una de esas dos componentes conexas sí lo es. Aunque el asunto de la orientación de variedades admite una formulación general, de momento enunciamos el siguiente resultado, relativo a las de dimensión 1 (ver el apéndice del texto de Milnor [35]).

Teorema 12.14. Toda curva diferenciable Γ (variedad de dimensión 1) en Rn es orientable. Concretamente, sobre Γ se pueden establecer dos orientaciones, que se corresponden con las dos formas posibles de fijar en cada punto x ∈ Γ un vector t(x) tangente a Γ y de norma 1, de manera que sea continua la aplicación x ∈ Γ 7→ t(x) ∈ Rn . LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

12.2.

Integración de campos vectoriales

171

Pasamos al problema de integrar campos vectoriales Definición 12.15. Sean U un abierto de Rn , F = (F1 , F2 , . . . , Fn ) un campo vectorial continuo en U y γ: [a, b] → U una curva paramétrica de clase C 1 a trozos. Se define la integral del campo F a lo largo de γ por Z b Z b F1 γ(t) γ1′ (t) + F2 γ(t) γ2′ (t) + . . . + Fn γ(t) γn′ (t) dt , F γ(t) · γ ′ (t) dt = a

a

y se representa por

Z

γ

o

F · dr

Z

γ

F1 dx1 + F2 dx2 + . . . + Fn dxn .

Si la curva γ es cerrada, la integral anterior se denomina también circulación del campo F a lo largo de γ y se representa por I I F · dr o F1 dx1 + F2 dx2 + . . . + Fn dxn . γ

γ

Observaciones 12.16. I ) Una vez más el teorema del cambio de variable para las integrales de Riemann garantiza que la integral que se acaba de definir no se altera si se cambia la parametrización por otra equivalente que corresponda a la misma orientación. II )

La integral que aparece en la definición 12.15 también tiene sentido en el caso de que se parametrice en un intervalo abierto (a, b), pero en el sentido impropio y, a priori, no se puede garantizar que sea convergente. Ahora bien, si converge absolutamente, el teorema del cambio de variable (en este caso en el sentido de Lebesgue), asegura que también lo hará, con el mismo valor, para cualquier otra parametrización equivalente y de igual orientación.

III )

Al igual que para las integrales de campos escalares a lo largo de curvas (véase la observación 12.9.II), se puede hablar de la integral Rde un campo vectorial F a lo largoR de una ‘curva geométrica orientada’ C, denotada por C F ·dr , y entendida como el valor γ F ·dr, donde γ es cualquier curva paramétrica simple y de clase C 1 a trozos, con soporte C, y que defina en el mismo la orientación prefijada. Otro tanto se puede decir para el caso mencionado en el apartado anterior que incluye, por ejemplo, el caso en que C sea una variedad diferenciable. En relación con esto último, es de destacar lo siguiente: Si Γ es una curva diferenciable elemental, para la que existe una carta (a, b), γ , con γ ∗ = Γ y tal que γ puede ser prolongada con carácter C 1 al intervalo compacto [a, b], se definen, con la misma terminología y notación de 12.15, Z Z Z Z f dr = f dr, F · dr = F · dr. Γ

γ

Γ

γ

En el segundo caso, se entiende que Γ se orienta de acuerdo con la parametrización γ. Estos objetos geométricos son curvas con borde; el borde de la curva es el conjunto de sus dos extremos si son distintos (por ejemplo, como en un segmento), o el vacío si coinciden (como sucede con las circunferencias); las variedades con borde vacío se denominan cerradas. Nótese que una curva diferenciable cerrada no puede ser simple en el sentido de la definición 10.1 (un intervalo abierto de R no puede ser homeomorfo a un compacto), aunque lo sea en el contexto menos restrictivo de la definición 11.1.

IV )

En muchos casos, la curva orientada C viene dada como conjunto (es decir, mediante su soporte) y consta de forma natural de subconjuntos C1 , C2 ,. . . , Cm cuya parametrización respectiva es sencilla (por ejemplo, C es un triángulo y C1 , C2 y C3 sus tres lados), digamos mediante curvas paramétricas γ j : [aj , bj ] → Rn simples, regulares y de clase C 1 , de modo que el extremo de γ 1 es el origen de γ 2 y así sucesivamente. Puesto que no se verificará en general que bj = aj+1 , dichas parametrizaciones no definen C como el soporte de una curva de clase C 1 a trozos, pero, de nuevo en virtud del teorema del cambio de variable, el cálculo de la integral a lo largo de C se puede obtener como m Z bj m Z X X F γ j (t) · γ ′j (t) dt . F · dr = j=1

U NIVERSIDAD DE VALLADOLID

γj

j=1

aj

172

Tema 12.

Integrales de línea

Proposición 12.17. Sean γ y ϕ curvas paramétricas equivalentes, de clase C 1 a trozos y que tienen orientaciones opuestas. Entonces, si F es un campo vectorial continuo en un abierto que contiene al soporte de las curvas, se tiene que Z Z F · dr = − F · dr . γ

ϕ

Observaciones 12.18. I)

El significado de la proposición anterior es obvio: con la notación de la definición 12.15, para s ∈ [a, b] el vector γ ′ (s) t(s) = kγ ′ (s)k

es un vector unitario tangente a la curva γ en el punto γ(s). La integral del campo F se escribe como la integral del campo escalar F γ(s) · t(s), que representa el módulo de la componente tangencial de F respecto a la curva: en efecto, de acuerdo con la notación introducida en la observación 12.9.I, Z Z Z b Z b ′ ′ F γ(s) · t(s) kγ (s)k dr(s) = F γ(s) · γ (s) ds = F · t) dr, F · dr = γ

a

a

γ

de manera que si se considera la orientación opuesta, es decir, la que corresponde al vector tangente unitario −t(s) en cada punto γ(s), el producto escalar que aquí aparece cambia de signo, cambio éste que se traslada a la integral.

II )

En la práctica, cuando se desea trabajar con una orientación concreta y la curva paramétrica γ de que se dispone no define la orientación deseada, no es necesario determinar una nueva parametrización congruente con la orientación, sino que basta calcular la integral del campo según la expresión dada en 12.15 y cambiar el resultado de signo.

III)

Cuando se manejan campos de fuerzas la integral a lo largo de una curva se denomina trabajo del campo a lo largo de la curva: si F es un campo de fuerzas (gravitatorio, eléctrico, etc.) definido en un abierto U de R3 y γ: [a, b] → U es una curva paramétrica, la integral de F a lo largo de γ representa el trabajo necesario para desplazar una partícula de masa (carga, etc.) unidad desde el punto x0 = γ(a) hasta el punto x1 = γ(b) siguiendo la trayectoria dada por γ. Este trabajo puede ser positivo o negativo dependiendo de que el movimiento se realice “en contra” o “a favor” del campo de fuerzas y, por supuesto, cambia de signo cuando se recorre la curva en sentido contrario, es decir, cuando se considera la orientación opuesta.

IV )

La siguiente discusión puede esclarecer el punto anterior, al tiempo que justifica la definición dada de integral de un campo. Si F es un campo de fuerzas constante definido en R3 y x0 , x1 son dos puntos de R3 , el producto escalar F · (x1 − x0 )

es el trabajo elemental necesario para desplazar una partícula a lo largo del segmento rectilíneo con origen x0 y extremo x1 . Si se considera una curva poligonal de vértices x0 , x1 , . . . , xm , el trabajo realizado al desplazar la partícula por dicha curva se define de m P F · (xj − xj−1 ) . En el caso de que el campo sea continuo pero forma obvia como j=1

no constante, y para curvas arbitrarias de clase C 1 a trozos, al considerar poligonales inscritas en la curva, teniendo en cuenta la continuidad uniforme de F en los compactos, y suponiendo que puntos consecutivos ‘disten poco’, es razonable aproximar el campo F en cada segmento de extremos xj−1 , xj por F (xj ), con lo que una aproximación al trabajo realizado es m X F (xj ) · (xj − xj−1 ) . j=1

Si la curva se parametriza por medio de γ: [a, b] → R3 , la elección de los vértices de la poligonal se puede hacer a través de una partición {a = t0 < t1 < . . . < tn−1 < tn = b} m P F γ(tj ) · γ(tj ) − γ(tj−1 ) . de [a, b] de modo que la expresión anterior se escriba como j=1

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

12.2.

173

Integración de campos vectoriales

Dada la continuidad uniforme de γ ′ en los compactos, al refinar las particiones tomando las diferencias tj −tj−1 suficientemente pequeñas, y usando el teorema de los incrementos finitos de Lagrange, esta suma puede ser aproximada por m X j=1

F γ(tj ) · γ ′ (tj ) (tj − tj−1 ),

que no es otra cosa que una suma de Riemann de la función (F ◦ γ) · γ ′ en [a, b]. Por último, al pasar al límite cuando el diámetro de las particiones tiende a 0, se obtiene la expresión con que se ha definido la integral de un campo a lo largo de una curva. Propiedades 12.19. Sean U un abierto de Rn , F , G dos campos vectoriales continuos en U y γ: [a, b] → U una curva paramétrica de clase C 1 a trozos. Se verifica que: Z Z Z I) (F + G) · dr = F · dr + G · dr . γ

II ) III )

Si c ∈ R ,

Z

γ

γ

(c F ) · dr = c

Z

γ

γ

F · dr .

Z F · dr ≤ sup{kF (x)k : x ∈ γ ∗ } long(γ) . γ

Proposición 12.20 (Regla de Barrow). Sean f un campo escalar de clase C 1 definido en un abierto U de Rn y γ: [a, b] → U una curva paramétrica de clase C 1 a trozos. Entonces Z ∇f · dr = f γ(b) − f γ(a) . γ

Corolario 12.21. Sean f un campo escalar de clase C 1 definido en un abierto U de Rn y γ 1 : [a, b] → U , γ 2 : [c, d] → U curvas paramétricas de clase C 1 a trozos, con γ 1 (a) = γ 2 (c) y γ 1 (b) = γ 2 (d), entonces Z Z γ1

∇f · dr =

γ2

∇f · dr .

Corolario 12.22. Sean f un campo escalar de clase C 1 definido en un abierto U de Rn . Si γ: [a, b] → U es una curva paramétrica cerrada (γ(a) = γ(b)) y de clase C 1 a trozos, entonces I ∇f · dr = 0 . γ

A modo de recíproco Proposición 12.23. Sean U un abierto conexo de Rn y F = (F1 , F2 , . . . , Fn ) un campo continuo en U . Son equivalentes los siguientes enunciados: a) F es conservativo en U (i.e., existe f ∈ C 1 (U ) tal que F = ∇f ).

b) Si γ 1 : [a, b] → U , γ 2 : [c, d]Z → U γ 1 (b) = γ 2 (d), entonces

γ1

sonZ curvas de clase C 1 a trozos, con γ 1 (a) = γ 2 (c) y F · dr . F · dr = γ2

c) Si γ: [a, b] → U es una curva cerrada y de clase C 1 a trozos, entonces

I

γ

F · dr = 0 .

Si además U es estrellado y F de clase C 1 , el siguiente aserto equivale a los anteriores: d) Para todos i, j = 1, 2, . . . , n se tiene que

∂Fj ∂Fi = . ∂xj ∂xi

Observación 12.24. Los resultados anteriores dan significado al adjetivo conservativo. De forma coloquial, para campos de fuerzas de este tipo, el trabajo necesario para desplazar una partícula desde una posición x0 hasta otra x1 no depende de la trayectoria seguida: la energía potencial está bien definida y depende únicamente de la posición. U NIVERSIDAD DE VALLADOLID

174

Tema 12.

12.3.

Integrales de línea

Fórmula de Riemann-Green

Los subconjuntos del plano con los que tratamos ahora son los que tienen borde o contorno; el borde es la frontera del subconjunto cuando ésta puede ser representada localmente como el soporte de una curva paramétrica regular a trozos. Los objetos planos cotidianos ilustran muy bien la nomenclatura: el borde de una hoja de papel, de la mesa, etc. Definición 12.25. Una curva de Jordan es el soporte de una curva paramétrica cerrada y simple en R2 . Se dice que un subconjunto D de R2 es un abierto de Jordan si es abierto, conexo, acotado y su frontera es unión disjunta de curvas de Jordan. En el caso de que Fr(D) esté constituido por el soporte de una sola curva de Jordan se dice que D es un dominio de Jordan. Si las curvas de Jordan que conforman la frontera de D son regulares a trozos, el conjunto Fr(D) se denomina también borde de D y se denota por ∂D. Definición 12.26. Sea D un abierto acotado de R2 . Se dice que D es simple o proyectable sobre un eje si existen dos funciones reales f y g, continuas en un intervalo [a, b], tales que D = {(x, y) : a < x < b, f (x) < y < g(x)}

o

D = {(x, y) : a < y < b, f (y) < x < g(y)} .

Es usual en la literatura existente encontrar la nomenclatura ‘tipo I’ o proyectable sobre el eje de abscisas y ‘tipo II’ o proyectable sobre el eje de ordenadas para referirse a los abiertos que son proyectables en uno u otro sentido, respectivamente. Observaciones 12.27. I)

II )

Los abiertos de Jordan y proyectables son dominios de Jordan; su frontera esla unión, a lo sumo, de los soportes de 4 curvas: 2 segmentos verticales y 2 grafos x, f (x) : x ∈ [a, b] los del tipo I, o 2 segmentos horizontales y 2 grafos f (y), y : y ∈ [a, b] los del tipo II (ver figura 12.2).

Son dominios proyectables sobre los dos ejes los círculos, los rectángulos, los triángulos y, en general, todo abierto de Jordan convexo. Pero un dominio puede ser proyectable sobre los dos ejes sin ser convexo (ver la tercera ilustración de la figura 12.2).

Tipo I: f (x) < y < g(x)

Tipo II: f (y) < x < g(y)

Tipo I y II.

Figura 12.2: Dominios proyectables sobre un eje. III)

Toda curva de Jordan es homeomorfa a una circunferencia. Los dominios de Jordan son simplemente conexos, es decir, su grupo fundamental es el trivial (de manera muy coloquial, no tienen agujeros). Merece la pena citar el teorema que dio fama a C. Jordan y que conjeturó en su Cours d’Analyse de 1893, si bien la prueba que presentó inicialmente era incorrecta. Actualmente se pueden encontrar numerosas demostraciones, desde algunas elementales, pero más o menos tediosas, hasta otras muy breves, pero que requieren de la potente herramienta homotópica u homológica. Esto sobrepasa las pretensiones de la asignatura y nos contentamos con presentar su enunciado, que es el siguiente: Teorema 12.28 (de la curva de Jordan). Sea C el soporte de una curva continua, cerrada y simple en R2 . Entonces su complemento R2 \ C tiene exactamente dos componentes conexas, una acotada y otra no acotada, ambas tienen a C por frontera. Por supuesto, si D es un dominio de Jordan, la componente conexa acotada de R2 \ ∂D es D, mientras que la componente conexa no acotada es el exterior de D.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

12.3. IV )

175

Fórmula de Riemann-Green

Los abiertos que son conexos, pero no simplemente conexos, se denominan múltiplemente conexos. El adjetivo “múltiple” se refiere a que, si el conjunto es acotado, su exterior tiene más de una componente conexa: por ejemplo, la corona circular C = {(x, y) ∈ R2 : 1 < x2 + y 2 < 4}

V)

es un abierto de Jordan múltiplemente conexo; su borde es la unión de las dos circunferencias centradas en el origen y de radios 1 y 2, respectivamente. Su exterior tiene dos componentes conexas Ω1 = B(0, 1) y Ω2 = R2 \ B(0, 2) . En lo sucesivo, aunque no se mencione explícitamente, los abiertos de Jordan considerados tendrán frontera regular a trozos; esto es necesario para poder hablar de la circulación de un campo a lo largo de ellas.

Cuando el soporte de una curva paramétrica es parte del borde de un abierto, es posible definir una orientación ‘natural’ relativa al conjunto; a ello va destinado el siguiente lema. Lema 12.29. Sean D ⊂ R2 un abierto de Jordan y x0 un punto frontera de D que es regular para la curva correspondiente de ∂D. Sean n1 y n2 = −n1 los dos vectores unitarios ortogonales a la recta tangente a ∂D en el punto x0 . Entonces uno sólo de estos dos vectores, que denotaremos por ne , verifica la siguiente propiedad: “Existe un número real ε > 0 tal que para cada λ ∈ (0, ε) se tiene que x0 + λ ne ∈ / D ”.

Definición 12.30. En las condiciones del lema anterior, al vector ne que verifica dicha propiedad lo denominaremos normal exterior a D en el punto x0 . La orientación natural o inducida en ∂D por D es la que corresponde en los puntos regulares de ∂D al vector tangente unitario t que forma un ángulo de amplitud π/2 con la normal \ exterior ne , esto es: (n e , t) = π/2 , o escrito con la notación de vectores columna, 0 −1 t= ne . 1 0 Ejemplos 12.31. I)

La orientación inducida en una circunferencia por el círculo que delimita es la que corresponde a parametrizaciones que la recorren en sentido antihorario (contrario al de las agujas del reloj). Lo mismo ocurre para cualquier dominio de Jordan (ver figura 12.3). En este contexto los adjetivos positivo o directo son sinónimos de antihorario.

II )

Si se considera la misma corona circular C dada en 12.28.IV, la orientación inducida en Γ2 = {(x, y) ∈ R2 : x2 + y 2 = 4} corresponde al sentido antihorario, mientras que en Γ1 = {(x, y) ∈ R2 : x2 + y 2 = 1} la orientación inducida por C es la que corresponde al sentido contrario (el de las agujas del reloj).

t ne

ne

ne

Figura 12.3: Orientación inducida en su borde por el abierto de Jordan D. Lema 12.32 (Fórmula de Riemann-Green para dominios simples). Sean D un dominio de Jordan proyectable sobre los dos ejes simultáneamente y F = (P, Q) un campo vectorial de clase C 1 en un abierto U que contiene a D = D ∪ ∂D. Entonces I I ZZ ∂Q ∂P − dx dy , (12.2) F · dr = P dx + Q dy = ∂y ∂D ∂D D ∂x cuando en ∂D se considera la orientación inducida por D. U NIVERSIDAD DE VALLADOLID

176

Tema 12.

Integrales de línea

Observaciones 12.33. I)

La igualdad (12.2), denominada fórmula de Riemann-Green o simplemente de Green, equivale a las dos igualdades I ZZ I ZZ ∂Q ∂P dx dy , dx dy , Q dy = P dx = − ∂D D ∂x ∂D D ∂y que se demuestran aplicando el teorema de Fubini y la regla de Barrow.

II )

Nótese que D \ D = ∂D es un conjunto de medida nula (ver ejercicio 5.23), así que toda función continua en el compacto D, que es integrable en él, lo será también en D y con la misma integral. Esto se aplica, en particular, a las derivadas parciales de P y Q, lo que da sentido a la integral en el miembro derecho de la fórmula de Riemann-Green.

III)

El hecho de que el campo F esté definido y sea de clase C 1 en un abierto que contiene a D ∪ ∂D es esencial, como se muestra en el siguiente ejemplo: Consideremos el disco D = B(0, 1) = {(x, y) ∈ R2 : x2 + y 2 < 1} que es un dominio de Jordan proyectable sobre los dos ejes y cuya frontera ∂D es la circunferencia

El campo vectorial

Γ = {(x, y) ∈ R2 : x2 + y 2 = 1} . F (x, y) = P (x, y), Q(x, y) =

x −y , x2 + y 2 x2 + y 2

es de clase C 1 en U = R2 \ {0}, que obviamente no contiene a D; sin embargo, la función ∂Q/∂x − ∂P /∂y , que es idénticamente nula en U , se puede extender de forma continua a todo R2 (recordemos que a efectos de integración se pueden redefinir funciones en conjuntos de medida nula) y un simple cálculo muestra que I ZZ ∂Q ∂P 2π = P dx + Q dy 6= dx dy = 0 . − ∂y ∂D D ∂x

Esto muestra también, según el corolario 12.22, que el campo F no es conservativo, cosa que ya se comprobó en el tema anterior (véase la observación 11.24.II). Definición 12.34. Sea A un abierto de Jordan de R2 tal que su borde ∂A se escribe como ∂A = Γ1 ∪ Γ2 ∪ . . . ∪ Γm ,

siendo cada Γj el soporte de una curva γ j cerrada, simple y de clase C 1 a trozos en la que se considera la orientación inducida por A. Si F = (P, Q) es un campo vectorial continuo en un abierto que contiene a ∂A, se define la circulación de F en el borde de A como m I m I X X F · dr , P dx + Q dy = j=1

que se denota por

I

γj

j=1

P dx + Q dy

γj

I

o

∂A

∂A

F · dr .

Teorema 12.35 (Fórmula general de Riemann-Green). Sean A un abierto de Jordan, y F = (P, Q) un campo vectorial de clase C 1 definido en un abierto U de R2 que contiene a A = A ∪ ∂A. Entonces I I ZZ ∂Q ∂P dx dy , (12.3) − F · dr = P dx + Q dy = ∂y ∂A ∂A A ∂x cuando en ∂A se considera la orientación inducida por A.

Corolario 12.36. En las condiciones del teorema anterior, si además se verifica que ∂Q ∂P (x, y) − (x, y) = 1 ∂x ∂y el área de A resulta ser m2 (A) =

LATV

I

∂A

F · dr =

para cada (x, y) ∈ A , I

P dx + Q dy . ∂A

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

12.3.

12.3.1.

Fórmula de Riemann-Green

177

Notas sobre la demostración del teorema de Riemann-Green

Todas las demostraciones elementales del resultado general que se encuentran en la literatura, por supuesto a partir de la versión débil del lema 12.32, consisten en extender primero la fórmula a una familia intermedia de abiertos, los que se pueden expresar como cadenas de dominios de Jordan proyectables. Una primera aproximación lúdica a esta idea nos la proporciona el juego Tangram (ver figura 12.4), que consiste en construir distintas regiones poligonales (abiertos de Jordan) uniendo de forma artística otras convexas: triángulos, un cuadrado y un trapecio, todos ellos dominios de Jordan.

−→

−→

Figura 12.4: El juego Tangram proporciona ejemplos de cadenas de dominios de Jordan. Paso 1 Extensión del resultado a cadenas de dominios Definición 12.37. Sea A un abierto de Jordan. Se supone que existe una familia finita {Dk : k = 1, 2, . . . , m} de dominios de Jordan tales que: I) II ) III ) IV )

m

A = ∪ Dk , k=1

Dk ∩ Dj = Ø si k 6= j ,

si el soporte de una curva está contenido en ∂Di ∩ ∂Dj , entonces las orientaciones que inducen Di y Dj en dicha curva son opuestas.

si el soporte de una curva yace en ∂Di ∩ ∂A, entonces la orientación que inducen A y Di en esa curva es la misma.

En estas condiciones, se dice que el abierto A es una cadena de dominios con borde, y se dice que el borde de D es una suma o cadena de curvas orientadas, lo que se representa por ∂A = ∂D1 + ∂D2 + . . . + ∂Dm . La expresión formal precedente se debe entender en el sentido de la condición III ), esto es, cuando una curva aparece en dos sumandos con orientaciones opuestas ambos términos se cancelan entre sí. Lema 12.38. Si A es una cadena de dominios con borde, tal que todos ellos son proyectables sobre los dos ejes, y si F = (P, Q) es un campo de clase C 1 en un abierto que contiene a A, entonces se verifica la fórmula de Riemann-Green (12.3). Con la notación de la definición 12.37, el término que se refiere a la integral doble de (12.3) resulta ser, en virtud de la aditividad de la integral respecto de los conjuntos, ZZ m ZZ ∂Q ∂P X ∂Q ∂P − − dx dy = dx dy , ∂y ∂y Dk ∂x A ∂x k=1

y en lo que respecta a la circulación del campo (P, Q) a lo largo de los bordes de cada uno de estos dominios, para las nuevas curvas que aparecen en una descomposición de este tipo existen índices j, k con j 6= k tales que la curva forma parte de ∂Dk con una orientación y de ∂Dj con la orientación opuesta (ver la figura 12.5); la integral en estas nuevas curvas no aporta nada en virtud de la proposición 12.17, y también I m I X P dx + Q dy = P dx + Q dy . ∂A

k=1

∂Dk

Puesto que la fórmula se verifica para cada uno de los dominios Dk , de las dos igualdades anteriores se sigue el resultado buscado. U NIVERSIDAD DE VALLADOLID

178

Tema 12.

Integrales de línea

Figura 12.5: Partición de un abierto de Jordan en dominios proyectables sobre los ejes. Paso 2-A Método de aproximación por poligonales Este procedimiento consiste en aproximar convenientemente el borde del abierto por curvas poligonales Γn , que serán el borde de abiertos “triangulables” An , esto es, que se pueden poner como cadenas de triángulos. Para estas regiones An se verifica la fórmula, en virtud del lema 12.38. Luego se aplica el teorema de Lebesgue para la integral doble, mientras que argumentos elementales (teorema de valor medio, etc.) basados en la regularidad a trozos del borde y su compacidad, muestran que las integrales curvilíneas a lo largo de las poligonales tienden hacia la integral en ∂A: ZZ ZZ I I ∂Q ∂P ∂Q ∂P dx dy = dx dy . − − F · dr = l´ım F · dr = l´ım n→∞ n→∞ Γ ∂y ∂y ↑ A ∂x An ∂x ∂A n Teo. 6.11

Paso 2-B Descomposición del abierto como cadena de dominios proyectables Este procedimiento consiste en escribir directamente el abierto de Jordan A como cadena de dominios proyectables sobre los dos ejes. Más exactamente, se trata de probar que eso siempre es posible; la figura 12.5 muestra una partición (en el sentido anterior) de un abierto de Jordan, cuya frontera ∂A es unión de tres curvas cerradas y simples, en subdominios proyectables sobre los dos ejes. Describimos brevemente el procedimiento: Supongamos que ∂D es un dominio de Jordan, concretamente, con borde ∂D que es el soporte de la curva continua γ: [a, b] → R2 , con γ(a) = γ(b) y tal que existen puntos a = t0 < t1 < . . . < tn = b en el intervalo [a, b] de manera que γ es de clase C 1 y regular en cada intervalo [ti−1 , ti ], i = 1, 2, . . . , n. En el caso de abiertos generales se razona igual añadiendo todas las curvas de ∂A. Por la compacidad de los intervalos [ti−1 , ti ], y la continuidad de γ ′ , aplicando el teorema de las funciones implícitas, según sea x′ (t) 6= 0 o y ′ (t) 6= 0 es posible considerar en cada [ti−1 , ti ] una partición ti−1 = si0 < si2 < . . . < simi = ti verificando la siguiente propiedad: “En cada intervalo [sij−1 , sij ] la relación (x, y) ∈ ∂D define una función implícita de clase C 1 , o bien y = y(x) , o bien x = x(y) ” Considerando todas las rectas horizontales y verticales que pasan por los puntos γ(sij ) (entre estos están los posibles “vértices” de ∂D) se obtiene una partición del plano en rectángulos {Rk : k ∈ N}. Puesto que D es acotado sólo una cantidad finita de índices k verifican que ◦

D∩ Rk 6= Ø ,

y resulta que cada una de esas intersecciones es, a su vez, unión finita de dominios proyectables sobre ambos ejes; la familia de todos esos dominios permite reconstruir D como una cadena con borde orientado en el sentido de la definición 12.37. Observación 12.39. Las dos vías presentadas entran en la categoría de elementales (esto no es sinónimo de sencillas) en el sentido de que sólo se necesitan los recursos de Cálculo Diferencial e Integral que se contemplan en un curso clásico de Análisis Matemático. Otra técnica más sofisticada consiste en emular el tratamiento de las variedades con borde de la Geometría Diferencial abstracta. De forma sucinta: el problema se reduce a uno local, a variedades simples, mediante particiones de la unidad; los sumandos de tales particiones son generalizaciones de las funciones meseta (ver ejercico 9.20). LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

Ejercicios

179

Ejercicios 12.1 Calcular la longitud de las curvas paramétricas siguientes: I ) γ(t) = a cos3 (t), a sen3 (t) , t ∈ [0, 2π] (astroide). t ∈ [0, 2π] (cicloide). II ) γ(t) = a t − sen(t) , a 1 − cos(t) , III ) γ(t) = eat cos(p t), eat sen(p t) , t ∈ [0, 1] (espiral).

12.2 Una representación polar o en coordenadas polares de una curva plana es una expre sión del tipo ρ = ϕ(θ), siendo ϕ(θ), θ las coordenadas polares de un punto genérico de la curva, tomando como parámetro θ ∈ [θ1 , θ2 ] y siendo ϕ positiva en ese intervalo, es decir, en coordenadas cartesianas γ(θ) = x(θ), y(θ) = ϕ(θ) cos(θ), ϕ(θ) sen(θ) , θ ∈ [θ1 , θ2 ] . Sea ρ = ϕ(θ), la expresión en coordenadas polares de una curva, siendo ϕ una función de clase C 1 en [θ1 , θ2 ]. Probar que la longitud de la curva viene dada por: Z θ2p ϕ′ (θ)2 + ϕ(θ)2 dθ . θ1

Calcular la longitud de las siguientes curvas dadas en coordenadas polares: I) II ) III )

ρ = a(1 + cos(θ)), θ ∈ [0, 2π]

(cardioide).

ρ = m θ, θ ∈ [a, b], a > 0, m > 0 (espiral de Arquímedes)).

ρ = e−θ , θ ∈ [0, 2π]

(espiral).

12.3 Sea y = f (x), x ∈ [x1 , x2 ], la ecuación explícita de una curva, siendo f de clase C 1 . Probar que la longitud de la curva viene dada por Z x2p 1 + f ′ (x)2 dx . x1

Calcular la longitud de las siguientes curvas: √ I ) y 2 = 4 x − x2 , entre los puntos (0, 0) y (1, 3). II )

III )

27 a y 2 = 4 x3 , entre los puntos (0, 0) y (3a, 2a), siendo a > 0. x2 = 2 p y, entre los puntos (0, 0) y (2p, 2p), siendo p > 0.

12.4 Calcular la integral del campo escalar f a lo largo de la curva que se cita, dada de forma paramétrica γ o como conjunto de puntos Γ, en los siguientes casos: I ) f (x, y) = xy ; γ(t) = cos(t), 2 sen(t) , t ∈ [0, π] . II )

f (x, y) = x − y ; Γ es el segmento de extremos (1, 0) y (2, −1). III ) f (x, y, z) = x z + y 2 ; γ(t) = t, et , t et , t ∈ [−1, 1] . 2 2 IV ) f (x, y, z) = x − (y − 1) ; Γ = (x, y, z) : x2 + (y − 1)2 = 1 , z = x + y .

12.5 Calcular la integral del campo F a lo largo de la curva correspondiente en los siguientes casos: I) II ) III ) IV ) V) VI )

F (x, y) = (y − x, y); Γ es el segmento de extremos (0, 0) y (1, 2). F (x, y) = x ey , x2 y ; γ(t) = (3 t, t2 ), t ∈ [0, 1]. F (x, y) = x ey , x2 y ; γ(t) = (t, 3), t ∈ [0, 2]. F (x, y) = x2 y, x y 2 ; Γ es la circunferencia de ecuación x2 + y 2 = 4. F (x, y) = x2 − 2 x y, y 2 − 2 x y ; Γ es la gráfica de y = x2 , recorrida desde el punto (−1, 1) hasta (1, 1). F (x, y) = x2 + y 2 , x2 − y 2 ; Γ es la curva de ecuación y = 1 − |1 − x|, recorrida desde el punto (0, 0) hasta (2, 0).

U NIVERSIDAD DE VALLADOLID

180

Tema 12.

Integrales de línea

F (x, y) = y 2 , x2 ; Γ es la curva definida implícitamente por x2 − y 2 = a2 , entre los puntos √ √ (a 2, a) y (a 2, −a). √ x y, x2 y 2 ; Γ es el borde del triángulo de vértices (0, 0), (1, 1) y (1, 0), recorrido VIII) F (x, y) = en sentido horario. IX) F (x, y) = (2 x (x + y), 2 y (x + y)); Γ es la curva definida en polares por ρ(θ) = θ, θ ∈ [0, π/2] . X ) F (x, y, z) = 0, 0, z/(x2 + y 2 ) ; γ(t) = a cos(t), a sen(t), t , t ∈ [0, 2π]. VII)

XI)

F (x, y, z) = (z, x, y); Γ es la curva intersección de las superficies x2 + y 2 + z 2 = 1

XII)

y

x + z = 1.

F (x, y, z) = (z, 0, 0); Γ es la parte de la curva intersección de x 2 + y 2 + z 2 = a2

x2 + y 2 = ax

y

contenida en el primer octante, y considerando como origen el punto (a, 0, 0). 12.6 Sea Γ la curva dada por z = x2 + y 2 ,

z = 2,

Calcular

z = x2 + y 2 ,

si y ≤ 0; Z Γ

x2 + y, yz, −

√ z = 2 − 2 2 y,

si y ≥ 0.

x2 + z · dr. 2

12.7 Determinar todas las circunferencias del plano R2 tales que la circulación del campo F (x, y) = y 2 , x2 a lo largo de dichas circunferencias sea nula.

12.8 Sea Γ la gráfica de y = x2 , x ∈ [−1, 1]. Si se considera el campo F (x, y) = exy (1 + xy), x2 exy ,

probar que

Z

Γ

F · dr = e +

1 . e

12.9 Se considera el campo F (x, y) = ex +

y 1 , + y , ex − y y − ex

definido en el conjunto de los puntos (x, y) ∈ R2 tales que ex − y 6= 0. Calcular la integral de F a lo largo del segmento que une los puntos (0, 2) y (1, 3). 12.10 Sean Γ1 la curva parametrizada por γ(t) = t + 1, sen(2 π t) + t2 , con t ∈ [0, 2], y Γ2 el segmento de extremos (1, 0) y (3, 4). Pongamos Z Z I1 = y dx + x + cos(y) dy, I2 = y dx + x + cos(y) dy. Γ1

Γ2

Determinar el mayor de los dos números I1 e I2 .

12.11 Calcular la circulación del campo F (x, y) = x2 , y 2 a lo largo de la curva Γ de ecuación implícita y2 x x2 + − 2 = 0, 2 2 a b a recorrida en sentido positivo. 12.12 Calcular la integral del campo F (x, y) = (y + y exy , x + x exy ) a lo largo de la curva (un arco de una de las denominadas espirales de Arquímedes) parametrizada en polares por ρ = θ, θ ∈ [0, 6 π]. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

181

Ejercicios

12.13 Probar que, si Γ es una elipse, la circulación del campo F (x, y) = y cos(x + y) − x y sen(x + y), x cos(x + y) − x y sen(x + y)

a lo largo de Γ es nula.

12.14 Calcular la integral del campo F (x, y) = a lo largo de la curva paramétrica dada por

y −1 , x2 x

γ(t) = sen2 (t) + 1, 2 sen2 (t) cos(t) entre los puntos (1, 0) y (2, 0).

12.15 Se considera el campo F (x, y) = 2x +

1 2y , , 2 x + y x + y2

definido en el conjunto de los puntos (x, y) ∈ R2 tales que x + y 2 6= 0. Calcular la integral de F a lo largo de todos los arcos de parábola que unen los puntos (1, 0) y (4, 0) y cuyo eje es paralelo a OY . 12.16 Calcular la circulación del campo F (x, y) = x y + yexy , x2 + y 2 + xexy a lo largo de la circunferencia de ecuación

x2 + y 2 − 2 R x = 0 . Sugerencia: Intentar expresar el campo como suma de otros dos, de manera que uno de ellos sea un gradiente y el otro de expresión sencilla.

12.17 Se considera el campo F (x, y, z) =

−

y+z 1 x−y , , 2 (x + z) x + z (x + z)2

definido en el abierto V = {(x, y, z) ∈ R3 : x + z 6= 0} . Calcular la integral de F a lo largo de la curva Γ parametrizada por x(t), y(t), z(t) = t , et , cos(t) , t ∈ [0, 1].

12.18 Calcular la integral del campo F (x, y, z) = x2 , y 2 , z 2 a lo largo de la parte de la curva intersección de las superficies √ x2 − 2 y z = 0 y y + z − 2x − 1 = 0 comprendida entre los puntos (0, 0, 1) y (0, 1, 0).

12.19 Calcular la circulación del campo 2 x(2 + x2 + y 2 ) 2 y(2 + x2 + y 2 ) F (x, y, z) = + y z, + x z, 2 z + x y 1 + x2 + y 2 1 + x2 + y 2

a lo largo de la curva Γ intersección de las superficies x2 + y 2 − z(x + y) = 0;

x + y + z − 1 = 0.

12.20 Calcular la integral del campo F (x, y, z) = 2x, 2y + z cos(yz), y cos(yz) a lo largo de la espiral Γ parametrizada por cos(t) sen(t) γ(t) = , ,t , 1+t 1+t U NIVERSIDAD DE VALLADOLID

t ∈ [0, 2π].

182

Tema 12.

Integrales de línea

12.21 Se considera la curva γ : [0, π] → R3 dada por γ(t) = et cos(t), et sen(t), et ,

t ∈ [0, π].

Si F es el campo

F (x, y, z) = yz + 2x(y 2 + z 2 ), xz + 2y(x2 + z 2 ), xy + 2z(x2 + y 2 ) ,

calcular la integral de F a lo largo de γ.

12.22 Sea Γ1 el segmento de extremos (0, 0) y (1, 0), y sea Γ2 la semicircunferencia de centro (1/2, 0) y radio 1/2, contenida en el semiplano superior y orientada en sentido antihorario. Calcular Z 2 x2 sen(x3 ) dx + e−y dy. Γ2

12.23 Se considera la curva Γ obtenida al sumar el segmento de extremos (1, 0) y (0, 1), el segmento de extremos (0, 1) y (−1, 0), y el arco de la circunferencia centrada en (0, 0) y de radio 1 contenido en el semiplano inferior (y < 0). Calcular la circulación del campo F (x, y) = (ex − y, x + y) a lo largo de Γ. 12.24 Sea D el recinto limitado por las curvas ρ1 (θ) = θ y ρ2 (θ) = θ/2, con θ ∈ [0, 2π], y por el segmento [π, 2π] del eje OX. I)

Si Γ es el borde de D, orientado en sentido natural, calcular Z y dx + x dy. Γ

II )

Calcular el área de D.

12.25 Hallar el área de las regiones limitadas por las curvas siguientes: I ) γ(t) = a cos3 (t), a sen3 (t) , t ∈ [0, 2π] (astroide). II )

ρ(θ) = a (1 + cos(θ)), θ ∈ [0, 2π] 2

(cardioide).

2

y x + 2 = 1, (a, b > 0) (elipse). a2 b IV ) La suma de la cicloide parametrizada por γ(t) = t − sen(t) , 1 − cos(t) , t ∈ [0, 2π], y el segmento (x, 0) : 0 ≤ x ≤ 2 π} .

III)

La curva de ecuación

12.26 Calcular la circulación del campo F a lo largo de la curva Γ en los siguientes casos: I ) F (x, y) = y 2 , x ; Γ es el borde del cuadrado [0, 2] × [0, 2]. II )

F (x, y) = (3 x + y, 2 y − x); Γ es la elipse 4 x2 + y 2 = 4.

F (x, y) = (3 x + y, 2 x − 1); Γ es la circunferencia de ecuación x2 + y 2 = 4. IV ) F (x, y) = ex cos(y), ex sen(y) ; Γ es el borde del cuadrado [0, 1] × [0, 1], recorrido en sentido horario.

III)

12.27 Sea D el interior de un polígono en el plano R2 . Determinar la orientación que ha de considerarse en la curva ∂D para que sea negativa la integral curvilínea Z sen(x) − arctg(y) dx + ex + cos(y) dy. ∂D

12.28 Si D =

2 2 (x, y) ∈ R2 : x /a2 + y /b2 < 1 , calcular el valor de ZZ (x4 + y 4 ) dx dy , D

escribiendo esta integral como la circulación de un campo. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

183

Ejercicios

12.29 Calcular la integral curvilínea Z 2 arctg y/x dx + x + log(x2 + y 2 ) dy, Γ

donde Γ es la circunferencia de centro (2, 0) y de radio 1, orientada en sentido positivo. 12.30 Transformándola en una integral curvilínea, calcular la integral doble ZZ (x2 − y 2 ) dx dy , D

2

2

siendo D = {(x, y) ∈ R : x > 0, y > 0, x + y 2 < r2 }, con r > 0. 12.31 Se consideran los campos F , G: R2 → R2 dados por F (x, y) = (2xy, x2 ),

I) II )

G(x, y, z) = (3xy, x2 ).

Demostrar que F es conservativo, pero G no lo es. Calcular un potencial del campo F . Se considera el subconjunto D de R2 dado por D = (x, y) ∈ R2 : x > 0, 1 < 4x2 + y 2 < 9 .

Si en ∂D se considera la orientación inducida por D, calcular las integrales Z Z F · dr y G · dr. ∂D

∂D

12.32 Sea D un abierto de R2 , dominio de Jordan y que contiene al disco cerrado B = B(0, 1). Aplicar la fórmula de Riemann-Green al abierto de Jordan D \ B y deducir el valor de I x −y dx + 2 dy . 2 + y2 x x + y2 ∂D 12.33 Se considera el abierto del plano dado por A = D1 ∪ D2 , donde

D1 = {(x, y) ∈ R2 : (x − 1)2 + y 2 < 4, (x + 1)2 + y 2 > 4} ,

I) II ) III )

D2 = {(x, y) ∈ R2 : (x − 1)2 + y 2 > 4, (x + 1)2 + y 2 < 4} .

Demostrar que la frontera de A es unión de soportes de curvas simples, cerradas y de clase C 1 a trozos, dando una parametrización para la orientación inducida por A. ¿Es A un abierto de Jordan? ¿Es Fr(A) una cadena de curvas orientadas? Probar que se verifica la fórmula de Green para el abierto A y aplíquese al cálculo de la circulación del campo F (x, y) = 3 y x2 , x3 + x + sen(y) a lo largo de la frontera de A.

12.34 Se considera el abierto de R2 siguiente: A = B(0, 1) \ {(x, 0) : 0 ≤ x} = (r cos(θ), r sen(θ)) : 0 < r < 1 , 0 < θ < 2 π I)

Comprobar que la frontera de A es unión de soportes de curvas de clase C 1 a trozos. ¿Es A un abierto de Jordan? ¿Es Fr(A) una cadena de curvas orientadas?

II )

Supóngase que F = (P, Q) es un campo definido y de clase C 1 en un abierto que contiene RR ∂Q a A. Probar que, no obstante, la integral A /∂x − ∂P /∂y dx dy se puede escribir como la circulación de F a lo largo de cierta curva.

III )

Más aun, incluso se puede relajar la hipótesis de regularidad de F : no es necesario que sea diferenciable en los puntos de la semirrecta {(x, 0) : 0 < x}, basta con que la función ∂Q/∂x − ∂P /∂y sea integrable en A. Sugerencia: Véase como Pac-Man cierra la boca:

U NIVERSIDAD DE VALLADOLID

Tema 13

Integración en superficies La materia que se trata en este capítulo, al igual que la relativa a integrales curvilíneas, es el marco abstracto en el que se sitúan numerosos conceptos de la Física, relacionados con modelos de diversa naturaleza, y donde el concepto de superficie aparece de forma natural al describir un conjunto de puntos del espacio (por ejemplo, una esfera metálica cargada eléctricamente), y también por idealización de otros conceptos (tal puede ser el caso de la medición del caudal de un río, es decir, del agua que fluye a través de una sección ideal de su cauce por unidad de tiempo). Aunque no hay inconveniente en hablar de superficies inmersas en Rn con n > 2, en lo sucesivo nos limitaremos al estudio de superficies en R3 , pues este es el caso que aparece en la inmensa mayoría de las aplicaciones y el ámbito donde se enmarcan los teoremas clásicos del Análisis Vectorial.

13.1.

Superficies paramétricas en R3

Una superficie diferenciable elemental S, para la que la carta (V, ϕ) constituya un atlas, es el conjunto imagen de la aplicación ϕ: V → R3 , siendo V un abierto conexo de R2 . Estudiaremos ahora las superficies desde este punto de vista, como resultado de parametrizaciones, al igual que en el caso de las curvas. Definición 13.1. Una superficie paramétrica de clase C k (k ≥ 0) en R3 es una aplicación ϕ: D → R3 , definida en el subconjunto abierto y conexo D de R2 , ϕ(u, v) = x(u, v), y(u, v), z(u, v) , (u, v) ∈ D ,

de clase C k en D, y localmente inyectiva. Se llama soporte de la superficie paramétrica al conjunto imagen de ϕ, que se denota por ϕ∗ , y se dice entonces que ϕ es una parametrización de su soporte. La superficie paramétrica es simple si es inyectiva (globalmente).

Definición 13.2. Con la notación de la definición anterior. Si la superficie es de clase C k con k ≥ 1, se pueden considerar para cada (u, v) ∈ D los vectores ∂x ∂x ∂ϕ ∂y ∂z ∂ϕ ∂y ∂z (u, v) = (u, v), (u, v), (u, v) y (u, v) = (u, v), (u, v), (u, v) , ∂u ∂u ∂u ∂u ∂v ∂v ∂v ∂v que si son no nulos se denominan vectores tangentes a la superficie en el punto ϕ(u, v) asociados a la parametrización ϕ. Se dice que dicho punto es regular si los vectores tangentes a la superficie en él son linealmente independientes (es decir, la matriz jacobiana de ϕ en el punto (u, v) tiene rango 2), o equivalentemente, si es no nulo su producto vectorial ∂ϕ ∂ϕ (u, v) × (u, v), ∂u ∂v en cuyo caso dicho vector se denomina vector normal a la superficie en el punto ϕ(u, v) asociado a la parametrización ϕ. Cuando todos los puntos de una superficie son regulares, decimos que la superficie es regular. Si ϕ(u, v) es un punto regular de la superficie, el plano que pasa por ϕ(u, v) y es generado por los dos vectores tangentes a la superficie en ese punto recibe el nombre de plano tangente a la superficie en el punto ϕ(u, v). 185

186

Tema 13.

Integración en superficies

Observación 13.3. Recordemos que dados dos vectores a = (a1 , a2 , a3 ) y b = (b1 , b2 , b3 ) de R3 se define su producto vectorial como el vector a × b = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ) .

Si {e1 , e2 , e3 } es la base estándar de R3 el producto simbólicamente mediante el determinante e1 e2 a × b = a1 a2 b1 b2

vectorial de a y b se puede representar

e3 a3 , b3

calculado desarrollando mediante los adjuntos de los elementos de la primera fila. Es evidente entonces que el producto vectorial no es conmutativo, concretamente b × a = −a × b , y que a × b = 0 si, y sólo si, a y b son linealmente dependientes. Además, el vector a × b es ortogonal a a y b simultáneamente. Lo anterior justifica el adjetivo normal (sinónimo de ortogonal) introducido en la definición precedente. Así pues, si p es un punto regular del soporte de una superficie paramétrica, el vector normal será un vector director del plano tangente a la superficie en el punto p. Diferentes superficies paramétricas pueden tener el mismo soporte. Al igual que en el caso de las curvas, interesa conocer si dos parametrizaciones de un mismo conjunto son “equivalentes”, en un sentido que les haga intercambiables a la hora de trabajar con los conceptos relativos a superficies. Definición 13.4. Se dice que dos superficies paramétricas, ϕ1 : D1 → R3 y ϕ2 : D2 → R3 , son equivalentes si existe un difeomorfismo θ de D1 en D2 de manera que ϕ2 ◦ θ = ϕ1 . En esta situación, θ recibe el nombre de cambio de parámetros. Observaciones 13.5. I)

Como ocurría para curvas, el hecho de que dos superficies paramétricas tengan el mismo soporte no implica que sean equivalentes, a no ser que verifiquen propiedades adicionales, por ejemplo, que sean cartas locales de una misma variedad diferenciable.

II )

Si ϕ1 : D1 → R3 y ϕ2 : D2 → R3 son superficies paramétricas equivalentes y θ: D1 → D2 es el cambio de parámetros que permite escribir ϕ1 = ϕ2 ◦ θ, por la regla de la cadena para cada (u, v) ∈ D1 se tiene que ϕ′1 (u, v) = ϕ′2 θ(u, v) ◦ θ ′ (u, v) .

Dado que J θ(u, v) 6= 0 para todo (u, v), resulta que un punto p en el soporte de S es regular o no independientemente de la parametrización escogida, y que, en caso de serlo, los vectores tangentes en p respecto a cada parametrización generan un mismo plano y dan lugar a vectores normales proporcionales.

III)

Más aún, en las condiciones anteriores, puesto que D1 es conexo, J θ debe tener signo constante en este abierto; que sea positivo o negativo es lo que sugiere la noción de orientación, que se da a continuación. También se presenta luego la definición general de orientación para una variedad diferenciable, pero enseguida nos concentramos en el caso que nos interesa (releer también la definición 12.12).

Definición 13.6. Sean ϕ1 : D1 → R3 y ϕ2 : D2 → R3 dos superficies paramétricas equivalentes y θ: D1 → D2 el cambio de parámetro para el que ϕ1 = ϕ2 ◦ θ . Se dice que las dos parametrizaciones tienen la misma orientación si si J θ(u, v) > 0 para cada (u, v) ∈ D1 , y se dice que corresponden a orientaciones opuestas si J θ(u, v) < 0 para cada (u, v) ∈ D1 . En cuanto al problema de asignar al soporte de una superficie paramétrica una orientación, el hecho de que en R2 no exista una relación de orden total compatible con la aritmética, impide hacerlo de forma natural a semejanza del caso de curvas (a las que se traslada el orden de la recta real). De nuevo, la condición más exigente de ser variedad diferenciable, permite definir dos orientaciones en una variedad que sea, además, elemental. Esta condición de poder ser representada por una sola carta es indispensable, como se muestra en los siguientes resultados. LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.1.

187

Superficies paramétricas en R3

Definición 13.7. Sea S una variedad diferenciable en Rn . Se dice que S es orientable si existe un atlas de S, {(Vi , ϕi ) : i ∈ I} , de modo que para cada par de índices i, j tales que ϕi (Vi ) ∩ ϕj (Vj ) 6= Ø se tiene que la aplicación de cambio de carta −1 θ j,i = ϕ−1 ϕi (Vi ) ∩ ϕj (Vj ) −→ ϕ−1 ϕi (Vi ) ∩ ϕj (Vj ) j ◦ ϕi : ϕi j

tiene determinante jacobiano positivo. En este caso el atlas {(Vi , ϕi ) : i ∈ I} se denomina atlas orientado de S.

Observación 13.8. Sobre una variedad orientable es posible determinar dos orientaciones opuestas que corresponden a dar sendos atlas donde los cambios de carta entre una parametrización del primero y otra del segundo tienen jacobiano negativo en todo punto. Nótese que todas las variedades elementales son orientables, pero existen variedades no orientables como, por ejemplo, la banda de Möbius. Teorema 13.9. Una superficie diferenciable S (variedad de dimensión 2) en R3 es orientable si, y sólo si, es posible asignar a cada x ∈ S un vector n(x) de norma 1, ortogonal al plano tangente a la superficie en x, y tal que sea continua la aplicación x ∈ S 7→ n(x) ∈ R3 . Corolario 13.10. Sea S una variedad de dimensión 2 en R3 definida de forma implícita por S = {(x, y, z) ∈ U : g(x, y, z) = 0} ,

donde g es una función real definida y de clase C 1 en un abierto U de R3 y tal que ∇g(x) 6= 0 para cada x ∈ U . Entonces S es orientable; es más, los campos de vectores normales unitarios n1 (x) =

∇g(x) k∇g(x)k

y

n2 (x) = −n1 (x),

x ∈ S,

proporcionan las dos orientaciones de la superficie (en el sentido de que, elegidos atlas que correspondan a cada una de las orientaciones de S, los vectores normales unitarios asociados a las correspondientes cartas son en un caso los dados por n1 , en el otro los dados por n2 ). Observación 13.11. Si consideramos una superficie susceptible de ser traspasada de un lado a otro, como el umbral de una puerta, fijar una orientación consiste en fijar un sentido de paso a través de la superficie. De forma un poco más rigurosa, el concepto de orientación tiene una fácil interpretación en términos del vector normal: digamos que S es el soporte de dos superficies paramétricas equivalentes, con la notación de la definición 13.6 ϕ1 (u, v) = ϕ2 (θ(u, v)) = ϕ2 (s(u, v), t(u, v)) ,

(u, v) ∈ D1 ,

y supongamos que p = ϕ1 (u, v) es un punto regular. La regla de la cadena y un sencillo cálculo de productos vectoriales muestran que ∂ϕ ∂s ∂t ∂ϕ2 ∂ϕ1 ∂ϕ2 1 (u, v) = × (u, v) + (u, v) θ(u, v) θ(u, v) ∂u ∂v ∂s ∂u ∂t ∂u ∂s ∂t ∂ϕ2 ∂ϕ2 × (u, v) + (u, v) θ(u, v) θ(u, v) ∂s ∂v ∂t ∂v ∂t ∂t ∂s ∂ϕ2 ∂ϕ2 ∂s θ(u, v) (u, v) (u, v) − (u, v) (u, v) × = ∂u ∂v ∂u ∂v ∂s ∂t ∂ϕ ∂ϕ2 2 = J θ(u, v) θ(u, v) , × ∂s ∂t de donde se deduce que los vectores normales en p correspondientes a parametrizaciones de la misma orientación tienen el mismo sentido, mientras que si las parametrizaciones tienen orientación distinta, los vectores normales tienen sentidos opuestos. En general, con igual o distinta orientación, la razón entre los módulos de los vectores ∂ϕ ∂ϕ ∂ϕ1 ∂ϕ2 2 1 θ(u, v) × × (u, v) y n2 = n1 = ∂u ∂v ∂s ∂t es J θ(u, v) , cantidad que juega aquí un papel parecido al que ostenta en la integración por cambio de variables. U NIVERSIDAD DE VALLADOLID

188

Tema 13.

13.2.

Integración en superficies

Integración de campos escalares

En Geometría Lineal, dado un paralelogramo P = {t a + s b ∈ R3 : 0 ≤ t ≤ 1, 0 ≤ s ≤ 1} , con a, b ∈ R3 linealmente independientes, se define su área, denotada por A(P ), como la norma del producto vectorial de a y b, A(P ) = ka × bk = k(a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 )k ,

obteniéndose, si a y b son ortogonales, la familiar fórmula para el área de un rectángulo. Esto sugiere la siguiente definición, cuya consistencia (independencia de parametrizaciones equivalentes) viene avalada por el teorema del cambio de variables y lo expuesto en la observación 13.11 Definición 13.12. Sea ϕ: D → R3 una superficie paramétrica de clase C 1 , regular y simple, con soporte S = ϕ∗ . Se define el área de S por

Z Z

∂ϕ ∂ϕ

du dv . × A(S) = (u, v)

∂u

∂v D Observaciones 13.13. I)

La función definida en el abierto D por

∂ϕ ∂ϕ

(u, v) × dσ(u, v) =

, ∂u ∂v

(u, v) ∈ D ,

recibe el nombre de elemento de área asociado a la superficie paramétrica ϕ: D → R3 , y mide la “variación local” del área. Por esta razón, aunque no sea la diferencial de ninguna función, se le denota de esa forma.

II )

La integral anterior tiene sentido por ser dσ medible (continua, de hecho) y positiva, con el convenio habitual de asignar el valor +∞ si dσ no es integrable en D.

III)

Como en el caso de las curvas y como sugiere la definición anterior, se identificará con frecuencia una superficie paramétrica simple y regular con su soporte, teniendo en cuenta que en los casos habituales de aplicación, dos parametrizaciones de este tipo de un mismo conjunto son equivalentes. De este modo, no habrá ambigüedad cuando algunos conceptos sean asociados indistintamente a una superficie paramétrica o a su soporte.

IV )

En el contexto de las variedades, la definición anterior es válida únicamente para superficies diferenciables elementales (dadas por una sola carta); no obstante, la definición puede ser generalizada para superficies arbitrarias, o para conjuntos que resulten de “pegar” los soportes de diferentes superficies paramétricas. Para justificar la pertinente definición, se presenta el siguiente lema, una adaptación del teorema de Sard (ver ejercicio 5.23) y que, coloquialmente hablando, dice que el área de las curvas es nula.

Lema 13.14. Supongamos que S el soporte de una superficie paramétrica de clase C 1 , regular y simple, ϕ: D → R3 , y que el compacto C ⊂ D es el soporte de una curva paramétrica de clase C 1 , regular y simple α: [a, b] → D, de manera que también D \ C es conexo. Entonces, si Γ es el soporte de la curva γ = ϕ ◦ α, A(S) = A(S \ Γ) Definición 13.15. Sea S una variedad diferenciable de dimensión 2 en R3 con S = S 1 ∪ S 2 ∪ . . . ∪ S n ∪ Γ1 ∪ Γ2 ∪ . . . ∪ Γm ,

siendo la unión disjunta y tal que: I)

Para cada j = 1, 2, . . . , n , Sj es el soporte de una superficie paramétrica de clase C 1 , regular y simple, parametrizada por la carta (Dj , ϕj ).

II )

Para cada k = 1, 2, . . . , m , Γk es el soporte de una curva paramétrica de clase C 1 , regular y simple.

Se define el área de S como n ZZ n X X A(Sj ) = A(S) = j=1

LATV

j=1

∂ϕj

∂ϕj

du dv . × (u, v)

∂u

∂v Dj

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.2.

189

Integración de campos escalares

Observaciones 13.16. I ) El número real positivo (o +∞) que resulta de la expresión anterior es independiente de la partición que se haga de la superficie S y, en consecuencia, la definición es coherente. Por ejemplo, para calcular el área de una esfera se puede proceder utilizando una carta en coordenadas esféricas que la parametriza por completo excepto en un arco de circunferencia que une el polo norte con el polo sur, o también calculando el área de los dos hemisferios cuya unión es la esfera menos el ecuador, otra curva regular. II )

A la vista de los resultados obtenidos respecto a la longitud de una curva, parece tentador construir el área de una superficie de forma análoga, es decir, como el superior de áreas de superficies poliédricas “ajustadas” a la superficie y de manera que el área de las caras tienda hacia 0. Puesto que tres puntos no alineados determinan un plano en R3 , es lógico considerar aproximaciones poliédricas tales que sus caras sean triángulos. Sin embargo, a diferencia del caso unidimensional, en el que los puntos de la curva se ordenan trasladando el orden de la recta real dado en el intervalo de parametrización, en este contexto no existe una forma natural de “triangular” la superficie, y uno se encuentra con resultados sorprendentes como el del siguiente ejemplo, debido a Schwarz (1890). Consideremos el cilindro C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 , 0 < z < 1} , que es una variedad de clase C ∞ y dimensión 2 cuyo área, según la definición anterior, es 2 π. Inscribiremos en C una familia de poliedros construidos de la siguiente manera: Si n, m ∈ N, consideremos los n + 1 planos Πk de ecuación z = k/n, 0 ≤ k ≤ n , y en cada uno de ellos los vértices de un polígono de m lados inscrito en la circunferencia {x2 + y 2 = 1 , z = k/n}, de manera que la generatriz del cilindro que pasa por uno de estos vértices en Πk biseque el ángulo subtendido por dos vértices sucesivos de los polígonos en los planos Πk+1 y Πk−1 . La superficie poliédrica Sn,m (ver la figura 13.1) se obtiene como unión de los 2 n m triángulos isósceles cuyos vértices son dos consecutivos de uno de los polígonos, que distan entre sí 2 sen π/m , y el tercero se encuentra en el polígono inmediatamente superior o inferior. Todos ellos tienen igual área, que resulta ser π 2 πr 1 π πr 1 4 + 1 − cos = sen + 4 sen , sen m n2 m m n2 2m y por tanto el área de Sn,m es π r π 2 m sen . 1 + 4 n2 sen4 m 2m Si se toma m = n y se hace tender n hacia ∞ la expresión anterior converge hacia 2 π (el área de C); si se hace n = m2 también converge pero hacia un número distinto; por último, si se toma n = m3 el área de las superficies poliédricas Sn,m tiende a +∞.

Πk+1

Πk Figura 13.1: Superficie poliédrica Sn,m inscrita en el cilindro C. Definición 13.17. Sean S una superficie diferenciable elemental parametrizada por (D, ϕ), y f un campo escalar continuo en un abierto U de R3 que contiene a S. Si la función (f ◦ ϕ) dσ es integrable en D se define la integral de f en S por ZZ ZZ

∂ϕ ∂ϕ

f ϕ(u, v) dσ(u, v) du dv = f ϕ(u, v) × (u, v) du dv , ∂u ∂v D D y se denota por Z Z f dσ

S

U NIVERSIDAD DE VALLADOLID

o simplemente

f.

S

190

Tema 13.

Integración en superficies

Observaciones 13.18. I)

El teorema del cambio de variables garantiza que la definición anterior es consistente, no depende de la parametrización elegida para S. En cuanto a condiciones de integrabilidad, en la mayoría de los casos de aplicación viene garantizada por la naturaleza particular del problema; por ejemplo, si el área de S es finita y el campo f es acotado.

II )

El ejemplo siguiente puede ilustrar el origen del concepto de integral de superficie que se acaba de definir. Supongamos que S representa una superficie cargada eléctricamente, parametrizada por (D, ϕ), y que para cada (u, v) ∈ D el número qR ϕ(u, v) representa la densidad de carga en el punto ϕ(u, v) ∈ S. Entonces el valor de S q dσ no es otra cosa que la carga total soportada por la superficie.

Propiedades 13.19. Sean S una superficie diferenciable elemental en R3 y f , g campos escalares continuos en un abierto U de R3 que contiene a S. Se verifican: Z Z Z I) (f + g) dσ = f dσ + g dσ . S S S Z Z (c f ) dσ = c f dσ . II ) Si c ∈ R , S S Z Z |f | dσ ≤ sup{|f (x)| : x ∈ S} A(S) . f dσ ≤ III) S

S

Observaciones 13.20. I)

La integral de la función idénticamente igual a 1 en una superficie S es precisamente el área de S.

II )

La integración de campos escalares en variedades no elementales se realiza según el mismo procedimiento expuesto en 13.15 (para estas integrales se tiene un análogo del lema 13.14), verificándose igualmente las propiedades anteriores.

13.3.

Integración de campos vectoriales

Recordemos que sobre una superficie elemental S en R3 es posible dar dos orientaciones que corresponden, dada una parametrización (D, ϕ) de S, a considerar el campo de vectores normales unitarios ∂ϕ ∂ϕ × (u, v) ∂u ∂v

n = n ϕ(u, v) =

∂ϕ ∂ϕ

∂u × ∂v (u, v)

o su opuesto −n . Estos vectores unitarios son independientes de la parametrización (lo que depende de la parametrización es el elemento de área dσ), así que se puede hablar sin ambigüedad de los vectores normales unitarios, n(x) y −n(x), en cada punto x de la superficie. Una superficie orientada es una superficie S en la que se ha hecho la elección de uno de los dos campos continuos de vectores normales unitarios (véase el teorema 13.9). Una vez fijado el campo n, si se dispone de una carta (D, ϕ) que defina esa misma orientación, se tiene la siguiente igualdad en D ∂ϕ ∂ϕ × = dσ n ∂u ∂v Definición 13.21. Sean S una superficie diferenciable elemental y orientada en R3 , parametrizada por (D, ϕ) de forma coherente con su orientación, y F = (F1 , F2 , F3 ) un campo vectorial definido y continuo en un abierto U de R3 que contiene a S. Si el campo escalar F · n es integrable en S, se define la integral de F en S o el flujo de F a través de S por ZZ ZZ ∂ϕ ∂ϕ F ϕ(u, v) · (u, v) du dv = F ϕ(u, v) · n(u, v) dσ(u, v) du dv , × ∂u ∂v D D y se representa por Z

S

LATV

F · n dσ

o

Z

S

F1 dy ∧ dz + F2 dz ∧ dx + F3 dx ∧ dy .

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.3.

Integración de campos vectoriales

191

Observaciones 13.22. I) II )

La consistencia de la definición 13.17 avala la de la definición 13.21. Nótese que el flujo de F a través de S recoge la aportación de la componente normal u ortogonal de F respecto de S; concretando más, el campo F se descompone, respecto del plano tangente a S en cada punto, TS (p), como suma ortogonal F = T F + NF siendo N F = hF , ni n dicha componente normal y T F = F − N F la componente tangencial, es decir, la proyección ortogonal de F en TS (p). En la cuantificación del flujo de F a través de S no importa la magnitud de la componente tangencial T F .

III )

Fijada una parametrización (D, ϕ) de S, el integrando que define el flujo de F es, en cada (u, v) ∈ D, el producto mixto de F ϕ(u, v) con los dos vectores tangentes asociados a dicha parametrización: F1 F2 F3 ∂z ∂x ∂x ∂y ∂y ∂z ∂x ∂y ∂z ∂u ∂u ∂u ∂u ∂u ∂u + F2 + F3 ; ∂u ∂u ∂u = F1 ∂z ∂x ∂x ∂y ∂y ∂z ∂x ∂y ∂z ∂v ∂v ∂v ∂v ∂v ∂v ∂v ∂v ∂v esto nos puede servir para justificar la segunda notación indicada que, por otra parte, tiene pleno sentido en el contexto más general de las formas diferenciales.

Proposición 13.23. Sea S una superficie diferenciable elemental en R3 y denotemos por S + y S − las dos superficies orientadas asociadas a S. Si F es un campo vectorial definido y continuo en un abierto U de R3 que contiene a S, entonces Z Z F · n dσ = − F · n dσ . S+

S−

Observación 13.24. La definición de flujo de un campo dada anteriormente contempla el caso de superficies elementales. Una vez más, al tratar con variedades orientables, el concepto de integral se extiende considerando una descomposición de la variedad del tipo ya indicado en la definición 13.15, S = S 1 ∪ S 2 ∪ . . . ∪ S n ∪ Γ1 ∪ Γ2 ∪ . . . ∪ Γm ,

y definiendo en este caso

Z

S

F · n dσ =

n Z X j=1

Sj

(13.1)

F · n dσ .

Obsérvese que la orientación dada en S determina de forma unívoca una orientación en cada una de las superficies Sj . En la práctica, si se dispone de parametrizaciones de cada una de ellas, (Dj , ϕj ), j = 1, 2, . . . , n , lo único que hay que hacer es comprobar si estas corresponden con la orientación considerada; si no es así, se efectúa el cálculo del sumando correspondiente según la expresión dada en la definición 13.21 y se cambia de signo el resultado según indica la proposición anterior. Nótese que hablamos de variedades orientables, pues a diferencia de lo que ocurre con las superficies elementales, existen variedades de dimensión 2 no orientables. Además, la definición dada para el flujo a través de una superficie orientable es independiente de la descomposición (13.1) que se haga de ella. Propiedades 13.25. Sean S una superficie diferenciable elemental y orientada en R3 y F , G dos campos vectoriales continuos en un abierto U de R3 que contiene a S. Se verifica que: Z Z Z G · n dσ . F · n dσ + (F + G) · n dσ = I) S S S Z Z II ) Si c ∈ R , (c F ) · n dσ = c F · n dσ . S S Z F · n dσ ≤ sup{kF (x)k : x ∈ S} A(S) . III ) S

U NIVERSIDAD DE VALLADOLID

192

Tema 13.

13.4.

Integración en superficies

Superficies con borde. Teorema de Stokes

Consideremos una superficie diferenciable elemental y orientada M en R3 , representada por la parametrización (V, ϕ), compatible con la orientación. Sea también D un abierto de Jordan (conexo, por tanto) en R2 con D = D ∪ ∂D ⊂ V . La restricción de ϕ a D, que seguiremos denotando igual por comodidad, proporciona una nueva superficie elemental S, representada por la carta (D, ϕ) y contenida en M ; además, la orientación fijada en M se traslada a S (el vector normal unitario considerado es el mismo). Si el borde de D se escribe como la unión disjunta ∂D = Γ1 ∪ Γ2 ∪ . . . ∪ Γm ,

siendo cada Γj el soporte de una curva cerrada, simple y regular a trozos, su imagen por ϕ, ϕ(∂D) = ϕ(Γ1 ) ∪ ϕ(Γ2 ) ∪ . . . ∪ ϕ(Γm ) ,

es la unión de m curvas del mismo tipo en R3 ; concretamente, si γ j : [aj , bj ] → V es una parametrización de Γj , j = 1, 2, . . . , m, que da la orientación inducida en Γj por D, entonces ϕ ◦ γ j : [aj , bj ] → R3 proporciona una parametrización de ϕ(Γj ). Definición 13.26. En las condiciones anteriores se dice que S es una superficie orientada (elemental) con borde. El conjunto ϕ(∂D) se denomina borde de S y se denota por ∂S. Por último, la orientación dada en cada una de las curvas ϕ(Γj ) por ϕ ◦ γ j se denomina orientación inducida en el borde por la orientación de S.

S n M ϕ V

D Figura 13.2: Superficie elemental S con borde.

Observaciones 13.27. I)

El concepto de borde tiene un significado geométrico similar al dado para abiertos de Jordan en el plano: el borde de S es lo que separa S ∪ ∂S de su complementario en M , esto es, su frontera en la superficie M (véase la figura 13.2). La orientación inducida por S en su borde corresponde a la familiar regla del sacacorchos, que pasamos a describir. Sea p0 = ϕ(x0 ) un punto de ∂S, con x0 ∈ ∂D, y supongamos, sin pérdida de generalidad, que x0 es un punto de una de las curvas Γj que forman ∂D, parametrizada por γ j : [aj , bj ] → V , siendo x0 = γ j (t0 ), t0 ∈ (aj , bj ). Puesto que x0 es regular, podemos considerar la recta r normal a Γj en x0 orientada de modo que tiene por vector director la normal exterior ne correspondiente a ∂D en x0 . Por ser V abierto existe ε > 0 de modo que la aplicación η: [−ε, ε] → V , dada por η(t) = x0 + t ne ,

t ∈ [−ε, ε],

parametriza un segmento de r que contiene a x0 . Este segmento en V se transforma por ϕ en una curva contenida en M , parametrizada por ϕ ◦ η, y cuyo vector tangente en p0 = ϕ(x0 ) = ϕ(γ j (t0 )) es, según la regla de la cadena, (ϕ ◦ η)′ (t0 ) = ϕ′ (x0 ) η ′ (t0 ) = ϕ′ (x0 ) ne .

Este vector, perteneciente al plano tangente a M en p0 , se podría denominar el ‘vector normal exterior a S en p0 ’ cuando se considera M como el espacio ambiente de referencia, LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.4.

193

Superficies con borde. Teorema de Stokes

en analogía con el vector normal exterior en un punto de la frontera de un abierto de Jordan. Pues bien, la regla del sacacorchos establece que en cada punto p0 ∈ ∂S el producto vectorial de la normal exterior a S en p0 por el vector tangente a ∂S en p0 asociado a la orientación inducida (ambos en el plano tangente a M ) ha de ser un vector en la misma dirección y sentido que el vector normal unitario a M en estos puntos para la orientación original de M . II )

Aunque la definición anterior se ha dado en términos de una parametrización fija, el borde de una superficie es un concepto geométrico que no depende de la parametrización que se proporcione para dicha superficie. Por ejemplo, si el hemisferio S = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1 , z > 0}

se parametriza por la aplicación p (x, y) 7→ x, y, 1 − x2 − y 2 ,

(x, y) ∈ D = B(0, 1) ,

esta parametrización no puede ser extendida de forma diferenciable a un abierto más grande que D; sin embargo, S es una superficie con borde cuyo borde ∂S es el ecuador, es decir, la circunferencia C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 , z = 0}

(imagínese que S es el cuenco de una copa, su borde es lo que está en contacto con la mesa al colocarla boca abajo), lo cual se puede verificar fácilmente haciendo uso de la proyección estereográfica desde el polo sur (ver figura 13.3): 2u 2v 1 − u2 − v 2 ψ(u, v) = , , . 2 2 2 2 1 + u + v 1 + u + v 1 + u2 + v 2

Siguiendo la pauta de notación de la definición 13.26, pongamos V = R2 ,

D = {(u, v) ∈ R2 : u2 + v 2 < 1} ,

Γ = ∂D = {(u, v) ∈ R2 : u2 + v 2 = 1} .

Es fácil comprobar que

ψ(V ) = M = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1 , z > −1} ,

ψ(D) = S ,

z=0

ψ(Γ) = C = ∂S .

(u,v)

Tomando como origen el punto (0, 0, −1), el polo sur de la esfera de ecuación x2 + y 2 + z 2 = 1, se trazan semirrectas que pasan por el resto de los puntos de la esfera. Estas semirrectas cortan al plano {z = 0} en un punto cuyas primeras coordenadas (u, v) se toman como parámetros.

Figura 13.3: Proyección estereográfica desde el polo sur. El siguiente resultado es consecuencia del teorema de Riemann-Green, al que generaliza. Teorema 13.28 (de Stokes para superficies elementales). Sea S una superficie elemental con borde. Si F es un campo vectorial de clase C 1 definido en un abierto U de R3 que contiene a S ∪ ∂S, entonces I Z S

rot F · n dσ =

∂S

F · dr ,

cuando en ∂S se considera la orientación inducida por la de S.

U NIVERSIDAD DE VALLADOLID

194

Tema 13.

Integración en superficies

Observaciones 13.29. I)

En la igualdad anterior, denominada fórmula de Stokes o del rotacional, el término de la derecha se entiende como la suma de las circulaciones a lo largo de cada una de las curvas que componen el borde de S, y se pueden calcular como integrales de Riemann ordinarias (usando cualquier parametrización equivalente de ellas, no necesariamente ϕ ◦ γ j ), por ser el campo F continuo y dichas curvas compactas. El término de la izquierda, si se usa la parametrización (D, ϕ) de la definición 13.26, conduce a la integral de una función continua en un compacto D ⊂ R2 ; de nuevo, el teorema del cambio de variables garantiza la integrabilidad de rot F (ψ(α, β)) · n dσ(α, β) en el abierto Ω, relativa a cualquier otra parametrización (Ω, ψ) equivalente de S.

II )

Cuando se considera una superficie contenida en el plano {z = 0} dada por ϕ(x, y) = (x, y, 0) , (x, y) ∈ D, y un campo plano F = (P, Q, 0), la fórmula de Stokes no es otra cosa que la fórmula de Green. De hecho, la demostración del teorema anterior se basa en el de Riemann-Green. Como en aquel caso, la descomposición del abierto D en dominios simples (ver definición 12.37), D = D1 ∪ . . . ∪ Dn , conduce a considerar n superficies con borde, Sk = ϕ(Dk ), k = 1, 2, . . . , n ; las circulaciones a lo largo de las nuevas curvas que aparecen en el borde común a dos de estas superficies, ∂Sk ∩ ∂Sj , se cancelan, pues las orientaciones que sobre ellas inducen una superficie y la otra son opuestas. Esto sugiere la siguiente definición que permite generalizar la fórmula de Stokes a otros objetos más complicados, y en particular al contexto de variedades.

Definición 13.30. Sean S1 y S2 dos superficies elementales con borde dadas, del mismo modo que en la definición 13.26, por las parametrizaciones (D1 , ϕ1 ) y (D2 , ϕ2 ), respectivamente, y disjuntas, es decir, tales que S1 ∩ S2 = ϕ1 (D1 ) ∩ ϕ2 (D2 ) = Ø .

Supongamos además que ∂S1 ∩ ∂S2 es unión finita disjunta (posiblemente vacía) de soportes de curvas de clase C 1 a trozos y simples, y que el conjunto C = ∂S1 ∪ ∂S2 \ (∂S1 ∩ ∂S2 )

es unión finita (posiblemente vacía) de soportes de curvas de clase C 1 a trozos y simples. En estas condiciones, se dice que S = ϕ1 (D1 ) ∪ ϕ2 (D2 ) \ C es la superficie suma de S1 y S2 , o que es la cadena compuesta por las superficies S1 y S2 , denotada por S = S1 + S2 . También se dice que C es el borde de S, denotado por C = ∂S. Iterando el proceso se define la suma o cadena de k superficies elementales con borde S1 + S2 + . . . + Sk .

Definición 13.31. Sea S = S1 + S2 + · · · + Sk la superficie suma de k superficies elementales con borde. Supongamos que es posible considerar en cada una de ellas una de sus dos orientaciones de modo que para cada par de índices 1 ≤ i, j ≤ k con i 6= j y tales que ∂Si ∩ ∂Sj 6= Ø se tiene que las orientaciones inducidas en ∂Si ∩ ∂Sj por Si y Sj son opuestas. Entonces se dice que S es orientable, y la orientación resultante en ∂S, el borde de la cadena S, se denomina orientación inducida por S. Si la cadena S es conexa y orientable, entonces admite exactamente dos orientaciones, correspondientes a considerar las orientaciones de las Si mencionadas anteriormente o las opuestas, lo que repercute del mismo modo en el borde de S, cambiando su orientación. Ejemplos 13.32. I)

Denotemos por S1 y S2 a los dos hemisferios de la esfera unidad S = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}

dados por S1 = S ∩ {(x, y, z) ∈ R3 : z > 0} y S2 = S ∩ {(x, y, z) ∈ R3 : z < 0} . Resulta que S1 ∩ S2 = Ø y ∂S1 = ∂S2 (ver observación 13.27.II), así que resultando que S1 + S2 = S. LATV

∂S1 ∪ ∂S2 \ (∂S1 ∩ ∂S2 ) = Ø ,

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.4.

195

Superficies con borde. Teorema de Stokes

Como variedad diferenciable S es orientable (ver corolario 13.10). Veamos que el concepto de orientación dado en la definición 13.31 coincide con ese otro. En efecto, si S1 y S2 se orientan según los vectores normales n1 y n2 , respectivamente, dados ambos por n(x) = n(x, y, z) = (x, y, z) ,

x ∈ S1

o

x ∈ S2 ,

la orientación que induce S1 en su borde, Γ1 , es la que corresponde a recorrer la circunferencia {(x, y, z) ∈ R3 : x2 + y 2 = 1 , z = 0} en sentido antihorario cuando se la observa desde arriba, y la que induce S2 en el suyo, Γ2 , es la opuesta (véase la figura 13.4); nótese que al definir el vector normal unitario en S1 y S2 de esta forma, es posible extenderlo con continuidad a todo S.

n1 n

S1 S

Γ1 Γ2

S2 n2

Figura 13.4: Una esfera es una cadena de superficies elementales. Hemos obtenido así la variedad S como suma de superficies elementales, y que resulta ser una cadena orientable con borde vacío. A este tipo de cadenas se las denomina cerradas o sin borde. II )

Consideremos las dos superficies de R3 dadas por S1 = {(x, y, z) : x2 + y 2 = 1 , 0 < z < 1} ,

S2 = {(x, y, z) : x2 + y 2 < 1 , z = 0}

(una porción de cilindro y un disco abierto en el plano {z = 0}, respectivamente). Resulta evidente que S1 ∩ S2 = Ø; el borde de S1 es la unión de dos circunferencias Γ0 y Γ1 , de radio 1 y situadas en los planos {z = 0} y {z = 1}, respectivamente, y el borde de S2 es Γ0 = {(x, y, z) ∈ R3 : x2 + y 2 = 1 , z = 0}. Entonces ∂S1 ∪ ∂S2 \ (∂S1 ∩ ∂S2 ) = Γ1 .

La suma S = S1 + S2 es una cadena de superficies cuyo aspecto es el de un vaso; si S1 se orienta según el vector normal n1 (x, y, z) en la misma dirección y sentido que (x, y, 0) , y S2 según el vector normal n2 (x, y, z) = (0, 0, −1) , entonces la orientación que induce S1 en Γ0 es la que corresponde a recorrer esta circunferencia en sentido antihorario cuando se la observa desde arriba, y la que induce S2 es la opuesta, resultando que S es orientable, y que la orientación inducida en su borde ∂S = Γ1 es la que se obtiene al recorrer esta circunferencia en sentido horario, de nuevo observada desde arriba. Nótese que ahora es imposible definir un vector normal unitario en todo S de forma continua; dicho de otra forma, en los puntos de S que corresponden a la parte común de los bordes de S1 y S2 no es posible definir un plano tangente a la superficie y, a diferencia del ejemplo anterior, esta cadena de superficies no es una variedad diferenciable. Definición 13.33. Sean S = S1 + S2 + · · · + Sk una cadena orientable de superficies en la que se ha fijado una de las orientaciones posibles, y F un campo vectorial definido en un abierto U de R3 que contiene a S. Se define la integral de F en S o el flujo de F a través de S por Z k Z X F · n dσ = F · nj dσ , S

j=1

Sj

donde para cada j = 1, 2, . . . , k , nj es el vector normal unitario asociado a la orientación que en cada Sj corresponde a la orientación dada en S. U NIVERSIDAD DE VALLADOLID

196

Tema 13.

Integración en superficies

Las propiedades listadas en 13.25 son también válidas para cadenas de superficies. Enunciamos ahora la versión general del teorema de Stokes. Teorema 13.34 (de Stokes). Sean S una cadena orientable de superficies y F un campo vectorial de clase C 1 definido en un abierto U de R3 que contiene a S ∪ ∂S. Entonces Z I rot F · n dσ = F · dr , S

∂S

cuando en ∂S, el borde de S, se considera la orientación inducida por S.

Corolario 13.35. En las condiciones del teorema anterior, si S es una superficie cerrada (es decir, si ∂S = Ø), entonces Z S

rot F · n dσ = 0 .

Observaciones 13.36. I)

La demostración del teorema de Stokes para cadenas se realiza, por supuesto, haciendo uso de la primera versión enunciada en 13.28 para superficies elementales, sin más que aplicarla a cada una de las superficies elementales que conforman la cadena S. De nuevo las circulaciones a lo largo de curvas que no están contenidas en ∂S se cancelan al ser consideradas dos veces pero con orientaciones opuestas.

II )

El último corolario se obtendrá también para campos de clase C 2 como caso particular del teorema de la divergencia, del que nos ocupamos en la última sección.

III)

En Geometría Diferencial el borde de una variedad se define en términos de cartas locales, pero no entraremos en detalles, pues la versión del teorema de Stokes para cadenas abarca, en la práctica, los casos relativos a estos objetos y a otros muchos más no contemplados en el caso abstracto, como las superficies poliédricas habituales o porciones de ellas. Por ejemplo, la familia de caras laterales de una pirámide cuya base es un polígono de n lados es una cadena de n superficies elementales.

13.5.

Teorema de Gauss-Ostrogradski

Definición 13.37. Sea V un subconjunto abierto y conexo de R3 . Se dice que su frontera es regular a trozos si el conjunto Fr(V ) es una cadena de superficies orientable y cerrada. En estas condiciones Fr(V ) se denomina también borde de V y se denota por ∂V . Los abiertos con frontera regular a trozos son los que se contemplan en la teoría que tratamos ahora; entre ellos destacan por su simplicidad los que describimos a continuación. Definición 13.38. Sea V un abierto conexo y acotado de R3 . Se dice que V es simple, o proyectable sobre un plano coordenado, si existe un abierto de Jordan D y funciones reales f, g continuas en D y tales que f (u, v) ≤ g(u, v) para cada (u, v) ∈ D, de modo que el conjunto V se puede describir mediante una de las expresiones siguientes: V o V o V

= = =

{(x, y, z) ∈ R3 : (x, y) ∈ D, f (x, y) < z < g(x, y)}

(proyectable sobre OXY )

3

{(x, y, z) ∈ R : (x, z) ∈ D, f (x, z) < y < g(x, z)} (proyectable sobre OXZ) {(x, y, z) ∈ R3 : (y, z) ∈ D, f (y, z) < x < g(y, z)} (proyectable sobre OY Z) .

Sobre el borde de un abierto V se puede establecer una orientación relativa al conjunto V de forma natural, determinando en los puntos regulares un vector normal unitario como indica el siguiente resultado. Lema 13.39. Sean V un abierto de R3 con frontera regular a trozos y x0 un punto en una de las superficies elementales que forman la frontera de V . Sean n1 y n2 = −n1 los dos vectores unitarios normales a ∂V en el punto x0 . Entonces uno sólo de estos dos vectores, que denotaremos por ne , verifica la siguiente propiedad: “Existe un número real ε > 0 tal que para cada λ ∈ (0, ε) se tiene que x0 + λ ne ∈ / V ”.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.5.

Teorema de Gauss-Ostrogradski

197

Definición 13.40. En las condiciones del lema anterior, al vector ne que verifica dicha propiedad se le denomina normal exterior a V en el punto x0 . La orientación natural o inducida en ∂V por V es la que corresponde a este vector normal en cada punto de cualquiera de las superficies elementales que forman la frontera de V . Lema 13.41. Sea V un abierto acotado de R3 con frontera regular a trozos y proyectable simultáneamente sobre los tres planos coordenados. Sea también F un campo vectorial de clase C 1 definido en un abierto U de R3 que contiene a V = V ∪ ∂V . Si en ∂V se considera la orientación inducida por V , entonces ZZZ Z div F dx dy dz = F · n dσ . V

∂V

Observaciones 13.42. I)

La igualdad anterior, conocida con el nombre de fórmula de Gauss-Ostrogradski o de la divergencia, equivale a las tres igualdades Z Z ZZZ ∂F1 dx dy dz , (F1 , 0, 0) · n dσ = F1 dy ∧ dz = ∂V ∂V V ∂x Z Z ZZZ ∂F2 dx dy dz , (0, F2 , 0) · n dσ = F2 dz ∧ dx = ∂y Z∂V Z∂V Z Z ZV ∂F3 dx dy dz , (0, 0, F3 ) · n dσ = F3 dx ∧ dy = ∂V ∂V V ∂z

que se demuestran fácilmente para este tipo de abiertos, cuya adherencia es compacta, mediante el teorema de Fubini y la regla de Barrow.

II )

El hecho de que el campo F esté definido y sea de clase C 1 en un abierto que contiene a V ∪ ∂V es esencial, como se ilustra con el siguiente ejemplo que es, por otra parte, un caso particular de un familiar resultado de Física, la ley de Gauss.

Ejemplo 13.43. Consideremos la bola abierta unidad V = B(0, 1) ∈ R3 , que es un abierto proyectable sobre los tres planos. Su frontera es la esfera unidad S, una cadena orientable de superficies (ver el ejemplo 13.32), y cuya orientación inducida (la dada por la normal exterior) resulta ser en este caso la que corresponde a considerar en cada punto (x, y, z) ∈ S el vector normal (unitario) ne (x, y, z) = (x, y, z). El campo F definido en U = R3 \ {0} por 1 y z x = , , F (x, y, z) = r(x, y, z) , kr(x, y, z)k3 (x2 + y 2 + z 2 )3/2 (x2 + y 2 + z 2 )3/2 (x2 + y 2 + z 2 )3/2

donde r(x, y, z) = (x, y, z) , es de clase C 1 en su dominio U , y se comprueba sin dificultad que div F (x) = 0 ,

x 6= 0 .

A pesar de que V no está contenido en U , tiene perfecto sentido la integral ZZZ div F dx dy dz , V

puesto que el integrando está definido c.s. en V , y obviamente el valor de la integral es 0. Por otra parte, un sencillo cálculo muestra que el flujo de F a través de S es Z Z Z 1 dσ = A(S) = 4 π , F · n dσ = (x, y, z) · n dσ = S

S

S

y no se verifica la igualdad entre ambas integrales (se ha utilizado la fórmula del área de la esfera, cuyo cálculo se propone en el ejercicio 13.2.II). Nota: El campo eléctrico engendrado por una carga unipuntual situada en el punto x0 ∈ R3 es de la forma K q F (x − x0 ) ,

donde q es el valor de la carga y K una constante que depende de las características del medio (un gas, por ejemplo). En general, la ley de Gauss afirma que el flujo a través de una superficie cerrada del campo eléctrico generado por un número finito de partículas cargadas en su interior es el producto de 4 π K por la suma de todas las cargas, fórmula ésta que se deduce del teorema general que enunciamos a continuación (ver ejercicio 13.50). U NIVERSIDAD DE VALLADOLID

198

Tema 13.

Integración en superficies

Teorema 13.44 (de la divergencia o de Gauss-Ostrogradski). Sean V un abierto acotado de R3 con frontera regular a trozos y F un campo vectorial de clase C 1 definido en un abierto U de R3 que contiene a V , entonces ZZZ Z div F dx dy dz = F · n dσ , V

∂V

cuando en ∂V se considera la orientación inducida por V .

Corolario 13.45. En las condiciones del teorema anterior, si div F = 1 en V , entonces Z F · n dσ = m(V ) . ∂V

Observación 13.46. La demostración de este teorema general se basa en el lema 13.41, tras descomponer el abierto V como unión finita (salvo conjuntos de medida nula) de abiertos con frontera regular a trozos y proyectables sobre los tres planos, Vi , i = 1, 2, . . . , n, esto es: n

V = ∪ Vi,

I)

i=1

II )

Vi ∩ Vj = Ø si k 6= j ,

y tales que las fronteras ∂Vi se escriben como suma de superficies, unas contenidas en ∂V y otras nuevas superficies comunes a dos de ellos (es decir, en ∂Vi ∩∂Vj ) y que, al considerar las orientaciones inducidas respectivamente por Vi y por Vj , se orientan de forma opuesta. Así, al sumar los términos correspondientes a las integrales triples y a las integrales de superficie, se obtiene el resultado enunciado, dada la aditividad de la integral y puesto que los flujos del campo a través de las superficies ∂Vi ∩ ∂Vj no aportan nada, ya que aparecen dos veces pero con orientaciones opuestas entre sí. 13.5.1.

Comentarios sobre formas diferenciales y el teorema general de Stokes

Los denominados teoremas clásicos del Análisis Vectorial (de Riemann-Grenn, de Stokes y de Gauss-Ostrogradski), curiosamente, no fueron enunciados originalmente en esa misma forma por los respectivos autores a quienes se atribuyen, sino a propósito de problemas concretos de la Física Matemática. Esto no les resta ningún mérito. Asimismo, las nociones de integral curvilínea y de superficie, planteadas en un principio en términos puramente intuitivos, aparecen más tempranamente, junto con versiones particulares de los teoremas mencionados arriba. Actualmente, estos resultados se enmarcan en el contexto más general de la Geometría Diferencial, que contempla la noción de integración de formas diferenciales en variedades riemannianas. El concepto y la definición formal de integral de una forma diferencial en una variedad se deben, entre otros muchos, pincipalmente a los trabajos de H. Poincaré y E. Cartan, hace aproximadamente un siglo. Esta teoría generalR permiteR enunciar de manera simple y elegante todos esos resultados de forma unificada M dω = ∂M ω . Precisando un poco más: Teorema 13.47 (general de Stokes). Sea M una subvariedad diferenciable de Rn , de dimensión k, orientada y con borde ∂M , en el que se considera la orientación inducida por la de M . Sea también ω una forma diferencial de orden k − 1 y de clase C 1 en M . Entonces, si M es compacta o el soporte de ω es compacto Z Z ω. dω = M

∂M

Detallaremos luego un poco la noción de forma diferencial. De momento, mencionemos que las fórmulas de Riemann-Green y la clásica de Stokes son versiones de la anterior para abiertos de R2 o superficies en R3 (esto es, con dimensión 2), mientras que el de GaussOstrogradski se refiere a abiertos de R3 (subvariedades de dimensión 3) cuya frontera es una superficie (variedad de dimensión 2). Éste último, el teorema de la divergencia, admite una formulación en dimensión arbitraria, que tiene especial relevancia, entre otros campos, en problemas de contorno de Ecuaciones en Derivadas Parciales (EDP). Lo enunciamos a continuación: LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

13.5.

Teorema de Gauss-Ostrogradski

199

Teorema 13.48 (general de la divergencia). Sea V un abierto acotado de Rn cuya frontera ∂V es una hipervariedad (variedad de dimensión n − 1) orientada de acuerdo con la normal exterior a V . Si F = (F1 , F2 , . . . , Fn ) es un campo de clase C 1 en un abierto que contiene a V = V ∪ ∂V , se tiene que Z Z div F =

V

∂V

F · n dσn−1 .

Por supuesto, dσ1 es el elemento de longitud, dσ2 es el elemento de área, etc. Nótese también que para n = 2 el teorema de la divergencia es el teorema de Riemann-Green: la circulación en la curva ∂D del campo (P, Q) es la integral del campo escalar (P, Q) · t, la componente tangencial a la curva de ese campo. Pero, con la notación de la definición 12.30, resulta que (P, Q) · t = (Q, −P ) · ne , es decir, este campo escalar también es la componente normal del campo (Q, −P ) respecto de ∂D, y obviamente div(Q, −P ) =

∂Q ∂P − . ∂x ∂y

En este punto el lector se debería preguntar ¿qué sucede para n = 1? Veamos: los abiertos conexos y acotados de R son intervalos V = (a, b) con ∂V = {a, b}; un campo F : V → R1 dF /dx = F ′ y, finalmente, es R simplemente una función real F , cuya divergencia es div F = div F = F (b) − F (a). Saque sus conclusiones. V

Formas diferenciales De forma muy somera describimos las ideas básicas sobre formas diferenciales, simplemente con la intención de proporcionar al lector un primer encuentro con esta teoría, en la que puede profundizar mediante los textos [11], [16], [36] o [43]; también en [33] se presentan las formas diferenciales de forma muy sencilla y en el contexto restringido de R2 y R3 . En general, dar una forma diferencial en una subvariedad de Rn consiste en proporcionar un tensor en cada uno de los espacios tangentes a la variedad. Ahora bien, en las situaciones más comunes, esto consiste en restringir tensores definidos en todo Rn a dichos espacios vectoriales. En lo que sigue piense el lector que V = Rn , pero todo lo que se dice vale igual para cualquier espacio vectorial real V de dimensión finita n. Definición 13.49. Una aplicación T : V k → R se dice multilineal si es lineal en cada índice: T (v 1 , . . . , λ v i + µ wi , . . . , v k ) = λ T (v 1 , . . . , v i , . . . , v k ) + µ T (v 1 , . . . , wi , . . . , v k ) . Una aplicación multilineal T : V k → R se denomina tensor k veces covariante en V o simplemente tensor de orden k. El conjunto T k (V ) de los tensores de orden k tiene estructura de espacio vectorial cuando se le dota de la operación y la ley de composición externa naturales. Observaciones 13.50. I)

T 1 (V ) es el espacio dual de V . A partir de él es posible construir el resto de los espacios mediante el producto tensorial de aplicaciones; en el caso de aplicaciones multilineales se tiene que, si S ∈ T k (V ) y T ∈ T m (V ), entonces la aplicación S ⊗ T dada por (S ⊗ T ) (v 1 , v 2 , . . . , v k ), (w1 , w2 , . . . , wm ) = S(v 1 , v 2 , . . . , v k ) T (w1 , w2 , . . . , wm )

es multilineal, esto es, un elemento de T k+m (V ). Lo mismo para el producto de un número arbitrario de tensores. II )

Si {e1 , e2 , . . . , en } es base de V y {ϕ1 , ϕ2 , . . . , ϕn } es la base dual, entonces los nk tensores ϕi1 ⊗ ϕi2 ⊗ . . . ⊗ ϕik , 1 ≤ ij ≤ n , conforman una base de T k (V ). En particular, considerando la base estándar de Rn (véase la observación 2.8.III), se obtiene la base de T k (V ) dxi1 ⊗ dxi2 ⊗ . . . ⊗ dxik : 1 ≤ ij ≤ n .

Definición 13.51. Sea Sk el grupo simétrico de orden k. Si T ∈ T k (V ) y σ ∈ Sk se define el tensor T σ por T σ (v 1 , v 2 , . . . , v k ) = T (v σ(1) , v σ(2) , . . . , v σ(k) ) . Un tensor T ∈ T k (V ) se dice alternado si T = ε(σ) T σ para cada permutación σ ∈ Sk , donde ε(σ) = ±1 denota la paridad de σ. U NIVERSIDAD DE VALLADOLID

200

Tema 13.

Integración en superficies

Todo tensor de orden 1 es alternado. Un tensor de orden 2 es alternado si la matriz asociada a la forma bilineal (respecto de cualquier base) es antisimétrica... El conjunto Λk (V ) de los tensores alternados de orden k es un subespacio vectorial de T k (V ). A partir de los elementos de este último es posible construir los del primero mediante el proceso de alternación: Definición 13.52. Sea T ∈ T k (V ), se define el tensor alternado de T por 1 X ε(σ) T σ ∈ Λk (V ) . Alt(T ) = k! σ∈Sk

p

q

Si S ∈ Λ (V ), T ∈ Λ (V ), se define su producto exterior como el elemento de Λp+q (V ) dado por (p + q)! Alt(S ⊗ T ) . p! q!

S ∧T =

Este producto es asociativo, por lo que se puede extender a un número finito de factores. Definición 13.53. Sean U un abierto de Rn y k ∈ N. Una forma diferencial de orden k (o k-forma) en U es una aplicación ω: U → Λk (Rn ) . Esta definición se extiende al caso k = 0 conviniendo que Λ0 (Rn ) = R, es decir, una forma diferencial de orden 0 es simplemente una función de U en R, un campo escalar. El producto exterior de tensores alternados se traslada a las formas diferenciales, y se generaliza para formas de orden 0: si f es una función de U en R y ω es una k-forma diferencial en U , entonces (f ∧ ω)(x): = f (x) ω(x) es una k-forma, denotada usualmente f ω, a secas. Lema 13.54. Si ω es una k-forma diferencial en el abierto U ⊂ Rn , k ≤ n, existen funciones reales en U : fi1 i2 ...ik , 1 ≤ i1 < i2 < . . . < ik ≤ n , determinadas de forma única y tales que X ω(x) = (13.2) fi1 i2 ...ik (x) dxi1 ∧ dxi2 ∧ . . . ∧ dxik , x ∈ U . 1≤i1 1, z > 0, x2 + y 2 + z 2 < 4 . I)

Calcular la integral del campo F (x, y, z) = (z 2 − y 2 , y 3 x, z 3 x) a lo largo de los dos arcos de circunferencia contenidos en la parte esférica de ∂V y que están situados, respectivamente, en los planos de ecuaciones y = 1 y z = 0.

II )

Si S es la parte de ∂V contenida en la esfera de ecuación x2 + y 2 + z 2 = 4, calcular el flujo de rot F a través de S.

13.29 Sea S la superficie cerrada formada por el plano z = 0, los cuatro planos verticales que cortan en este plano el cuadrado inscrito en la circunferencia unidad de lados paralelos a los ejes, y el casquete superior de la esfera unidad. Hallar la integral del campo F (x, y, z) = y, −x, z 2 extendida a S. 13.30 Se considera la superficie S obtenida al sumar las superficies S1 y S2 dadas por S1 = {z = x2 + y 2 + 1, z ≤ 5},

con la orientación dada por la normal cuya tercera componente es positiva, y S2 = {x2 + y 2 = 4, 0 ≤ z ≤ 5},

con la orientación dada por Rla normal exterior al cilindro. Si F es el campo F (x, y, z) = xy 2 , x2 y, z(x2 + y 2 ) , calcular S F · n dσ .

13.31 Calcular el flujo del campo

F (x, y, z) = xz + cos(y), yz + cos(z), xy + cos(x)

a través de la superficie cerrada S, suma de la porción de esfera S1 definida por x2 + y 2 + z 2 = 1,

z ≥ 0,

y la porción de cono S2 definida por x2 + y 2 = z 2 ,

z ≥ 0,

x2 + y 2 ≤ z 2 , x2 + y 2 + z 2 ≤ 1,

cuando se considera la orientación dada por la normal exterior.

13.32 Se considera la integral de superficie Z I= x(z 2 − y 2 ), y(x2 − z 2 ), z(y 2 − x2 ) · n dσ, S

donde S es una superficie orientada cuyo borde es la curva cerrada Γ. I) II ) III )

Transformar I en una integral curvilínea. Calcular I cuando S es la semiesfera x2 + y 2 + (z − R)2 = R2 , z ≥ R (R > 0).

Utilizando el teorema de la divergencia, calcular I en la semiesfera inferior.

13.33 Sea S la superficie frontera del paralelepípedo P determinado por las aristas AB, AC y AD, siendo A(0, 0, 0), B(0, 1, 1), C(1, 0, 2) y D(1, 2, 0). Calcular Z (2xz, −3xy, z) · n dσ, S

cuando se considera en S la orientación dada por la normal exterior a P . 13.34 Se considera el abierto de R3 dado por V = (x, y, z) ∈ R3 : 0 < y < x < 1, 0 < z < x2 + y 2 . I)

II )

Calcular el volumen de V .

Si S es la frontera de V , excluyendo la parte contenida en el paraboloide de ecuación z = x2 + y 2 , calcular Z (y, −x, z) · n dσ S

cuando se considera en S la orientación dada por la normal exterior a V . U NIVERSIDAD DE VALLADOLID

206

Tema 13.

Integración en superficies

13.35 Sea V el abierto de R3 definido por V = (x, y, z) ∈ R3 : (x − 1)2 + z 2 < 1, −1 < y < z 2 . I)

II )

Calcular el volumen de V .

Sea S1 la parte de la frontera de V contenida en la superficie de ecuación y = z 2 . Construir una parametrización de S1 y calcular Z (x, y + 1, z) · n dσ, S1

cuando en S1 se considera la orientación dada por la normal exterior a V . III)

Sea S2 la porción de ∂V contenida en la superficie de ecuación (x − 1)2 + z 2 = 1. Deducir del teorema de la divergencia el valor de Z (x, y + 1, z) · n dσ. S2

13.36 Sean V el abierto de R3 dado por V = (x, y, z) ∈ R3 : x2 + y 2 < 1, x2 + y 2 < z 2 < 4, z > 0

y S la superficie frontera de V , considerando en ella la orientación dada por la normal exterior a V . Calcular el flujo del campo F (x, y, z) = (x3 , y 3 , −z 3 ) a través de S. 13.37 Calcular el flujo del campo y (y + 1) , z (2 x − y) , (x, y, z) ∈ R3 , F (x, y, z) = 1 − x2 , 2 a través de la superficie M = (x, y, z) ∈ R3 : (x − 1)2 + y 2 + z 2 = 1, x < 1, y > 0, z > 0 . 13.38 Sea M la superficie obtenida al girar la curva z = Se considera el campo F (x, y, z) = (y, −x, z).

√

x, 0 < x < 1, alrededor del eje OZ.

Calcular mediante dos procedimientos distintos el valor de Z F · n dσ, M

cuando en M se considera la orientación determinada por el vector normal a la superficie con tercera componente negativa. 13.39 Un recipiente (con forma de vasija) de 1 litro de capacidad se sitúa en un aparato que genera un campo (eléctrico, magnético o de otro tipo) en su interior. Elegida una referencia cartesiana en el aparato, dicho campo viene dado por y el borde de la vasija por

F (x, y, z) = (xz, x − yz, z + y 2 ), {(x, y, z) ∈ R3 : x2 + y 2 = 1, z = 1} ,

estando dadas las unidades de los ejes en decímetros. Determinar el flujo del campo a través de la superficie del recipiente, cuando se considera en ésta la orientación dada por la normal exterior. 13.40 Calcular el flujo de los siguientes campos a través de las superficies que se indican, directamente y utilizando el teorema de la divergencia: I)

F (x, y, z) = (x z, y z, 1) a través de la superficie S dada por x2 + y 2 + z 2 = 25,

II )

z < 3.

F (x, y, z) = (x z, y z, 0) a través de la superficie que limita al sólido V = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 < 4, x2 + y 2 > 1}.

LATV

Departamento de Álgebra, Análisis Matemático, Geometría y Topología

207

Ejercicios

13.41 Se considera la superficie S, suma de las cuatro superficies de revolución dadas por las ecuaciones implícitas siguientes: S1

=

{x2 + y 2 + z 2 = 4z , 2 < z };

S2

=

{z 2 = x2 + y 2 , 1 < z < 2 };

S3

=

{x2 + y 2 = 1 , 0 < z < 1 };

S4

=

{(z − 1)2 = x2 + y 2 , −1 < z < 0 },

orientadas todas ellas de manera acorde con una de las orientaciones de S como cadena orientable. Calcular el flujo del campo F (x, y, z) = 1, 0, x2 a través de S.

13.42 Se considera la superficie S1 obtenida al girar en torno al eje OZ la curva contenida en el plano OXZ de ecuación

I) II ) III )

z = (x2 − 1)(x2 − 4),

x ∈ (−2, 2).

Determínese una parametrización de dicha superficie y el vector normal correspondiente de manera que su tercera componente sea positiva. Hallar el flujo del campo F (x, y, z) = (x, y, 0) a través de S1 . Se considera el sólido V limitado por S1 , el cilindro vertical S2 dado por −9 < z < 0, 4

x2 + y 2 = 4, y el círculo S3 dado por

−9 . 4 Hallar el flujo de F a través de estas otras dos superficies. x2 + y 2 < 4,

IV )

z=

Utilizando los apartados anteriores, calcular el volumen de V .

13.43 (Fórmula de integración por partes). I)

Sea Γ una curva de clase C 1 a trozos de extremos x0 y x1 , y f , g funciones de clase C 2 en un abierto que contiene a Γ. Probar que Z Z f ∇g · dr = f (x1 ) g(x1 ) − f (x0 ) g(x0 ) − g∇f · dr. Γ

II )

Γ

Sean S una cadena orientable de superficies y f , g dos funciones de clase C 2 en un abierto que contiene a S ∪ ∂S. Probar que Z Z Z ∇f × ∇g · n dσ = f ∇g · dr = − g∇f · dr. S

III )

∂S

Sean U un abierto acotado y con frontera regular a trozos de R3 y f , g dos funciones de clase C 2 en un abierto que contiene a U . Probar las siguientes fórmulas, conocidas como identidades de Green: ZZZ Z ZZZ f ∆g dx dy dz = f ∇g · n dσ − ∇f · ∇g dx dy dz, U ZZZ U Z∂U ZZZ f ∆g dx dy dz = f ∇g − g∇f · n dσ + g ∆f dx dy dz. U

IV )

∂S

∂U

U

Si en cualquiera de los tres apartados anteriores, una de las dos funciones se anula en el borde de la curva, superficie o abierto correspondientes, ¿qué se puede decir?

13.44 Sea S la esfera de centro 0 y radio r > 0, orientada según la normal exterior. Z I ) Calcular (z, x, y) · n dσ. S Z II ) Calcular (x2 , 0, 0) · n dσ. S

U NIVERSIDAD DE VALLADOLID

208

Tema 13.

Integración en superficies

13.45 Sea a una constante real positiva. Hallar la integral del campo F (x, y, z) = (xz, 2yz, z 2 ) a través de la cadena de superficies cerrada S contenida en el semiespacio z ≥ 0 y formada por el plano z = 0, el cilindro y 2 = ax − x2 y la superficie cilíndrica z 2 = 4ax. 13.46 Se considera la superficie de revolución cerrada S que resulta de girar la gráfica de la función z = f (x) = 2 x − x2 , x ∈ [0, 2], alrededor del eje OX. Si F es el campo F (x, y, z) = (x2 , xy, xz), calcular Z S

F · n dσ

cuando en S se considera la orientación dada por la normal exterior.

13.47 Sea M la superficie de revolución obtenida al girar alrededor del eje OZ la curva (en el plano XZ) de ecuación z = cos(x), 0 < x < π. Se considera el campo F (x, y, z) = (y + ez , −x + ez , z). Calcular el flujo de F a través de M cuando se considera la orientación dada por el vector normal a la superficie con tercera componente positiva. 13.48 Se considera la pirámide cuya base es el cuadrado de vértices (0, 0, 0), (1, 0, 0), (1, 1, 0) y (0, 1, 0), y cuya cúspide es el punto (1/2, 1/2, 1). Si S es la superficie dada por las cuatro caras laterales de la pirámide y F es el campo dado por F (x, y, z) = (xez , yez , yex ), calcular el flujo de F a través de S cuando en ésta se considera la orientación dada por la normal que tiene la tercera componente positiva. 13.49 Sea V el conjunto de los puntos (x, y, z) de R3 que verifican las relaciones x > 0,

y > 0,

z > 0,

x2 + y 2 < 1,

x2 + y 2 > 2y,

z < x2 + y 2 .

Si S es la parte de la frontera de V no contenida en el paraboloide z = x2 + y 2 , orientada según la normal exterior a V , calcular Z (y, −x, z) · n dσ. S

13.50 (Ley de Gauss) En un medio homogéneo se encuentran situadas un número finito de cargas eléctricas, digamos en los puntos x1 , x2 , . . . , xn con intensidades q1 , q2 , . . . , qn , respectivamente. Se supone que S es una superficie cerrada y regular a trozos, frontera del abierto V , sobre la que no se encuentra ninguna de las cargas (xi ∈ / S). Demostrar que el flujo del campo eléctrico producido por dichas cargas a través de S es igual a X 4πK qi {i:xi ∈V }

siendo K una constante (la de proporcionalidad de la ley de Coulomb, que depende del sistema de unidades).

Apéndice A

Cónicas y Cuádricas La inclusión de esta materia, propia de un curso de Álgebra y Geometría Lineales, no tiene otra pretensión que la de proporcionar un prontuario útil sobre las curvas y superficies más sencillas y familiares.

A.1.

Cónicas en R2

Entre las curvas planas definidas implícitamente, aparte de las rectas, cabe destacar por su sencillez las que vienen dadas como el conjunto C de las raíces de un polinomio de grado 2 en las variables (x, y). Definición A.1. Se denomina cónica al conjunto C de soluciones de una ecuación del tipo Q(x, y) = a11 x2 + 2 a12 x y + a22 y 2 + 2 b1 x + 2 b2 y + c = 0.

(A.1)

Obviamente, la ecuación (A.1) puede no tener soluciones reales, como x2 + y 2 + 1 = 0; hablamos en este caso de cónicas imaginarias. También puede ser que, siendo C 6= Ø, en alguno de sus puntos p no tenga estructura diferenciable (esto sucede si ∇Q(p) = 0); por ejemplo, C = (x, y) ∈ R2 : x2 − y 2 = 0

es la unión de dos rectas (las bisectrices de los ejes coordenados) y alrededor del punto (0, 0) ∈ C no se puede dar una carta local. En estas situaciones se habla de cónicas degeneradas.

Aunque las propiedades locales (recta tangente, etc.) de una cónica se deducen a partir del teorema de la función implícita 3.21, éste no dice nada acerca de las propiedades globales (si el conjunto C es acotado o no, cuántas componentes conexas tiene, etc.). No obstante es posible clasificar estos objetos atendiendo a esos aspectos globales mediante unas características invariantes por cambios de referencia afín. Con la notación de (A.1) definamos para el polinomio Q las siguientes constantes: a11 a12 b1 a11 a12 , ∆1 = a12 a22 b2 , ∆2 = a12 a22 b1 b2 c a11 b1 a22 b2 , ∆3 = ∆2 + + T = a11 + a22 . b1 c b2 c

Si se considera una transformación afín A(x) = L x + β, con L aplicación lineal invertible y β = (β1 , β2 ) un punto de R2 , que matricialmente se representa por x α11 α12 β1 , A(x) = + α21 α22 y β2 entonces

P (x, y) = Q A(x, y) = a′11 x2 + 2 a′12 x y + a′22 y 2 + 2 b′1 x + 2 b′2 y + c′

es otro polinomio de grado dos y aunque para éste las correspondientes constantes ∆1 , ∆2 , ∆3 y T son posiblemente distintas, permanecen inalterados el signo de ∆2 y ∆3 , y el hecho de que ∆1 sea nulo o no; estos son los invariantes a los que hacíamos referencia. 209

210

Apéndice A. Cónicas y Cuádricas

En la tabla A.1 se presenta la clasificación de las cónicas citando su nombre, dando algunos ejemplos sencillos, los valores de los invariantes que corresponden (un espacio en blanco significa ausencia de restricciones) y una somera representación gráfica de una porción acotada de una curva de cada tipo. Entre las cónicas no degeneradas (∆1 6= 0) las elipses son las únicas acotadas (entre estas se encuentran las circunferencias) y, al igual que las parábolas, son conexas; las hipérbolas tienen dos componentes conexas, a las que se denomina ramas.

Curva

Ejemplos

∆1

∆2

T ·∆1

Elipse

x2 + y 2 = r 2 x2 + 2 y 2 = 4

6= 0

>0

0

>0

xy = 1 y − x2 = 1

6= 0

0

1

Elipsoide

x2 y2 z2 + 2 + 2 =1 2 a b c

3

4

0

0

Hiperboloide de dos hojas

y2 z2 x2 + = −1 b2 c2 a2

3

4

0

0

Paraboloide elíptico

x=

y2 z2 + 2 2 b c

2

4