CAPÍTULO 6: ESPACIO VECTORIAL EUCLÍDEO Definición: producto escalar

CAPÍTULO 6: ESPACIO VECTORIAL EUCLÍDEO 6.1- Definición: producto escalar. Sea 𝐸 un espacio vectorial de dimensión 𝑛. Un producto escalar es una aplica
Author:  Lucas Navarro Rico

5 downloads 61 Views 290KB Size

Story Transcript

CAPÍTULO 6: ESPACIO VECTORIAL EUCLÍDEO 6.1- Definición: producto escalar. Sea 𝐸 un espacio vectorial de dimensión 𝑛. Un producto escalar es una aplicación que denotaremos por ∘∶ 𝐸 × 𝐸 → ℝ y que verifica las siguientes propiedades siendo 𝑥̅ , 𝑦�, 𝑧̅ tres vectores cualquiera de 𝐸 y 𝜆, 𝜇 dos números reales cualquiera: i) Simetría: 𝑥̅ ∘ 𝑦� = 𝑦� ∘ 𝑥̅

� ii) Positividad: 𝑥̅ ∘ 𝑥̅ > 0 si 𝑥̅ ≠ 0

iii) Bilinealidad: 𝑥̅ ∘ (𝜆𝑦� + 𝜇𝑧̅) = 𝜆(𝑥̅ ∘ 𝑦�) + 𝜇(𝑥̅ ∘ 𝑧̅)

Nótese que como la aplicación es simétrica no es necesario comprobar que (𝜆𝑦� + 𝜇𝑧̅) ∘ 𝑥̅ = 𝜆(𝑦� ∘ 𝑥̅ ) + 𝜇(𝑧̅ ∘ 𝑥̅ ) para ver que es bilineal, por lo que basta con comprobar que se cumplen las tres propiedades anteriores para ver que una aplicación ∘ es un producto escalar.

- Ejemplo: sea 𝐸 = ℝ3 y sean 𝑥̅ = (𝑥1 , 𝑥2 , 𝑥3 ), 𝑦� = (𝑦1 , 𝑦2 , 𝑦3 ) dos vectores de 𝐸. Comprobar que la aplicación dada por 𝑥̅ ∘ 𝑦� = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 es un producto escalar.

Tenemos 𝑥̅ ∘ 𝑦� = 𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 = 𝑦1 𝑥1 + 𝑦2 𝑥2 + 𝑦3 𝑥3 = 𝑦� ∘ 𝑥̅ por lo que la aplicación es simétrica. Por otra parte 𝑥̅ ∘ 𝑥̅ = 𝑥12 + 𝑥22 + 𝑥32 > 0 si 𝑥̅ ≠ 0� por lo que se cumple la segunda propiedad. Finalmente se tiene que: 𝑥̅ ∘ (𝜆𝑦� + 𝜇𝑧̅) = 𝑥1 (𝜆𝑦1 + 𝜇𝑧1 ) + 𝑥2 (𝜆𝑦2 + 𝜇𝑧2 ) + 𝑥3 (𝜆𝑦3 + 𝜇𝑧3 ) = 𝜆(𝑥1 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 ) + 𝜇(𝑥1 𝑧1 + 𝑥2 𝑧2 + 𝑥3 𝑧3 ) = 𝜆(𝑥̅ ∘ 𝑦�) + 𝜇(𝑥̅ ∘ 𝑧̅)

Por lo que la aplicación es bilineal. Todo esto implica que la aplicación del enunciado es un producto escalar (al que se suele denotar como producto escalar usual).

- Ejemplo: sea 𝐸 = ℝ3 y sean 𝑥̅ = (𝑥1 , 𝑥2 , 𝑥3 ), 𝑦� = (𝑦1 , 𝑦2 , 𝑦3 ) dos vectores de 𝐸. Estudiar si la aplicación dada por 𝑥̅ ∘ 𝑦� = 2𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 es un producto escalar.

Tenemos 𝑥̅ ∘ 𝑦� = 2𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 = 𝑦� ∘ 𝑥̅ por lo que la aplicación es simétrica. Por otra parte 𝑥̅ ∘ 𝑥̅ = 𝑥12 + (𝑥1 + 𝑥2 )2 + 𝑥32 > 0 si 𝑥̅ ≠ 0� por lo que se cumple la segunda propiedad. Finalmente se tiene que:

𝑥̅ ∘ (𝜆𝑦� + 𝜇𝑧̅) = 2𝑥1 (𝜆𝑦1 + 𝜇𝑧1 ) + 𝑥1 (𝜆𝑦2 + 𝜇𝑧2 ) + 𝑥2 (𝜆𝑦1 + 𝜇𝑧1 ) + 𝑥2 (𝜆𝑦2 + 𝜇𝑧2 ) + 𝑥3 (𝜆𝑦3 + 𝜇𝑧3 ) = 𝜆(2𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 ) + 𝜇(2𝑥1 𝑧1 + 𝑥1 𝑧2 + 𝑥2 𝑧1 + 𝑥2 𝑧2 + 𝑥3 𝑧3 ) = 𝜆(𝑥̅ ∘ 𝑦�) + 𝜇(𝑥̅ ∘ 𝑧̅) por lo que la aplicación es un producto escalar.

1

- Ejemplo: sea 𝐸 = 𝑃2 [𝑥]. Ver que la aplicación dada por 𝑝(𝑥) ∘ 𝑞(𝑥) = ∫0 𝑝(𝑥)𝑞(𝑥)𝑑𝑥 es un

producto escalar.

1

Tenemos que 𝑝(𝑥) ∘ 𝑞(𝑥) = ∫0 𝑝(𝑥)𝑞(𝑥)𝑑𝑥 = 𝑞(𝑥)𝑝(𝑥) por lo que la aplicación es simétrica. 1

Por otra parte que 𝑝(𝑥) ∘ 𝑝(𝑥) = ∫0 [𝑝(𝑥)]2 𝑑𝑥 > 0 si 𝑝(𝑥) ≠ 0 puesto que en este caso[𝑝(𝑥)]2 > 0 lo que implica que la integral tiene que ser positiva. Finalmente se tiene que:

Pedro_CC

1

1

1

1

𝑝(𝑥) ∘ �𝜆𝑞(𝑥) + 𝜇𝑟(𝑥)� = � 𝑝(𝑥)�𝜆𝑞(𝑥) + 𝜇𝑟(𝑥)�𝑑𝑥 = 𝜆 � 𝑝(𝑥)𝑞(𝑥)𝑑𝑥 + 𝜇 � 𝑝(𝑥)𝑟(𝑥)𝑑𝑥 0

0

= 𝜆(𝑝(𝑥) ∘ 𝑞(𝑥)) + 𝜇(𝑝(𝑥) ∘ 𝑟(𝑥))

0

por lo que la aplicación anterior es un producto escalar. 6.2- Representación matricial de un producto escalar. Sea 𝐸 un espacio vectorial de dimensión 𝑛 y sea ∘∶ 𝐸 × 𝐸 → ℝ un producto escalar. Sea 𝐵 = {𝑒̅1 , … , 𝑒̅𝑛 } una base de 𝐸 y sean 𝑋 = (𝑥1 , … , 𝑥𝑛 )𝑡 , 𝑌 = (𝑦1 , … , 𝑦𝑛 )𝑡 las coordenadas de los vectores 𝑥̅ , 𝑦� respecto de la base 𝐵. Definimos la matriz 𝐺 de la siguiente manera:

Entonces, se verifica que:

𝑒̅1 ∘ 𝑒̅1 𝑒̅ ∘ 𝑒̅ 𝐺=� 1 1 … 𝑒̅𝑛 ∘ 𝑒̅1

𝑒̅1 ∘ 𝑒̅1 𝑒̅1 ∘ 𝑒̅1 𝑥̅ ∘ 𝑦� = (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) � … 𝑒̅𝑛 ∘ 𝑒̅1

𝑒̅1 ∘ 𝑒̅1 𝑒̅2 ∘ 𝑒̅2 … … 𝑒̅1 ∘ 𝑒̅1 𝑒̅2 ∘ 𝑒̅2 … …

… 𝑒̅1 ∘ 𝑒̅𝑛 … … … … � … 𝑒̅𝑛 ∘ 𝑒̅𝑛 𝑦1 … 𝑒̅1 ∘ 𝑒̅𝑛 𝑦2 … … = 𝑋 𝑡 𝐺𝑌 … … ��…� 𝑦𝑛 … 𝑒̅𝑛 ∘ 𝑒̅𝑛

Como un producto escalar es simétrico la matriz 𝐺 también tiene que serlo (aunque no es cierto que toda matriz simétrica represente un producto escalar). Para entender un poco mejor de dónde sale esto vamos a poner un ejemplo sencillo en dimensión 𝑛 = 2. En este caso tenemos que 𝑥̅ = 𝑥1 𝑒̅1 + 𝑥2 𝑒̅2 , 𝑦� = 𝑦1 𝑒̅1 + 𝑦2 𝑒̅2 por lo que tenemos que: 𝑥̅ ∘ 𝑦� = (𝑥1 𝑒̅1 + 𝑥2 𝑒̅2 ) ∘ (𝑦1 𝑒̅1 + 𝑦2 𝑒̅2 ) = 𝑥1 𝑦1 (𝑒̅1 ∘ 𝑒̅1 ) + 𝑥2 𝑦1 (𝑒̅2 ∘ 𝑒̅1 ) + 𝑥1 𝑦2 (𝑒̅1 ∘ 𝑒̅2 ) + 𝑒̅ ∘ 𝑒̅ 𝑒̅1 ∘ 𝑒̅2 𝑦1 �� � 𝑥2 𝑦2 (𝑒̅2 ∘ 𝑒̅2 ) = (𝑥1 , 𝑥2 ) � 1 1 𝑒̅2 ∘ 𝑒̅1 𝑒̅2 ∘ 𝑒̅2 𝑦2

Donde hemos usado la bilinealidad del producto escalar para justificar la segunda igualdad (es importante entender bien ese paso). - Ejemplo: ver cuál es la matriz G del producto escalar dado por 𝑥̅ ∘ 𝑦� = 2𝑥1 𝑦1 + 𝑥1 𝑦2 + 𝑥2 𝑦1 + 𝑥2 𝑦2 + 𝑥3 𝑦3 respecto de la base canónica.

En este caso tenemos 𝑒̅1 ∘ 𝑒̅1 = (1,0,0) ∘ (1,0,0) = 2, y el cálculo de los otros productos escalares es análogo. Obtenemos la matriz:

6.3- Matriz de un producto escalar.

Pedro_CC

2 1 0 𝐺 = �1 1 0� 0 0 1

2

Una matriz simétrica A es la matriz de un producto escalar si y solo si los menores principales 𝑃𝑖 son positivos ∀𝑖 ∈ {1, … , 𝑛} (recordemos que el menor principal 𝑃𝑖 es el determinante de la matriz que se obtiene al quedarse con los elementos que están tanto en las filas 1,2, … , 𝑖 como en las columnas 1,2, … , 𝑖. Veámoslo con un ejemplo:

5 2 1 - Ejemplo: calcular los valores del parámetro real 𝑎 para que la matriz 𝐴 = �2 1 0� sea la 1 0 𝑎 matriz de un producto escalar.

5 2 � = 1 > 0, 𝑃3 = det(𝐴) = 𝑎 − 1 > 0 por lo que 2 1 es necesario que 𝑎 > 1 para que la matriz del enunciado sea la matriz de un producto escalar.

En este caso tenemos 𝑃1 = 5 > 0, 𝑃2 = �

6.4- Matrices congruentes. Cambios de base en un producto escalar.

Sea 𝐸 un espacio vectorial de dimensión 𝑛 y sea ∘∶ 𝐸 × 𝐸 → ℝ un producto escalar. Sea 𝐵 = {𝑒̅1 , … , 𝑒̅𝑛 } una base de 𝐸 y sean 𝑋 = (𝑥1 , … , 𝑥𝑛 )𝑡 , 𝑌 = (𝑦1 , … , 𝑦𝑛 )𝑡 las coordenadas de los vectores 𝑥̅ , 𝑦� respecto de la base 𝐵. Sea 𝐺 la matriz del producto escalar en la base 𝐵 de forma que tenemos 𝑥̅ ∘ 𝑦� = 𝑋 𝑡 𝐺𝑌. Sea 𝐵′ = {𝑢�1 , … , 𝑢�𝑛 } otra base de 𝐸, y sea 𝐺 ′ la matriz del mismo producto escalar en la base 𝐵′ . Queremos ver qué relación hay entre las matrices 𝐺 y 𝐺 ′ . Sea 𝑃 la matriz de cambio de base de 𝐵′ a 𝐵 y sean 𝑋 ′ , 𝑌 ′ las coordenadas de los vectores 𝑥̅ , 𝑦� en la base 𝐵′ . Tenemos que: 𝑋 = 𝑃𝑋 ′ 𝑌 = 𝑃𝑌 ′

Sustituyendo estas dos expresiones en 𝑋 𝑡 𝐺𝑌 resulta:

𝑥̅ ∘ 𝑦� = 𝑋 𝑡 𝐺𝑌 = (𝑃𝑋 ′ )𝑡 𝐺(𝑃𝑌 ′ ) = (𝑋 ′ )𝑡 𝑃𝑡 𝐺𝑃(𝑌 ′ ) = (𝑋 ′ )𝑡 𝐺 ′ 𝑌 ′

Por tanto la relación buscada es 𝐺 ′ = 𝑃𝑡 𝐺𝑃 siendo 𝑃 la matriz de cambio de base de 𝐵′ a 𝐵. Diremos que las matrices 𝐴, 𝐵 son congruentes si existe una matriz 𝑃 tal que se verifica 𝐴 = 𝑃𝑡 𝐵𝑃.

Tener cuidado para no equivocaros confundiendo la definición de matrices congruentes (𝐴 = 𝑃𝑡 𝐵𝑃) con la de matrices semejantes (𝐴 = 𝑃−1 𝐵𝑃).

6.5- Vectores ortogonales. Propiedades.

Se dice que dos vectores 𝑥̅ , 𝑦� de un espacio vectorial 𝐸 son ortogonales respecto a un producto escalar ∘ si se verifica que 𝑥̅ ∘ 𝑦� = 0.

Se dice que el vector 𝑥̅ es ortogonal al subespacio vectorial 𝑉 si ∀𝑣̅ ∈ 𝑉 se tiene que 𝑥̅ ∘ 𝑣̅ = 0. La condición anterior equivale a que 𝑥̅ sea ortogonal a todos los vectores de una base de 𝑉.

Pedro_CC

3

Se dice que los subespacios vectoriales 𝑉 y 𝑊 son suplementarios si ∀𝑣̅ ∈ 𝑉, ∀𝑤 � ∈ 𝑊 se tiene que 𝑤 � ∘ 𝑣̅ = 0. La condición anterior equivale a que todos los vectores de una base de 𝑉 sean ortogonales a todos los vectores de una base de 𝑊. Algunas propiedades relacionadas con la ortogonalidad son:

� i) 𝑥̅ ∘ 𝑥̅ = 0 implica 𝑥̅ = 0

ii) El único vector ortogonal a todos los vectores de un subespacio vectorial es el vector nulo. iii) Si 𝑆 = {𝑢�1 , … , 𝑢�𝑛 } es un sistema de vectores ortogonales 2 a 2 y ninguno de dichos vectores es el vector nulo se tiene que 𝑆 es libre.

iv) Si 𝑉1 y 𝑉2 son subespacios vectoriales que verifican que 𝑉1 ⊂ 𝑉2 y 𝑉1 ≠ 𝑉2 entonces existe un vector de 𝑉2 que es ortogonal a 𝑉1.

v) Si 𝑉 es un subespacio vectorial de dimensión 𝑘 entonces 𝑉 tiene un conjunto de 𝑘 vectores ortogonales 2 a 2 y, como consecuencia, todo sistema libre contenido en 𝑉 tiene a lo sumo 𝑘 vectores ortogonales 2 a 2.

vi) Si 𝑉 es un subespacio vectorial de dimensión 𝑘 de un espacio vectorial 𝐸 de dimensión 𝑛 se tiene que el conjunto de vectores otrogonales a 𝑉 tienen estructura de subespacio vectorial de dimensión 𝑛 − 𝑘. Dicho subespacio vectorial se denomina subespacio ortogonal de 𝑉 y se denota por 𝑉 ⊥ , y se tiene que 𝑉 ⊕ 𝑉 ⊥ = 𝐸.

La última propiedad proporciona una forma sistemática de calcular el subespacio suplementario de un subespacio vectorial 𝑉 dado. Basta con considerar el producto escalar usual y obtener 𝑛 − 𝑘 vectores suplementarios a una base 𝐵 de 𝑉. Veámoslo con un ejemplo del tema de espacios vectoriales. - Ejemplo (intercuatrimestral noviembre 2007, 3 puntos):

Sea ℝ2 [𝑥] el espacio vectorial de los polinomios de grado menor o igual que 2 con coeficientes reales y 𝐵 = {1, 𝑥, 𝑥 2 } su base canónica. Consideremos los siguientes subespacios de ℝ2 [𝑥]: 𝑉 = {𝑝(𝑥) ∈ ℝ2 [𝑥] |1 𝑒𝑠 𝑟𝑎𝑖𝑧 𝑑𝑒 𝑝(𝑥)}

Se pide:

𝑊 = {𝑝(𝑥) ∈ ℝ2 [𝑥] |𝑝(𝑥) 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒}

a) Calcular una base de 𝑉 ∩ 𝑊 y otra de V+W.

b) Hallar unas ecuaciones implícitas en la base B de un subespacio suplementario de 𝑉 ∩ 𝑊.

i) Sea 𝑝(𝑥) = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 un polinomio que pertenece a 𝑉 ∩ 𝑊. Imponiendo la condición de que 𝑝(𝑥) no puede tener término independiente se sigue que 𝑐 = 0 e imponiendo la condición de que 1 es raíz de 𝑝(𝑥) se tiene que 𝑎 + 𝑏 = 0 de donde se sigue que: 𝑉 ∩ 𝑊 = 𝐿{(𝑥 2 − 𝑥)}

Pedro_CC

4

Aplicando la fórmula de Grassmann (la que relaciona las dimensiones de los subespacios 𝑉 y 𝑊 con las de 𝑉 ∩ 𝑊 y 𝑉 + 𝑊) se sigue que dim(𝑉 + 𝑊) = 3 y por tanto 𝑉 + 𝑊 = ℝ2 [𝑥] y una base de 𝑉 + 𝑊 es {𝑥 2 , 𝑥, 1}

ii) Respecto de la base canónica 𝑉 ∩ 𝑊 = 𝐿{(0, −1,1)}. Esto se puede interpretar geométricamente como una recta de ℝ3 que pasa por el origen y tiene como vector director a (0, −1,1). El subespacio ortogonal a dicha recta en ℝ3 respecto al producto escalar usual es el plano que tiene como vector normal a (0, −1,1) y que pasa por el origen. Es sencillo encontrar dos vectores linealmente independientes que generen dicho plano: (0,1,1) y (1,0,0) (es obvio ver que (0,1,1) y (1,0,0) son linealmente independientes y el producto escalar usual de cualquiera de estos dos vectores con (0, −1,1) da cero como resultado, por lo que dichos vectores generan el plano que queremos). Finalmente, dichos vectores en realidad son los polinomios 𝑥 2 + 𝑥 y 1 (ya que son coordenadas respecto de la base canónica) por lo que un subespacio suplementario de 𝑉 ∩ 𝑊 viene dado por 𝐿{𝑥 2 + 𝑥 ,1} y su ecuación implícita respecto de la base canónica es 𝑥1 = 𝑥2 (la coordenada en 𝑥 es la misma que la coordenada en 𝑥 2 ) - Ejemplo: consideremos ℝ4 con el producto escalar usual. Calcular un subespacio vectorial suplementario al subespacio 𝑉 que tiene como ecuaciones implícitas {𝑥 + 𝑦 − 𝑧 + 𝑡 = 0,2𝑥 + 𝑦 − 𝑧 + 3𝑡 = 0}

Vamos a calcular el subespacio ortogonal a 𝑉. sea 𝑣̅ = (𝑥, 𝑦, 𝑧, 𝑡) un vector de 𝑉. De las ecuaciones implícitas de 𝑉 se deduce que con el producto escalar usual se tiene que: 𝑥 + 𝑦 − 𝑧 + 𝑡 = (𝑥, 𝑦, 𝑧, 𝑡) ∘ (1,1, −1,1) = 𝑣̅ ∘ (1,1, −1,1) = 0

2𝑥 + 𝑦 − 𝑧 + 3𝑡 = (𝑥, 𝑦, 𝑧, 𝑡) ∘ (2,1, −1,3) = 𝑣̅ ∘ (2,1, −1,3) = 0

lo que implica que los vectores (1,1, −1,1), (2,1, −1,3) son ortogonales a 𝑉. Como son linealmente independientes y dim(𝑉 ⊥ ) = 2 por la fórmula de Grassmann se tiene que: 𝑉 ⊥ = 𝐿{(1,1, −1,1), (2,1, −1,3)}

y ya tenemos un subespacio suplementario de 𝑉.

Otra forma de calcular el subespacio 𝑉 ⊥ sería calcular una base 𝐵 de 𝑉 y calcular los vectores ortogonales a los de dicha base obteniendo las ecuaciones implícitas de 𝑉 ⊥ . Es un proceso más sistemático aunque un poco más laborioso, y por el que se obtiene 𝑉 ⊥ = 𝐿{(1,0,0,2), (0, −1,1,1)}. Como es lógico, ambos subespacios son en realidad el mismo. 6.6- Módulo de un vector. Propiedades.

Se define la norma, módulo o longitud de un vector 𝑣̅ de la siguiente manera: |𝑣̅ | = √ 𝑣̅ ∘ 𝑣̅

Algunas propiedades relacionadas con el módulo de un vector son: � i) |𝑣̅ | = 0 implica que 𝑣̅ = 0

Pedro_CC

5

𝑣�

ii) Si |𝑣̅ | ≠ 0se tiene que |𝑣�| es un vector de módulo 1.

iii) |𝜆𝑣̅ | = |𝜆||𝑣̅ | para todo vector 𝑣̅ y para todo número real 𝜆.

iv) Desigualdad de Schwarz:

para todo par de vectores 𝑢�, 𝑣̅ .

−|𝑢�||𝑣̅ | ≤ 𝑢� ∘ 𝑣̅ ≤ |𝑢�||𝑣̅ |

v) Desigualdad triangular:

|𝑢� + 𝑣̅ | ≤ |𝑢�| + |𝑣̅ |

|𝑢� − 𝑣̅ | ≤ ||𝑢�| − |𝑣̅ ||

para todo par de vectores 𝑢�, 𝑣̅ .

6.7- Ángulo que forman dos vectores. Se define el ángulo que forman dos vectores 𝑢�, 𝑣̅ ∈ 𝐸 (al que denotaremos por 𝛼) de la siguiente manera: cos(𝛼) =

𝑢� ∘ 𝑣̅ |𝑢||𝑣̅ |

Veamos un ejemplo de lo que hemos ido viendo hasta ahora. - Ejemplo: consideremos 𝐸 = ℝ3 con el siguiente producto escalar:

(𝑥, 𝑦, 𝑧) ∘ (𝑥 ′ , 𝑦 ′ , 𝑧 ′ ) = 𝑥𝑥 ′ + 2𝑦𝑦 ′ + 2𝑧𝑧 ′ + 𝑥𝑧 ′ + 𝑧𝑥 ′ + 𝑦𝑧 ′ + 𝑧𝑦 ′

a) Calcular la matriz de dicho producto escalar en la base canónica.

b) Calcular el módulo del vector (1,1,1) y el ángulo que forman los vectores (1,0,1) y (0,1,0). c) Calcular el subespacio ortogonal de 𝑉 = 𝐿{(1,0,0)(0,1,0)}

a) Es fácil ver que la matriz asociada a dicho producto escalar en la base canónica es: 1 0 1 𝐺 = �0 2 1� 1 1 2

1 0 1 1 |1,1,1| b) Tenemos = �(1,1,1) ∘ (1,1,1) = [(1,1,1) �0 2 1� �1�]1/2 = 91/2 = 3 1 1 2 1 Por otra parte:

1 0 1 1 |1,0,1| = �(1,0,1) ∘ (1,0,1) = [(1,0,1) �0 2 1� �0�]1/2 = 51/2 1 1 2 1 Pedro_CC

6

1 0 1 0 |0,1,0| = �(0,1,0) ∘ (0,1,0) = [(0,1,0) �0 2 1� �1�]1/2 = 21/2 1 1 2 0 1 0 1 0 (1,0,1) ∘ (0,1,0) = (1,0,1) �0 2 1� �1� = 1 1 1 2 0

De donde tenemos que cos(𝛼) =

es 𝛼 = 𝑎𝑟𝑐 cos(

1

√10

)

1 51/2 21/2

=

1

, por lo que el ángulo pedido en el enunciado

√10

c) Sea (𝑥, 𝑦, 𝑧) ∈ 𝑉 ⊥ . Impongamos que sea ortogonal a los dos vectores que forman la base de 𝑉 dada en el enunciado: 1 0 1 1 (𝑥, 𝑦, 𝑧) ∘ (1,0,0) = (𝑥, 𝑦, 𝑧) �0 2 1� �0� = 𝑥 + 𝑧 = 0 1 1 2 0

1 0 1 0 (𝑥, 𝑦, 𝑧) ∘ (0,1,0) = (𝑥, 𝑦, 𝑧) �0 2 1� �1� = 2𝑦 + 𝑧 = 0 1 1 2 0

Las dos expresiones anteriores son las ecuaciones implícitas de 𝑉 ⊥ . Operando se obtiene sin dificultad que 𝑉 ⊥ = 𝐿{(−2, −1,2)} 6.7- Bases ortogonales y ortonormales.

Se dice que una base de un espacio vectorial es ortogonal si sus vectores son ortogonales 2 a 2. Si todos los vectores de una base ortogonal tienen módulo 1 se dice que dicha base es ortonormal. Para encontrar una base de vectores ortonormal a un subespacio dado basta con tomar como primer vector de la base un vector cualquiera del subespacio e imponer que los vectores que se van añadiendo a la base pertenezcan al subespacio y sean ortogonales a todos los vectores que ya tenemos en la base. Finalmente, dividimos cada vector de la base por su módulo para asegurar que todos tengan módulo 1 y la base sea ortonormal. - Ejemplo: construir una base ortonormal de ℝ3 respecto al producto escalar usual imponiendo que el primer vector de la misma sea 𝑐̅1 = (1,1,0).

Si 𝑐̅2 = (𝑥, 𝑦, 𝑧) es el segundo vector se tiene que 𝑐̅2 ∘ 𝑐̅1 = 𝑥 + 𝑦 = 0 por lo que tomamos el vector 𝑐̅2 = (1, −1,0). Si 𝑐̅3 = (𝑥, 𝑦, 𝑧) es el último vector de la base se tendrá que 𝑐̅3 ∘ 𝑐̅1 = 𝑐̅2 ∘ 𝑐̅3 = 0 de donde se obtiene 𝑥 = 𝑦 = 0 por lo que tomamos �𝑐3 = (0,0,1). Finalmente dividimos cada vector por su módulo y obtenemos la base: 1 1 1 1 , 0� , � , − , 0� , (0,0,1)} 𝐵 = {� , √2 √2 √2 √2

Como en este caso trabajamos con el producto escalar usual podríamos haber encontrado la base anterior “a ojo”, pero con productos escalares más raros es aconsejable seguir un procedimiento más sistemático. Pedro_CC

7

6.8- Método de ortogonalización de Gram-Schmidt. Se trata de un “algoritmo” que permite encontrar una base ortonormal de un subespacio a partir de una base cualquiera del mismo. Primero se obtiene una base ortogonal y después se dividen los vectores por sus respectivos módulos para conseguir la ortonormalidad. Veamos cómo funciona con un ejemplo: Supongamos que 𝐵 = {𝑒̅1 , 𝑒̅2 , 𝑒̅3 } es una base de un subespacio vectorial 𝑉, y sea 𝐵′ = {𝑢�1 , 𝑢�2 , 𝑢�3 } la base ortogonal que queremos conseguir. No nos complicamos la vida y hacemos 𝑢�1 = 𝑒̅1 para empezar.

Para obtener 𝑢�2 hacemos 𝑢�2 = 𝑒̅2 − 𝑎𝑢�1 siendo 𝑎 una constante cuyo valor vendrá determinado por la ortononalidad entre 𝑢�2 y 𝑢�1 : 𝑢�2 ∘ 𝑢�1 = (𝑒̅2 − 𝑎𝑢�1 ) ∘ 𝑢�1 = (𝑒̅2 − 𝑎𝑒̅1 ) ∘ 𝑒̅1 = 𝑒̅2 ∘ 𝑒̅1 − 𝑎(𝑒̅1 ∘ 𝑒̅1 ) = 0

de donde obtenemos 𝑎 =

𝑒̅2 ∘𝑒̅1 𝑒̅1 ∘𝑒̅1

y por tanto 𝑢�2 = 𝑒̅2 −

𝑒̅2 ∘𝑒̅1 𝑢� 𝑒̅1 ∘𝑒̅1 1

= 𝑒̅2 −

𝑒̅2 ∘𝑒̅1 𝑒̅ 𝑒̅1 ∘𝑒̅1 1

Para obtener el último vector procedemos de la misma forma y hacemos 𝑢�3 = 𝑒̅3 − 𝑎𝑢�1 − 𝑏𝑢�2 siendo 𝑎 y 𝑏 constantes que obtendremos al imponer que 𝑢�3 sea ortogonal a los dos primeros vectores de la base. Por tanto: 𝑢�3 ∘ 𝑢�1 = (𝑒̅3 − 𝑎𝑢�1 − 𝑏𝑢�2 ) ∘ 𝑢�1 = 𝑒̅3 ∘ 𝑢�1 − 𝑎(𝑢�1 ∘ 𝑢�1 ) = 0

𝑢�3 ∘ 𝑢�2 = (𝑒̅3 − 𝑎𝑢�1 − 𝑏𝑢�2 ) ∘ 𝑢�2 = 𝑒̅3 ∘ 𝑢�2 − 𝑏(𝑢�2 ∘ 𝑢�2 ) = 0

donde hemos empleado que 𝑢�2 ∘ 𝑢�1 = 0 en ambos productos escalares. De aquí se sigue que los valores que buscamos son 𝑎 =

�1 𝑒̅3 ∘𝑢 , �1 ∘𝑢 �1 𝑢

� 𝑒̅ ∘𝑢

𝑏 = 𝑢�3 ∘𝑢�2 . Observar que podemos sustituir los 2

2

vectores 𝑢�2 y 𝑢�1 en las expresiones de 𝑎 y 𝑏 y ya tendríamos el vector 𝑢�3 en función de 𝑒̅1 , 𝑒̅2 𝑦 𝑒̅3 , que es lo que queríamos. Por tanto la base ortonormal buscada será: 𝐵′′ = {

𝑢�1 𝑢�2 𝑢�3 , , } |𝑢�1 | |𝑢�2 | |𝑢�3 | � 𝑒̅ ∘𝑢

� 𝑒̅ ∘𝑢

�𝑛−1 𝑒̅𝑛 ∘𝑢 𝑢� �𝑛−1 𝑛−1 𝑛−1 ∘𝑢

Para el caso general tomaríamos 𝑢�𝑛 = 𝑒̅𝑛 − 𝑢�𝑛 ∘𝑢�1 𝑢�1 − 𝑢�𝑛 ∘𝑢�2 𝑢�2 − ⋯ − 𝑢� 1

1

2

2

(ya he

sustituido las constantes por el valor que toman al imponer que el producto escalar con los 𝑛 − 1 vectores anteriores de la base sea nulo)

Es importante que entendáis por qué la expresión de 𝑢�𝑛 del párrafo anterior sale lo que he puesto y que calculéis alguna base por este método antes del examen. En la práctica no creo que tengáis que calcular bases ortonormales de subespacios cuya dimensión sea mayor que 3 o 4. - Ejemplo: sea 𝐵 = {𝑒̅1 , 𝑒̅2 , 𝑒̅3 } una base de un espacio vectorial de dimensión 3 y consideremos un producto escalar ∘ cuya matriz en dicha base es:

Pedro_CC

1 0 0 𝐺 = �0 2 1� 0 1 2

8

Calcular una base ortonormal a partir de 𝐵 empleando el método de Gram-Schmidt.

Calculamos primero la base ortogonal 𝐵′ = {𝑢�1 , 𝑢�2 , 𝑢�3 }. Tomamos 𝑢�1 = 𝑒̅1 y tenemos que: 𝑢�2 = 𝑒̅2 −

𝑒̅2 ∘ 𝑒̅1 𝑒̅2 ∘ 𝑒̅1 0 𝑢�1 = 𝑒̅2 − 𝑒̅1 = 𝑒̅2 − 𝑒̅1 = 𝑒̅2 𝑒̅1 ∘ 𝑒̅1 𝑒̅1 ∘ 𝑒̅1 1

donde hemos usado la matriz G para ver cuánto valen los productos escalares. Finalmente tenemos: 𝑢�3 = 𝑒̅3 −

𝑒̅3 ∘ 𝑢�1 𝑒̅3 ∘ 𝑢�2 0 1 1 𝑢�1 − 𝑢�2 = 𝑒̅3 − 𝑢�1 − 𝑢�2 = 𝑒̅3 − 𝑒̅2 𝑢�1 ∘ 𝑢�1 𝑢�2 ∘ 𝑢�2 1 2 2

Finalmente dividimos cada vector por su módulo (os aconsejo que hagáis las cuentas) y obtenemos la base: 1 𝑒̅2 𝑒̅3 − 2 𝑒̅2 , } 𝐵 = {𝑒̅1 , √2 �3/2 ′′

6.9- Proyecciones ortogonales en espacios euclídeos.

Veamos primero cómo calcular la proyección ortogonal de un vector 𝑢� sobre otro vector 𝑣̅ . Sea 𝑎𝑣̅ dicha proyección ortogonal (el valor de 𝑎 tenemos que calcularlo). Podemos poner: 𝑢� = 𝑎𝑣̅ + 𝑤 �

para un cierto vector 𝑤 � que verificará 𝑣̅ ∘ 𝑤 � = 0 por ser la proyección ortogonal. Ver el siguiente dibujo para ver más claro todo esto:

Multiplicando la expresión anterior de 𝑢� escalarmente por el vector 𝑣̅ resulta: 𝑢� ∘ 𝑣̅ = 𝑎𝑣̅ ∘ 𝑣̅ + 𝑤 � ∘ 𝑣̅ = 𝑎𝑣̅ ∘ 𝑣̅ �∘𝑣� 𝑢

de donde obtenemos que 𝑎 = 𝑣�∘𝑣� es el valor pedido y la proyección del vector 𝑢� sobre 𝑣̅ vale � ∘𝑣� 𝑢 𝑣̅ . 𝑣�∘𝑣�

-Observación: para simplificar los cálculos podemos multiplicar el vector 𝑣̅ por una constante 𝑘 adecuada para que todos sus coeficientes sean enteros puesto que si proyectamos 𝑢� sobre 𝑘𝑣̅ obtenemos:

Pedro_CC

9

𝑘 𝑢� ∘ 𝑣̅ 𝑢� ∘ 𝑣̅ 𝑢� ∘ 𝑘𝑣̅ 𝑘𝑣̅ = 2 𝑘𝑣̅ = 𝑣̅ 𝑘 𝑣̅ ∘ 𝑣̅ 𝑣̅ ∘ 𝑣̅ 𝑘𝑣̅ ∘ 𝑘𝑣̅

que es el mismo valor que se obtiene al proyectar 𝑢� sobre 𝑣̅ .

Veamos ahora cómo calcular la proyección ortogonal de un vector 𝑢� sobre un subespacio vectorial 𝑉. Para simplificar, supondremos primero que dim(𝑉) = 2 y después veremos el caso general. Sea 𝐵 = {𝑒̅1 , 𝑒̅2 } una base de 𝑉. Razonando como en el caso anterior podemos poner: 𝑢� = 𝑣̅ + 𝑤 �

siendo 𝑣̅ ∈ 𝑉 y 𝑤 � un vector que cumple 𝑣̅ ∘ 𝑤 � = 0. Como 𝐵 = {𝑒̅1 , 𝑒̅2 } es una base de 𝑉 podemos poner 𝑣̅ = 𝑎𝑒̅1 + 𝑏𝑒̅2 siendo (𝑎, 𝑏) las coordenadas de 𝑣̅ en dicha base (que es lo que queremos calcular) por lo que la expresión del vector 𝑢� queda: 𝑢� = 𝑎𝑒̅1 + 𝑏𝑒̅2 + 𝑤 �

Multiplicamos la expresión anterior escalarmente por 𝑒̅1 y 𝑒̅2 y obtenemos:

𝑢� ∘ 𝑒̅1 = 𝑎𝑒̅1 ∘ 𝑒̅1 + 𝑏𝑒̅2 ∘ 𝑒̅1 + 𝑤 � ∘ 𝑒̅1 = 𝑎(𝑒̅1 ∘ 𝑒̅1 ) + 𝑏(𝑒̅2 ∘ 𝑒̅1 )

𝑢� ∘ 𝑒̅2 = 𝑎𝑒̅1 ∘ 𝑒̅2 + 𝑏𝑒̅2 ∘ 𝑒̅2 + 𝑤 � ∘ 𝑒̅2 = 𝑎(𝑒̅1 ∘ 𝑒̅2 ) + 𝑏(𝑒̅2 ∘ 𝑒̅2 )

Las dos expresiones anteriores son en realidad un sistema de dos ecuaciones cuyas dos incógnitas son las coordenadas (𝑎, 𝑏) que queremos calcular. Como conocemos todos los productos escalares de dichas expresiones basta con resolver el sistema para obtener la proyección ortogonal de 𝑢� el subespacio 𝑉.

En el caso general el procedimiento es el mismo, obteniéndose un sistema de ecuaciones lineales con 𝑛 incógnitas.

-Observación: si la base 𝐵 = {𝑒̅1 , 𝑒̅2 } fuese ortogonal tendríamos 𝑒̅1 ∘ 𝑒̅2 = 𝑒̅2 ∘ 𝑒̅1 = 0, por lo que el sistema de dos ecuaciones con dos incógnitas anterior sería mucho más cómodo de resolver porque podríamos despejar directamente cada incógnita de la única ecuación en la que aparecería. Si la base fuese ortonormal también tendríamos 𝑒̅1 ∘ 𝑒̅1 = 𝑒̅2 ∘ 𝑒̅2 = 1 por lo que en este caso habría que trabajar incluso menos para obtener la proyección sobre el subespacio. - Ejemplo: consideremos el producto escalar usual en ℝ3 . Calcular la proyección ortogonal del vector (1,2,1) sobre el subespacio 𝑉 = 𝐿{(0,1,2), (1,2,3)}

Tenemos (1,2,1) = 𝑎(0,1,2) + 𝑏(1,2,3) + 𝑤 � siendo 𝑤 � un vector perpendicular a 𝑉. Multiplicando escalarmente la expresión anterior por los vectores de la base resulta: (1,2,1) ∘ (0,1,2) = 𝑎(0,1,2) ∘ (0,1,2) + 𝑏(1,2,3) ∘ (0,1,2)

(1,2,1) ∘ (1,2,3) = 𝑎(0,1,2) ∘ (1,2,3) + 𝑏(1,2,3) ∘ (1,2,3)

Calculando los productos escalares tenemos: Pedro_CC

10

4 = 5𝑎 + 8𝑏

4 3

8 = 8𝑎 + 14𝑏

Resolviendo el sistema resulta 𝑎 = − , 𝑏 =

𝑎(0,1,2) + 𝑏(1,2,3) =

4 4 4 ( , , ) 3 3 3

4 3

por lo que la proyección buscada es el vector

6.10- Expresión matricial de la proyección sobre un subespacio vectorial.

Sea 𝐸 = ℝ𝑛 , sea 𝑆 un subespacio vectorial de dimensión 𝑘 de 𝐸 y consideremos el producto escalar usual (si tenemos otro producto escalar podemos buscar una base ortonormal de tal forma que la matriz de dicho producto escalar en esta base sea la identidad). Queremos encontrar una matriz 𝑃 de forma que para cada vector 𝑢� ∈ 𝐸 el producto 𝑃𝑢� sea el vector que obtenemos al proyectar 𝑢� sobre el subespacio 𝑆.

Sea 𝐵 = {𝑒̅1 , … , 𝑒̅𝑘 } una base de 𝑆 y sea 𝐴 la matriz que tiene los vectores 𝑒̅1 , … , 𝑒̅𝑘 por columnas (que tendrá dimensión 𝑛𝑥𝑘). Si 𝑥̅ es un vector arbitrario de ℝ𝑘 se tiene que 𝐴𝑥̅ es un vector que pertenece a 𝑆 ya que es una combinación lineal de las columnas de 𝐴 que son una base de 𝑆. Consideremos ahora un vector 𝑢� de 𝐸 y sea 𝐴𝑥̅0 su proyección en 𝑆 de forma que: 𝑢� = 𝐴𝑥̅0 + 𝑤 �

� es ortogonal a 𝑆 y 𝐴𝑥̅ es un siendo 𝑤 � un vector ortogonal a 𝑆 y 𝑥̅0 un vector de ℝ𝑘 . Como 𝑤 𝑘 vector que pertenece a 𝑆 para cualquier 𝑥̅ ∈ ℝ se tiene que: 𝐴𝑥̅ ∘ 𝑤 � =0

y despejando 𝑤 � en la expresión de 𝑢� y sustituyendo en la expresión anterior resulta: 𝐴𝑥̅ ∘ (𝑢� − 𝐴𝑥̅0 ) = 0

que al estar trabajando con el producto escalar usual equivale a: (𝐴𝑥̅ )𝑡 (𝑢� − 𝐴𝑥̅0 ) = 𝑥̅ 𝑡 𝐴𝑡 (𝑢� − 𝐴𝑥̅0 ) = 0

como la expresión anterior es cierta para todo vector 𝑥̅ de ℝ𝑘 necesariamente se tiene que cumplir que:

Operando resulta:

𝐴𝑡 (𝑢� − 𝐴𝑥̅0 ) = 0� 𝐴𝑡 𝑢� − 𝐴𝑡 𝐴𝑥̅0 = 0 𝐴𝑡 𝑢� = 𝐴𝑡 𝐴𝑥̅0

(𝐴𝑡 𝐴)−1 𝐴𝑡 𝑢� = 𝑥̅0

Y (finalmente!) multiplicando por 𝐴 tenemos: Pedro_CC

11

𝐴(𝐴𝑡 𝐴)−1 𝐴𝑡 𝑢� = 𝐴𝑥̅0

Por tanto, hemos encontrado una matriz que multiplicada por cualquier vector 𝑢� ∈ 𝐸 nos da su proyección sobre el subespacio 𝑆 (𝐴𝑥̅0 ). Dicha matriz se denomina matriz proyección y viene dada por la expresión: 𝑃 = 𝐴(𝐴𝑡 𝐴)−1 𝐴𝑡

Observación: esta “prueba” no es fácil de seguir: hay pasos que requerirían más justificación y partes que son enrevesadas. Lo importante de este apartado es que os quedéis con la fórmula que da la matriz P, y de cara a los exámenes son más importantes las propiedades de la matriz proyección (que veremos más adelante). - Ejemplo: consideremos el producto escalar usual en ℝ3 . Calcular la proyección ortogonal del vector (1,2,1) sobre el subespacio 𝑉 = 𝐿{(0,1,2), (1,2,3)} usando la matriz proyección. En

este

caso

tenemos

5/6 1/3 𝑃 = 𝐴(𝐴𝑡 𝐴)−1 𝐴𝑡 = � 1/3 1/3 −1/6 1/3 4 4 4 3 3 3

( , , )

0 𝐴 = �1 2

1 2� 3

y

operando

resulta

5/6 1/3 −1/6 1 −1/6 1/3 �. La proyección será � 1/3 1/3 1/3 � �2� = −1/6 1/3 5/6 5/6 1

Como era de esperar, coincide con lo que obtuvimos en el ejemplo anterior.

- Observación: si en el ejemplo anterior cambiamos el producto escalar la proyección sobre el subespacio cambiará (ya que en el ejemplo anterior vimos que los coeficientes del sistema eran productos escalares) por lo que la matriz proyección tendrá que cambiar también. ¿Cuál será la nueva matriz proyección en función de la matriz del nuevo producto escalar 𝐺? De cara al examen:

- Si en un ejercicio os hablan de matriz proyección o de proyecciones sobre un subespacio y no aparecen productos escalares por ningún lado en el enunciado podéis suponer que se está empleando el producto escalar usual. - Si hay que hacer alguna proyección suele ser más fácil hacerlo como vimos en el apartado 6.9. 6.11- Propiedades de la matriz proyección. Las propiedades más importantes de la matriz proyección son: i) Unicidad: la matriz 𝑃 obtenida anteriormente mediante la ecuación 𝑃 = 𝐴(𝐴𝑡 𝐴)−1 𝐴𝑡 es la única que verifica que para cada vector 𝑢� ∈ 𝐸 el producto 𝑃𝑢� es el vector que obtenemos al proyectar 𝑢� sobre el subespacio 𝑆.

ii) 𝑃𝑛 = 𝑃 ∀𝑛 ∈ ℕ puesto que 𝑃𝑢� ∈ 𝑆 y al proyectar un vector de 𝑆 sobre el subespacio 𝑆 se obtiene el mismo vector por lo que 𝑃2 𝑢� = 𝑃(𝑃𝑢�) = 𝑃𝑢� y para el resto de números naturales el razonamiento es el mismo. Pedro_CC

12

iii) 𝑃𝑡 = 𝑃 (es simétrica). La propiedad se puede deducir transponiendo ambos lados en la expresión 𝑃 = 𝐴(𝐴𝑡 𝐴)−1 𝐴𝑡 . iv) Las columnas de la matriz 𝑃 forman un sistema de generadores del subespacio 𝑆.

v) Si 𝑃 es la matriz proyección de un espacio vectorial 𝐸 de dimensión 𝑛 sobre un espacio vectorial 𝑆 de dimensión 𝑘 se tiene que los autovalores de 𝑃 son 𝜆 = 1 de multiplicidad 𝑘 y 𝜆 = 0 de multiplicidad 𝑛 − 𝑘. Para obtener los autovectores asociados al autovalor 𝜆 = 1 basta con tomar una base 𝐵 de 𝑆, puesto que para cualquier vector 𝑢� ∈ 𝑆 se tiene que 𝑃𝑢� = 𝑢�. Para obtener los autovectores asociados al autovalor 𝜆 = 0 tomamos una base 𝐵 ⊥ de 𝑆 ⊥ ya �. que para cualquier vector 𝑢� ∈ 𝑆 ⊥ se verifica que 𝑃𝑢� = 0 vi) La matriz 𝑃 es estrictamente diagonalizable.

vii) Una matriz 𝑃 es matriz proyección sobre el subespacio generado por las columnas de 𝑃 si y solo si verifica 𝑃𝑛 = 𝑃 ∀𝑛 ∈ ℕ y 𝑃𝑡 = 𝑃. En la práctica es suficiente con ver que 𝑃2 = 𝑃 y 𝑃𝑡 = 𝑃 si queremos demostrar que una matriz 𝑃 es matriz proyección.

viii) Si empleamos una base ortonormal de forma que las columnas de la matriz 𝐴 sean ortonormales la matriz 𝐴 verificará que 𝐴𝑡 𝐴 = 𝐼 por lo que en este caso se tendrá que 𝑃 = 𝐴(𝐼)−1 𝐴𝑡 = 𝑃 = 𝐴𝐴𝑡 siendo más sencillos los cálculos. - Observación: estas propiedades son muy importantes. En el intercuatrimestral de febrero es muy probable que aparezca alguna cuestión en la que haya que utilizarlas. - Ejemplo: (cuestión intercuatrimestral marzo 2012, 1.5 puntos)

Sea 𝑃 la matriz proyección asociada a un subespacio vectorial 𝑉. Demostrar que (𝐼 − 𝑃) es también matriz proyección asociada a un subespacio vectorial 𝑊 y determinar dicho subespacio. Vamos a utilizar la propiedad vii) para ver que (𝐼 − 𝑃) es matriz proyección. Tenemos: (𝐼 − 𝑃)𝑡 = 𝐼 𝑡 − 𝑃𝑡 = 𝐼 − 𝑃

(𝐼 − 𝑃)2 = 𝐼 2 − 2𝑃 + 𝑃2 = 𝐼 − 2𝑃 + 𝑃 = 𝐼 − 𝑃

lo que implica que (𝐼 − 𝑃) es matriz proyección (hemos usado que 𝑃2 = 𝑃 y 𝑃𝑡 = 𝑃 por ser 𝑃 matriz proyección). Veamos ahora dónde estamos proyectando (notad que no tenemos mucha información en el enunciado acerca de 𝑃 por lo que tiene que ser algo bastante genérico). Sea 𝑣̅ ∈ 𝑉 por lo que � por lo que todos los vectores de 𝑉 𝑃𝑣̅ = 𝑣̅ , tenemos que (𝐼 − 𝑃)𝑣̅ = 𝐼𝑣̅ − 𝑃𝑣̅ = 𝑣̅ − 𝑣̅ = 0 son ortogonales a 𝑊. Parece razonable suponer que 𝑊 = 𝑉 ⊥ (aunque lo que acabamos de hacer sólo implica que 𝑊 ⊆ 𝑉 ⊥ ya que cualquier subespacio de 𝑉 ⊥ verifica que todos sus vectores son ortogonales a 𝑉). Veamos que también se tiene que 𝑉 ⊥ ⊆ 𝑊: sea 𝑤 � ∈ 𝑉 ⊥ , tenemos que 𝑃𝑤 � = 0� por lo que (𝐼 − 𝑃)𝑤 � = 𝐼𝑤 � − 𝑃𝑤 � =𝑤 �, por lo que también tenemos que 𝑉 ⊥ ⊆ 𝑊 Pedro_CC

13

Al tener 𝑊 ⊆ 𝑉 ⊥ y 𝑉 ⊥ ⊆ 𝑊 necesariamente tiene que ser 𝑊 = 𝑉 ⊥ , y hemos terminado.

- Observación: si queréis intentar un ejercicio parecido mirad el ejercicio 12 de la página 244 del libro de la asignatura. Está en la parte de problemas resueltos del tema espacio vectorial euclídeo por lo que lo tenéis solucionado. 6.12- Ajuste lineal por el método de los mínimos cuadrados.

Supongamos que tenemos 𝑛 puntos en el plano (𝑎𝑖 , 𝑏𝑖 ) con 𝑖 ∈ {1, … , 𝑛} y queremos encontrar la recta 𝑦 = 𝑏𝑥 + 𝑎 que mejor “aproxima” estos puntos en el sentido de que se minimiza la suma de las distancias de cada punto a dicha recta. Necesitamos, por tanto, calcular los mejores valores de los parámetros 𝑎 y 𝑏. Lo que nos gustaría es que se cumpliese que:

𝑏1 = 𝑏𝑎1 + 𝑎 …

o en forma matricial:

𝑏𝑛 = 𝑏𝑎𝑛 + 𝑎 1 𝑎1 𝑏1 𝑎 � … � = �… … � � � 𝑏 1 𝑎𝑛 𝑏𝑛

1 𝑎1 𝑏1 𝑎 Sean 𝑌 = � … � , 𝐴 = �… … � , 𝑋 = � �. La expresión anterior es 𝑌 = 𝐴𝑋 y queremos 𝑏 1 𝑎𝑛 𝑏𝑛 despejar la matriz 𝑋 en función de las otras dos para obtener los valores de 𝑎 y 𝑏. Multiplicando ambos miembros de la igualdad matricial anterior por 𝐴𝑡 resulta: 𝐴𝑡 𝑌 = 𝐴𝑡 𝐴𝑋

La matriz 𝐴𝑡 𝐴 ∈ ℳ2𝑥2 es cuadrada y si suponemos que es invertible (¿qué condiciones tienen que cumplir 𝑎1 , … , 𝑎𝑛 para que lo sea?) podemos multiplicar ambos lados por su inversa y obtenemos que: 𝑋 = (𝐴𝑡 𝐴)−1 𝐴𝑡 𝑌

La última igualdad nos proporciona los valores buscados de 𝑎 y 𝑏, pues el resto de parámetros se suponen conocidos. Observación: lo importante de de los apartados de ajustes (este y los dos siguientes) es saber aplicar la fórmula con rapidez y seguridad. No merece la pena que dediquéis mucho tiempo a entender perfectamente todos los pasos de la demostración anterior. - Ejemplo: ajustar los puntos (0,1), (1,3), (2,4), (3,4), (4,5) de forma lineal por el método de los mínimos cuadrados.

Pedro_CC

14

1 1 2 ⎛ ⎞ ⎛1 Empleando la notación anterior resulta 𝑌 = ⎜3⎟ , 𝐴 = ⎜1 1 4 ⎝ 5⎠ ⎝1 𝑋 = (𝐴𝑡 𝐴)−1 𝐴𝑡 𝑌 = �

Por tanto la recta pedida es 𝑦 = 𝑏𝑥 + 𝑎 =

9 𝑥 10

+

8 5

0 1⎞ 2⎟ de donde se sigue que: 3 4⎠

8/5 𝑎 �=� � 𝑏 9/10

6.12- Ajuste polinómico por el método de los mínimos cuadrados. Supongamos que tenemos 𝑚 puntos en el plano (𝑐𝑖 , 𝑏𝑖 ) con 𝑖 ∈ {1, … , 𝑚} y esta vez queremos encontrar el polinomio de grado 𝑛 que mejor los aproxima. Es decir, queremos calcular los coeficientes 𝑎0 , 𝑎1 , 𝑎2 , … , 𝑎𝑛 que hacen que la función 𝑦 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 + ⋯ + 𝑎𝑛 𝑥 𝑛 aproxime los puntos dados lo mejor posible. En razonamiento es análogo al ajuste lineal, ya que lo que nos gustaría es que: 𝑏1 = 𝑎0 + 𝑎1 𝑐1 + 𝑎2 𝑐12 + ⋯ + 𝑎𝑛 𝑐1𝑛 …

2 𝑛 + ⋯ + 𝑎𝑛 𝑐𝑚 𝑏𝑚 = 𝑎0 + 𝑎1 𝑐𝑚 + 𝑎2 𝑐𝑚

1 𝑐1 𝑐12 … 𝑐1𝑛 𝑎0 𝑏1 𝑛 2 1 𝑐 𝑐 … 𝑐 2 2 2 ⎞ , 𝑋 = � … �. La expresión anterior es 𝑌 = 𝐴𝑋. Sean 𝑌 = � … � , 𝐴 = ⎛ … … … … … 𝑎𝑛 𝑏𝑚 2 𝑛 … 𝑐𝑚 ⎝ 1 𝑐𝑚 𝑐𝑚 ⎠ A partir de aquí seguimos el razonamiento del caso lineal y obtenemos la misma expresión por lo que los parámetros buscados vienen dados por la expresión 𝑋 = (𝐴𝑡 𝐴)−1 𝐴𝑡 𝑌 - Ejemplo: ajustar los puntos (0,1), (1,3), (2,4), (3,4), (4,5) por un polinomio de grado 2. 1 1 ⎛ 2⎞ ⎛1 Empleando la notación anterior resulta 𝑌 = ⎜3⎟ , 𝐴 = ⎜1 4 1 5 1 ⎝ ⎠ ⎝

0 0 1 1⎞ 2 4 ⎟ de donde se sigue que: 3 9 4 16⎠

𝑎0 41/35 123/70 � = �𝑎1 � 𝑋 = (𝐴 𝐴) 𝐴 𝑌 = � 𝑎2 −3/10 𝑡

−1 𝑡

Por tanto la función buscada es 𝑦 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 = 6.12- Ajuste de datos en ℝ𝒏.

41 123 + 𝑥 35 70



3 2 𝑥 10

Si en lugar de tener puntos en ℝ𝟐 tenemos 𝑘 puntos en ℝ𝒏 de la forma: (𝑎11 , 𝑎12 , … , 𝑎1𝑛 , 𝑏1 )

Pedro_CC

15

(𝑎21 , 𝑎22 , … , 𝑎2𝑛 , 𝑏2 ) …

(𝑎𝑘1 , 𝑎𝑘2 , … , 𝑎𝑘𝑛 , 𝑏𝑘 )

y los queremos ajustar mediante una función del tipo:

𝑠0 + 𝑠1 𝑥1 + 𝑠2 𝑥2 + ⋯ + 𝑠𝑛 𝑥𝑛 = 𝑥𝑛+1

sustituimos los puntos en la función anterior (𝑠𝑖 son los parámetros que queremos determinar) y obtenemos un sistema análogo a los de los apartados anteriores: 𝑠0 + 𝑠1 𝑎11 + 𝑠2 𝑎12 + ⋯ + 𝑠𝑛 𝑎1𝑛 = 𝑏1

𝑠0 + 𝑠1 𝑎21 + 𝑠2 𝑎22 + ⋯ + 𝑠𝑛 𝑎2𝑛 = 𝑏2 …

𝑠0 + 𝑠1 𝑎𝑘1 + 𝑠2 𝑎𝑘2 + ⋯ + 𝑠𝑛 𝑎𝑘𝑛 = 𝑏𝑘

1 𝑎11 𝑎12 … 𝑎1𝑛 𝑠0 𝑏1 1 𝑎21 𝑎22 … 𝑎2𝑛 Sean 𝑌 = � … � , 𝐴 = � � , 𝑋 = � … �. La expresión anterior es 𝑌 = … … … … … 𝑠𝑛 𝑏𝑘 1 𝑎𝑘1 𝑎𝑘2 … 𝑎𝑘𝑛 𝐴𝑋. A partir de aquí seguimos el razonamiento de los casos anteriores y obtenemos (sorprendentemente) que los parámetros buscados vienen dados por 𝑋 = (𝐴𝑡 𝐴)−1 𝐴𝑡 𝑌

- Ejemplo: ajustar los puntos (2, −1,0), (1,3,5), (3, −2,1), (0,0,0) mediante un plano de la forma 𝑧 = 𝑎 + 𝑏𝑥 + 𝑐𝑦

0 1 2 −1 −1/5 𝑎 5 1 1 3 Tenemos 𝑌 = � � , 𝐴 = � � por lo que 𝑋 = (𝐴𝑡 𝐴)−1 𝐴𝑡 𝑌 = �17/15� = �𝑏� por 1 1 3 −2 𝑐 4/3 0 1 0 0 1 17 4 lo que el plano pedido es 𝑧 = − + 𝑥 + 𝑦 5

15

3

6.13- Diagonalización de matrices ortogonales.

Se dice que una matriz 𝐴 es ortogonal si verifica 𝐴−1 = 𝐴𝑡 . Esto implica que las columnas de 𝐴 son ortogonales respecto del producto escalar usual. Algunas propiedades de las matrices ortogonales son: i) Si 𝐴 es ortogonal su determinante vale ±1. Si det(𝐴) = 1 diremos que 𝐴 es matriz directa y si det(𝐴) = −1 diremos que 𝐴 es matriz inversa.

ii) Si 𝐴 es ortogonal 𝐴−1 y 𝐴𝑡 también lo son.

iii) Si 𝐴 y 𝐵 son ortogonales su producto también lo es.

6.14- Diagonalización de matrices simétricas.

Pedro_CC

16

Si 𝐴 es una matriz simétrica se verifica que: i) Sus autovalores son reales.

ii) 𝐴 es estrictamente diagonalizable.

iii) Autovectores asociados a autovalores distintos son ortogonales entre si (respecto del producto escalar usual) iv) Podemos encontrar una base 𝐵 ortonormal respecto del producto escalar usual respecto de la cual la matriz de 𝑓 es diagonal (forma canónica de Jordan). Además, la matriz de paso 𝑃 que tiene por columnas los elementos de B es ortogonal. Para calcular dicha base 𝐵 es suficiente con encontrar una base ortonormal de cada subespacio invariante. -Resumen capítulo 6: Lo más importante de este capítulo es la parte acerca de los productos escalares y de la matriz proyección, y es la que tendrá más peso en los exámenes. De la parte de ajustes por medio de funciones puede caer alguna cuestión, y en principio con manejar las fórmulas con soltura (que al final es siempre la misma) y tener una idea intuitiva de por qué funcionan debería bastar. En el examen intercuatrimestral de finales de febrero este tema puede llegar a ocupar unos 5 puntos del examen entre problemas y cuestiones por lo que es importante. Los problemas se suelen poder resolver sin utilizar la matriz proyección (proyectando mediante las fórmulas del apartado 6.9 si se pide) y en las cuestiones suele caer algo en lo que hay que utilizar alguna propiedad de la matriz proyección. Veamos un ejemplo facilito de un examen de hace unos cuantos años: - Ejemplo (examen parcial febrero 2005, 1.5 puntos): 1 0 0 Sea 𝐸 un espacio vectorial euclídeo de dimensión 3 y sea 𝐺 = �0 2 0� la matriz del 0 0 1 producto escalar en la base 𝐵 = {𝑒̅1 , 𝑒̅1 + 𝑒̅2 , 𝑒̅1 + 𝑒̅2 + 𝑒̅3 }. Sea 𝐵′ = {𝑒̅1 , 𝑒̅2 , 𝑒̅3 } otra base de 𝐸. Contestar razonadamente si son ciertas o falsas las siguientes proposiciones: i) (2𝑒̅1 + 𝑒̅2 ) ∘ (2𝑒̅1 + 𝑒̅2 ) = 5

ii) Los subespacios 𝑉1 = 𝐿{𝑒̅1 } y 𝑉2 = 𝐿{𝑒̅1 + 𝑒̅2 , 𝑒̅3 } son ortogonales

1 2 0 iii) La matriz del producto escalar en la base 𝐵′ es 𝐺 ′ = �2 5 1� 0 1 2

i) El vector 2𝑒̅1 + 𝑒̅2 tiene coordenadas (1,1,0) respecto de la base 𝐵 por lo que el producto escalar pedido vale: 1 0 0 1 (1,1,0) �0 2 0� �1� = 3 0 0 1 0 Pedro_CC

17

por lo que la proposición es falsa. ii) Los vectores 𝑒̅1 , 𝑒̅1 + 𝑒̅2 , 𝑒̅3 tienen coordenadas (1,0,0), (0,1,0), (0, −1,1) en la base 𝐵, respectivamente por lo que tenemos: 1 0 0 0 𝑒̅1 ∘ (𝑒̅1 + 𝑒̅2 ) = (1,0,0) �0 2 0� �1� = 0 0 0 1 0 1 0 0 0 𝑒̅1 ∘ 𝑒̅3 = (1,0,0) �0 2 0� �−1� = 0 0 0 1 1

por lo que los subespacios son ortogonales y la proposición es verdadera. 1 −1 0 iii) La matriz de cambio de base de 𝐵′ a 𝐵 es 𝐴 = �0 1 −1� por lo que la matriz pedida 0 0 1 1 −1 0 será 𝐺 ′ = 𝐴𝑡 𝐺𝐴 = �−1 3 −2� y la proposición es falsa. 0 −2 3 Veamos otro ejercicio más parecido a lo que os encontrareis en el intercuatrimestral: - Ejemplo (intercuatrimestral marzo 2012, 3.5 puntos) Sea 𝐸 un espacio euclídeo en el que se tiene definido un producto escalar ∘ y sea 𝐵 = {𝑒̅1 , 𝑒̅2 , 𝑒̅3 } una base de 𝐸. Sabiendo que: 𝜋 3

i) 𝑒̅2 𝑦 𝑒̅3 forman un ángulo de .

ii) Los vectores 𝑒̅1 , 𝑒̅2 , 𝑒̅3 tienen por módulos los número naturales pares más pequeños que hacen que ∘ sea un producto escalar. iii) 𝐵′ = {𝑒̅1 , 𝑒̅2 + 𝑒̅3 , 𝑒̅2 − 𝑒̅3 } es una base ortogonal de 𝐸

Se pide:

a) Calcular la matriz A del producto escalar ∘ en la base 𝐵

b) Dado el subespacio 𝑉 = 𝐿{𝑒̅1 + 𝑒̅2 + 𝑒̅3 , 𝑒̅1 + 2𝑒̅2 } calcular una base ortogonal de 𝑉 ⊥ . c) Calcular la proyección ortogonal de 𝑒̅2 − 𝑒̅3 sobre 𝑉 ⊥ .

Este ejercicio tiene su punto de dificultad puesto que si no se resuelve correctamente el primer apartado (que es el más complicado) será difícil hacer algo en los otros dos. a) En este caso parece más fácil calcular cuánto valen todos los productos escalares entre los elementos de la base 𝐵 que intentar hacer algún cambio de base de 𝐵 a 𝐵′ . Vamos a ir poco a poco, para lo cual vamos a dejar la propiedad ii) para el final pues es la más “rara” y no parece que podamos utilizarla hasta que tengamos una matriz del producto escalar en la que sólo haya unas pocas incógnitas, así que empleamos primero el hecho de que 𝐵′ es ortogonal para calcular algunos productos escalares: Pedro_CC

18

𝑒̅1 ∘ (𝑒̅2 + 𝑒̅3 ) = 𝑒̅1 ∘ 𝑒̅2 + 𝑒̅1 ∘ 𝑒̅3 = 0 𝑒̅1 ∘ (𝑒̅2 − 𝑒̅3 ) = 𝑒̅1 ∘ 𝑒̅2 − 𝑒̅1 ∘ 𝑒̅3 = 0

(𝑒̅2 + 𝑒̅3 ) ∘ (𝑒̅2 − 𝑒̅3 ) = 𝑒̅2 ∘ 𝑒̅2 + 𝑒̅3 ∘ 𝑒̅2 − 𝑒̅2 ∘ 𝑒̅3 − 𝑒̅3 ∘ 𝑒̅3 = 𝑒̅2 ∘ 𝑒̅2 − 𝑒̅3 ∘ 𝑒̅3 = 0

Las dos primeras expresiones forman un sistema de dos ecuaciones con dos incógnitas cuya solución es 𝑒̅1 ∘ 𝑒̅2 = 𝑒̅1 ∘ 𝑒̅3 = 0, y de la tercera expresión se sigue que 𝑎 = 𝑒̅2 ∘ 𝑒̅2 = 𝑒̅3 ∘ 𝑒̅3 (siendo 𝑎 una incógnita que tendremos que calcular). No parece que podamos sacar más información del hecho de que 𝐵′ sea ortogonal así que vamos a usar la condición i), a ver qué podemos deducir de aquí. 𝜋 3

1 2

𝑒̅ ∘ 𝑒̅

Tenemos cos � � = = |𝑒̅2 ||𝑒̅���3| = 2

3

𝑒̅2 ∘ 𝑒̅3 𝑎

𝑎 2

de donde tenemos que 𝑒̅2 ∘ 𝑒̅3 = . Sólo nos falta

calcular 𝑒̅1 ∘ 𝑒̅1 por lo que ponemos 𝑒̅1 ∘ 𝑒̅1 = 𝑏 (otra incógnita que tenemos que calcular) y la matriz pedida será de la forma: 𝑏 𝐴 = �0 0

0 0 𝑎 𝑎/2� 𝑎/2 𝑎

Vamos a usar la condición ii) para determinar los valores de 𝑎 y 𝑏. Para que 𝐴 sea matriz de un producto escalar imponemos que los tres menores principales sean positivos y obtenemos que: 𝑏>0

𝑎𝑏 > 0

3 2 𝑎 𝑏>0 4

Lo único que sacamos de aquí es que 𝑎 y 𝑏 tienen que ser positivos (lo cual ya sabíamos por la propia condición ii) así que ponemos 𝑏 = 4, 𝑎 = 4 puesto que son los valores que hacen que los módulos de 𝑒̅2 𝑦 𝑒̅3 valgan 2, que es el menor número natural par (notad que en el enunciado no dice que los módulos tengan que tomar valores distintos) y la matriz pedida queda: 4 0 0 𝐴 = �0 4 2� 0 2 4

-Observación: hay que leer bien el enunciado y tener cuidado: sería una lástima hacer 𝑏 = 2, 𝑎 = 2 al final y perder puntos por no haber tenido en cuenta que es el módulo del vector el que tiene que tomar el valor 2 y no el producto escalar. Este apartado es un perfecto ejemplo de cómo ir resolviendo el problema del examen: hay que jugar con las propiedades para ir sacando poco a poco la información que nos piden. b) Afortunadamente este apartado es un cálculo mecánico si se ha resuelto correctamente el anterior. Es claro que 𝑉 ⊥ tiene que tener dimensión uno por lo que sea 𝑉 ⊥ = 𝐿{𝑢�} siendo 𝑢� un vector de coordenadas ((𝑥, 𝑦, 𝑧) en la base 𝐵. Imponemos que dicho vector sea ortogonal a los de la base de 𝑉: Pedro_CC

19

4 0 0 1 4 (𝑒̅ ) (𝑥, (𝑥, 𝑢� ∘ 1 + 𝑒̅2 + 𝑒̅3 = 𝑦, 𝑧) �0 4 2� �1� = 𝑦, 𝑧) �6� = 4𝑥 + 6𝑦 + 6𝑧 = 0 0 2 4 1 6 4 0 0 1 4 𝑢� ∘ (𝑒̅1 + 2𝑒̅2 ) = (𝑥, 𝑦, 𝑧) �0 4 2� �2� = (𝑥, 𝑦, 𝑧) �8� = 4𝑥 + 8𝑦 + 4𝑧 = 0 0 2 4 0 4

resolviendo el sistema pasando 𝑧 a la columna de términos independientes y haciendo 𝑧 = 𝜆 obtenemos que 𝑢� = (−3𝜆, 𝜆, 𝜆) por lo que se tiene que 𝑉 ⊥ = 𝐿{−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 }. Finalmente hay que dividir dicho vector por su módulo para que la base sea ortonormal. Tenemos: 4 0 0 −3 |−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 | = �(−3,1,1) ∘ (−3,1,1) = [(−3,1,1) �0 4 2� � 1 �]1/2 = 481/2 0 2 4 1 −3𝑒̅1 +𝑒̅2 +𝑒̅3 )} 481/2

por lo que la base pedida en el enunciado es 𝐵∗ = {(

c) De nuevo, este apartado es sólo un cálculo mecánico si se han resuelto correctamente los dos apartados anteriores. Basta con proyectar sobre cualquier vector proporcional a 𝑢� para obtener lo pedido por lo que aplicando la fórmula de teoría tenemos que la proyección pedida es: (𝑒̅2 − 𝑒̅3 ) ∘ (−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 ) (−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 ) (−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 ) ∘ (−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 )

calculamos los productos escalares:

4 0 0 −3 (𝑒̅2 − 𝑒̅3 ) ∘ (−3𝑒̅1 + 𝑒̅2 + 𝑒̅3 ) = (0,1, −1) �0 4 2� � 1 � = 0 0 2 4 1

esto implica que la proyección pedida vale cero y no hay necesidad de hacer más cálculos. El siguiente ejemplo combina preguntas del tema de autovalores y autovectores y de este tema: - Ejemplo (intercuatrimestral marzo 2011, 3 puntos): Sea 𝐴 ∈ ℳ3𝑥3 una matriz simétrica de traza 2𝑎 + 𝑏. Sabiendo que el subespacio invariante asociado al autovalor 𝜆1 = 𝑎 contiene al subespacio de ecuaciones implícitas 𝑥 + 𝑦 + 𝑧 = 0 se pide: a) Calcular una forma canónica de Jordan 𝐽 y una matriz de paso 𝑃 ortogonal tal que 𝐽 = 𝑃𝑡 𝐴𝑃 según los diferentes valores de 𝑎 y 𝑏.

b) Determinar los valores de 𝑎 y 𝑏 para los que 𝐴 puede ser la matriz de un producto escalar.

c) Si 𝑎 y 𝑏 toman los valores naturales más pequeños que hacen que 𝐴 sea la matriz de un producto escalar, calcular el ángulo que forman los vectores (1, −1,0) y (1,1,1) respecto de dicho producto escalar.

Pedro_CC

20

Igual que en el ejemplo anterior, parece que el apartado más difícil es el primero y que una vez resuelto éste los otros dos serán cálculos rutinarios. a) Como 𝐴 es simétrica sabemos que 𝐴 es estrictamente diagonalizable y que sus autovalores son reales (por el apartado 6.14). También sabemos que 𝜆1 = 𝑎 es autovalor de multiplicidad al menos 2 puesto que su subespacio invariante contiene a un subespacio de dimensión 2 por el enunciado. Por otra parte, la suma de los tres autovalores de 𝐴 es 2𝑎 + 𝑏 por el enunciado por lo que sólo hay dos posibilidades: i) 𝑎 = 𝑏, lo que implica que 𝜆1 = 𝑎 es autovalor triple y su subespacio invariante tendrá dimensión 3 puesto que 𝐴 es estrictamente diagonalizable, lo que implica que dicho subespacio invariante es en realidad todo el espacio vectorial y podemos tomar una base canónica como base ortonormal de dicho subespacio. En este caso tenemos: 𝑎 𝐽 = �0 0

0 𝑎 0

0 1 0 0 0� , 𝑃 = �0 1 0� 𝑎 0 0 1

ii) 𝑎 ≠ 𝑏, lo que implica que 𝜆1 = 𝑎 es autovalor doble y su subespacio invariante tendrá como ecuación implícita 𝑥 + 𝑦 + 𝑧 = 0 y 𝜆1 = 𝑏 es autovalor simple cuyo autovector asociado será ortogonal a los dos autovectores de 𝜆1 = 𝑎. En este caso tenemos: 𝑎 𝐽 = �0 0

0 𝑎 0

0 0� 𝑏

Para calcular 𝑃 obtenemos primero una base ortogonal y después dividimos cada vector por su módulo. Tenemos 𝑁1,𝑎 = 𝐿{(1,0, −1), (0,1, −1)} de donde se sigue que 𝑁1,𝑏 = 𝐿{(1,1,1)} puesto que ambos subespacios son ortogonales (podemos calcularlo haciendo el producto vectorial de (1,0, −1) 𝑦 (0,1, −1)). Dividiendo cada vector por su módulo (respecto del producto escalar usual) obtenemos: 0 1/√3 1/√2 𝑃=� 0 1/√2 1/√3� −1/√2 −1/√2 1/√3

b) Como 𝑃 es una matriz ortogonal tenemos que 𝐽 = 𝑃𝑡 𝐴𝑃 = 𝑃−1 𝐴𝑃 por lo que 𝐴 será matriz de un producto escalar si y solo si 𝐽 también lo es. Imponiendo que los tres menores principales de 𝐽 sean positivos obtenemos que 𝑎 > 0,𝑏 > 0 son las condiciones necesarias y suficientes para que 𝐴 pueda ser matriz de un producto escalar. c) Tomamos 𝑎 = 𝑏 = 1 (notad que tampoco dice que tengan que ser distintos) de donde se sigue que 𝐽 = 𝐼 y por tanto 𝐴 = 𝑃𝐽𝑃−1 = 𝑃𝑃−1 = 𝐼, por lo que estamos trabajando con el producto escalar usual. Tenemos: cos(𝛼) =

(1, −1,0) ∘ (1,1,1) =0 |(1, −1,0)||(1,1,1)|

por lo que ambos vectores forman un ángulo de 90 grados.

Pedro_CC

21

Finalmente, os aconsejo que trabajéis todos los ejercicios y cuestiones de los exámenes intercuatrimestrales del segundo cuatrimestre de los últimos tres años (hemos visto un par de ellos aquí) para ir bien preparados al intersemestral de febrero.

Pedro_CC

22

Get in touch

Social

© Copyright 2013 - 2025 MYDOKUMENT.COM - All rights reserved.