Story Transcript
Tema 5. Derivación Matricial.
Tema 5. Derivación Matricial. Análisis Matemático I 1º Estadística
| Universidad de Granada | Noviembre 2012
1 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Definición Dadas dos matrices A ∈ Mm×n y B ∈ Mp×q , el producto de Kronecker de A y B, que notaremos por A ⊗ B, es la matriz de orden mp × nq dada por a11 B a12 B · · · a1n B a21 B a22 B · · · a2n B A ⊗ B := .. .. .. . . . . am1 B
| Universidad de Granada | Noviembre 2012
am2 B
···
amn B
2 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Observación Para cualquier matriz B se verifica B 0 ··· 0 B ··· In ⊗ B = . . .. .. 0 0 ···
0 0 .. .
.
B
Por tanto, In ⊗ Im = Inm ,
| Universidad de Granada | Noviembre 2012
∀n, m ∈ N .
3 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Ejemplo Si las matrices A y B vienen dadas por A = entonces tenemos
1
A⊗B =
−1
0 3 = 0 −3
| Universidad de Granada | Noviembre 2012
0 3
1 −2
0 3
1 −2
2 0
1 −1
2 0
0 3
1 −2
0 3
1 −2
3 5
3 5
yB=
0 3 0 3
1 −2
0 3
1 −2
1 −2
1 0 2 0 3 −2 6 −4 9 −6 −1 0 0 0 5 2 0 0 15 −10
4 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Propiedades del producto de Kronecker Es una aplicación bilineal. Es decir, si A1 , A2 ∈ Mm×n , B1 , B2 ∈ Mp×q , entonces (A1 + A2 ) ⊗ B1 = (A1 ⊗ B1 ) + (A2 ⊗ B1 ), A1 ⊗ (B1 + B2 ) = (A1 ⊗ B1 ) + (A1 ⊗ B2 ), (αA1 ⊗ B1 ) = (A1 ⊗ αB1 ) = α(A1 ⊗ B1 ),
∀α ∈ R
Para cualesquiera matrices A, B y C se verifica que (A ⊗ B) ⊗ C = A ⊗ (B ⊗ C ) No es conmutativo en general.
| Universidad de Granada | Noviembre 2012
5 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Propiedades del producto de Kronecker Si A1 ∈ Mm×n , A2 ∈ Mn×p , B1 ∈ Mq×r , B2 ∈ Mr ×s , entonces se verifica (A1 ⊗ B1 )(A2 ⊗ B2 ) = A1 A2 ⊗ B1 B2 Si A y B son matrices cuadradas invertibles, entonces A ⊗ B también es invertible y (A ⊗ B)−1 = A−1 ⊗ B −1 Para matrices A y B cualesquiera se verifica que (A ⊗ B)t = At ⊗ B t Si A y B son matrices cuadradas, se tiene que tr (A ⊗ B) = tr (A)tr (B)
| Universidad de Granada | Noviembre 2012
6 / 24
Tema 5. Derivación Matricial.
Producto de Kronecker Propiedades del producto de Kronecker Si A y B son matrices cuadradas de órdenes m y n, respectivamente, entonces det(A ⊗ B) = det(A)n det(B)m Para matrices A y B cualesquiera se verifica que rg (A ⊗ B) = rg (A)rg (B) Si A es una matrizparticionada en bloques de la forma A11 A12 A= y B es otra matriz, entonces A21 A22 A⊗B =
| Universidad de Granada | Noviembre 2012
A11 ⊗ B A21 ⊗ B
A12 ⊗ B A22 ⊗ B
7 / 24
Tema 5. Derivación Matricial.
Vectorización de una matriz Definición Si A es una matriz de orden m × n, definimos la vectorización de A, que → − notaremos por A , como la matriz columna dada por a•1 a1j a•2 a2j → − A := donde a•j := .. , .. , ∀j ∈ {1, . . . , n} . . . a•n
amj
(Nótese que a•j es simplemente la columna j-ésima de la matriz A)
| Universidad de Granada | Noviembre 2012
8 / 24
Tema 5. Derivación Matricial.
Ejemplo Si A =
1 4
2 5
3 6
, entonces → − A =
| Universidad de Granada | Noviembre 2012
1 4 2 5 3 6
9 / 24
Tema 5. Derivación Matricial.
Vectorización de una matriz Propiedades de la vectorización Es una aplicación lineal Si A ∈ Mm×n y B ∈ Mn×p se verifica −→ → − → − → − AB = (B t ⊗ Im ) A = (Ip ⊗ A) B = (B t ⊗ A) In Si A ∈ Mm×n , se tiene → − → − − → A = (In ⊗ A) In = (At ⊗ Im )Im Si A ∈ Mm×n , B ∈ Mn×p y C ∈ Mp×q , se verifica −−→ → − → − → − ABC = (C t ⊗ A) B = (Iq ⊗ AB) C = (C t B t ⊗ Im ) A .
| Universidad de Granada | Noviembre 2012
10 / 24
Tema 5. Derivación Matricial.
Vectorización de una matriz Propiedades de la vectorización Usando las propiedades segunda y primera de la vectorización se deduce que si A, B ∈ Mm×n y C , D ∈ Mn×p , entonces −−−−−−−−−−−→ (A + B)(C + D)
→ − → − = [(Ip ⊗ A) + (Ip ⊗ B)][ C + D ] → − → − = [(C t ⊗ Im ) + (D t ⊗ Im )][ A + B ]
Si A ∈ Mm×n y B ∈ Mn×m , entonces − → → − → → − − tr (AB) = (At )t B = (B t )t A , en particular, si n = m y B = In , entonces − → → − − → − → tr (A) = (At )t In = ( In )t A ,
| Universidad de Granada | Noviembre 2012
11 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Introducción En cursos anteriores se ha estudiado el concepto de diferenciabilidad para funciones de Rn en Rm . Como los espacios de matrices con coeficientes reales son, salvo identificación, Rn para conveniente natural n, la diferenciabilidad de funciones de variable matricial y con valores en otro espacio de matrices es la ya conocida. Adoptaremos algún convenio sobre el orden en que escribiremos las derivadas parciales de las funciones reales involucradas. A continuación recordamos (en los casos ya conocidos) el orden en que se suelen escribir las derivadas parciales; estos serán casos particulares de la derivada matricial que definiremos más adelante.
| Universidad de Granada | Noviembre 2012
12 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Casos conocidos de derivadas matriciales Función con valores escalares (y : Rn −→ R)
∂y ∂y y = y (x1 , x2 , . . . , xn ) tiene derivada ∂x , . . . , (el gradiente de y ). ∂xn 1 Función de variable realcon valores vectoriales (y : R −→ Rm ) dy1 (x ) y1 (x ) dx y2 (x ) .. y = y (x ) = tiene derivada . .. . . ym (x )
| Universidad de Granada | Noviembre 2012
dym (x ) dx
13 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Casos conocidos de derivadas matriciales n m Función de variable vectorial con valores vectoriales (y : R −→ R ) y1 (x1 , . . . , xn ) .. y = y (x ) = .
ym (x1 , . . . , xn ) ∂y1 (x ) ... ∂x. 1 . tiene derivada . ∂ym (x ) ... ∂x1
| Universidad de Granada | Noviembre 2012
∂y1 (x ) ∂xn
.. .
∂ym (x ) ∂xn
(el jacobiano de y ).
14 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Derivada matricial de una función real de variable matricial Sea y = y (X ) una función real de variable matricial, esto es, y : Mp×n (R) −→ R. La derivada de y (con respecto a la matriz X ) es la ∂y función matricial que se suele notar por ∂X (X ) y que viene dada por ∂y ∂y . . . ∂x1n ∂x.11 ∂y .. = ∂y .. := . ∂X ∂xij i=1,...,p ∂y ∂y j=1,...,n . . . ∂x ∂xp1 pn Nótese que la derivada matricial de una función real definida en Mp×n (R) es una función definida en Mp×n (R) y con valores en el mismo espacio de matrices.
Observación Nótese que si p = 1, M1×n (R) se identifica de forma natural con Rn , y es más que el gradiente de y . | Universidad de Granada | Noviembre 2012
∂y ∂X
no
15 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Ejemplo Se considera la función matricial F : M2×2 (R) −→ R dada por x11 x12 F = e x11 x21 + 5x12 x21 x22 Entonces la derivada matricial de F viene dada por ∂F x ∂F e 11 x21 ∂x11 ∂x12 ∂F = := ∂X ∂y ∂y e x11 ∂x ∂x 21
| Universidad de Granada | Noviembre 2012
22
5
0
16 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Derivada de una función matricial de variable matricial Sea Y = Y (X ) una función matricial de variable matricial; supongamos que Y : Mp×n −→ Mm×q . La derivada de Y (con respecto a la matriz X ) es la función matricial (que notaremos ∂Y ∂X ) definida en Mp×n y con valores en Mpm×nq dada por ∂y11 ∂y . . . ∂X1q ∂X ∂Y .. . := ... . ∂X ∂ymq ∂ym1 . . . ∂X ∂X Nótese que como cada yij es una función escalar de variable matricial, para ∂y calcular ∂Xij hay que aplicar la fórmula dada en la definición previa, esto es, ∂y ∂y ij . . . ∂x1nij ∂x11 . ∂yij .. .. := ∀1 6 i 6 m, 1 6 j 6 q . . , ∂X ∂yij ∂yij . . . ∂xpn ∂xp1 | Universidad de Granada | Noviembre 2012
17 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Ejemplo Se considera la función matricial Y : M1×2 ≡ R2 −→ M2×1 dada por 2 x1 + x23 y1 (x1 , x2 ) . = Y (x1 , x2 ) = 2x1 x2 y2 (x1 , x2 ) Entonces la derivada matricial de Y viene dada por ∂Y := ∂X
| Universidad de Granada | Noviembre 2012
∂y1 ∂X ∂y2 ∂X
=
∂y1 ∂x1
∂y1 ∂x2
∂y2 ∂x1
∂y2 ∂x2
2x1
3x22
=
2x2
2x1
18 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Reglas de derivación Sea C una matriz de orden p × n (C será la variable independiente). Linealidad Si A, B : Mp×n −→ Mm×q , entonces ∂(A + tB) ∂A ∂B = +t , ∂C ∂C ∂C
∀t ∈ R
Derivada del producto Sean A : Mp×n −→ Mm×q y B : Mp×n −→ Mq×r , entonces se verifica que ∂A ∂B ∂(AB) = (B ⊗ In ) + (A ⊗ Ip ) ∂C ∂C ∂C
| Universidad de Granada | Noviembre 2012
19 / 24
Tema 5. Derivación Matricial.
Matrices de permutación Definición Una matriz de permutación de orden mn, que notaremos por Pm,n , es una matriz cuadrada de orden mn dividida en mn bloques de orden m × n. El bloque (i, j) tiene todos sus elementos nulos, salvo el que está situado en el lugar (j, i) que vale 1.
Ejemplos La matriz de permutación P2,3 es cuadrada, tiene orden 3 · 2 = 6 y está formada por 6 bloques de orden 2 × 3. En este caso tenemos que: 1 0 0 0 0 0 0 0 0 1 0 0 B11 B12 0 1 0 0 0 0 B21 B22 P2,3 = = 0 0 0 0 1 0 B31 B32 0 0 1 0 0 0 0 0 0 0 0 1 | Universidad de Granada | Noviembre 2012
20 / 24
Tema 5. Derivación Matricial.
Matrices de permutación Ejemplos La matriz de permutación P3,2 es cuadrada, formada por 6 bloques de orden 3 × 2: 1 0 0 B11 B12 B13 = P3,2 = 0 B21 B22 B23 0 0
tiene orden 3 · 2 = 6 y está 0 0 0 1 0 0
0 1 0 0 0 0
0 0 0 0 1 0
0 0 1 0 0 0
0 0 0 0 0 1
De forma análoga tenemos P2,2 =
| Universidad de Granada | Noviembre 2012
B11 B21
B12 B22
=
1 0 0 0 0 1 0 0
0 1 0 0
0 0 0 1
21 / 24
Tema 5. Derivación Matricial.
Matrices de permutación Proposición Si n, m ∈ N, se verifica: Pm,1 = P1,m = Im t Pm,n = Pn,m Pm,n es una matriz ortogonal Pm,n Pn,m = Inm
| Universidad de Granada | Noviembre 2012
22 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Reglas de derivación La variable independiente C es una matriz de orden p × n. Derivada del producto de Kronecker Sean A : Mp×n −→ Mm×q y B : Mp×n −→ Ms×r , entonces se verifica que ∂(A ⊗ Ir ) ∂(A ⊗ B) ∂B = A⊗ + Im ⊗ B ⊗ Ip ∂C ∂C ∂C donde ∂(A ⊗ Ir ) ∂A = (Pr ,m ⊗ Ip ) Ir ⊗ (Pq,r ⊗ In ) . ∂C ∂C
| Universidad de Granada | Noviembre 2012
23 / 24
Tema 5. Derivación Matricial.
Derivadas matriciales Reglas de derivación La variable independiente C es una matriz de orden p × n. Regla de la cadena Sean A : Mp×n −→ Ms×r e Y : Ms×r −→ Mm×q , entonces se verifica que t → − ∂A ∂Y (A) ∂Y (A) ⊗ I . = p → − ∂C ∂C ∂A También se verifica que ∂Y (A) − t → − ∂A ∂Y (A) → ⊗ Ir ⊗ In . = ( Is ) ⊗ Ip ∂A ∂C ∂C
| Universidad de Granada | Noviembre 2012
24 / 24