Sistemas No-Lineales Profesor: Mar´ıa Etchechoury Departamento de Matem´atica, Facultad de Ciencias Exactas Universidad Nacional de La Plata e-mail:
[email protected]
3
2
1
0
−1
−2
−3 −3
−2
−1
0
1
1
2
3
Introducci´ on En distintas ramas de la F´ısica y de la Ingenier´ıa se utilizan los sistemas no-lineales para modelar por ejemplo circuitos el´ectricos, sistemas mec´anicos, procesos qu´ımicos, etc. En este Curso estudiaremos sistemas din´amicos modelados por un n´ umero finito de ecuaciones diferenciales ordinarias de primer orden: x˙ 1 = f1 (t, x1 , . . . , xn ) x˙ 2 = f2 (t, x1 , . . . , xn ) .. . x˙ n = fn (t, x1 , . . . , xn ) donde
dxi . dt Llamamos a las variables x1 , x2 , . . . , xn variables de estado del sistema. En notaci´on matricial se tendr´a: x1 f1 (t, x) x2 f2 (t, x) x = .. , f (t, x) = ; .. . . xn fn (t, x) xi = xi (t), x˙ i =
luego el sistema din´amico queda representado por x˙ = f (t, x) llamada ecuaci´ on de estado del sistema. Un caso especial es aqu´el en el que el campo vectorial f no depende expl´ıcitamente del tiempo t, x˙ = f (x), y se llama sistema aut´onomo o invariante en el tiempo. Con este tipo de sistemas trabajaremos a lo largo del Curso. Algunos conceptos fundamentales vinculados a los Sistemas No-Lineales. Existen conceptos fundamentales de los sistemas no-lineales que nos ayudar´an a describir su comportamiento. Algunos de ellos son: 1. Punto de equilibrio: Un punto x = x∗ en el espacio de estados se llama punto de equilibrio para el sistema x˙ = f (x), si, cuando el estado (trayectoria o soluci´on) 2
del sistema comienza en x∗ , permanece en x∗ para todo tiempo futuro, tambi´en se lo llama punto fijo o punto estacionario. Para sistemas aut´onomos los puntos de equilibrio son las ra´ıces reales de la ecuaci´on f (x) = 0. El punto de equilibrio se dice aislado si existe alg´ un entorno del punto donde no existe otro equilibrio del sistema. 2. Estabilidad de un punto de equilibrio: Un punto de equilibrio x∗ es estable si para todo entorno V de x∗ existe un entorno V1 ⊂ V tal que toda soluci´on x(x0 , t) del sistema (2), con x0 ∈ V1 (donde x0 es la condici´on inicial), est´a definida y permanece en V para todo t > 0. Si V1 puede elegirse de modo tal que x(x0 , t) → x∗ cuando t → ∞, entonces se dice que x∗ es asint´ oticamente estable. 3. Sistemas Planares: son tambi´en llamados sistemas de dimensi´on dos o sistemas de dos variables de estado. Se representan por dos ecuaciones diferenciales escalares. Las soluciones del sistema se pueden representar como curvas en el plano, que llamaremos tambi´en ´orbitas. Las ´orbitas se representan en lo que se llama el plano de fase del sistema. 4. Oscilaci´ on: Un sistema oscila cuando tiene una soluci´on peri´odica no trivial. En un sistema planar una soluci´on peri´odica en el plano de fase resulta una ´orbita cerrada. El Curso se dictar´a en tres clases, donde se desarrollar´an los siguientes temas: • Primera Clase: Sistemas de Segundo Orden: Generalidades. Sistemas Planares Lineales: clasificaci´on de puntos de equilibrio. • Segunda Clase: Sistemas Planares No-Lineales: puntos de equilibrio, linealizaci´on, ciclos l´ımites. • Tercera Clase: Estabilidad de Lyapunov: estabilidad de puntos de equilibrio. Teoremas de estabilidad de Lyapunov. Dominio de atracci´on.
3
1
Primera Clase: Sistemas de Segundo Orden. Sistemas Planares Lineales.
Sistemas de Segundo Orden. Est´an determinados por dos ecuaciones diferenciales de primer orden: x˙ 1 = f1 (x1 , x2 ) x˙ 2 = f2 (x1 , x2 ) Las soluciones del sistema se pueden representar como curvas en el plano. Si por ejemplo x(t) = (x1 (t), x2 (t)) es la soluci´on del sistema planar para cierta condici´on inicial x0 = (x01 , x02 ), entonces la gr´afica en el plano x1 − x2 ser´a una curva que pasa por x0 . Al plano x1 − x2 donde se representan las ´orbitas o soluciones se lo llama plano de fase o plano de estados del sistema. Para cada punto x = (x1 , x2 ) en el plano de fase se tiene el vector f (x) = f (x1 , x2 ), es decir que f (x) es un campo vectorial sobre el plano de fase. Observar que el campo vectorial en un punto es tangente a la trayectoria en ese punto. Luego, puede construirse la trayectoria desde un estado inicial x0 , a partir del diagrama del campo vectorial. Llamamos retrato de fase o plano de fase del sistema a la familia de todas las trayectorias o curvas soluci´on del sistema. Nos preguntamos c´omo puede construirse el retrato de fase de un sistema planar? 1. Mediante un simulador de sistemas no lineales, dibujando trayectorias a partir de un n´ umero grande de estados iniciales sobre el plano x1 − x2 , es decir, computacionalmente. 2. Mediante el m´etodo de las isoclinas: Se considera la pendiente de la trayectoria en un punto dado (x1 , x2 ), f2 (x1 , x2 ) s(x1 , x2 ) = . f1 (x1 , x2 ) Las ecuaci´on s(x1 , x2 ) = c, con c constante, define sobre el plano x1 − x2 una curva a lo largo de la cual las trayectorias del sistema planar tienen pendiente c. Es decir, cuando una soluci´on cruza la curva s(x1 , x2 ) = c, lo hace con pendiente c. Para visualizar este m´etodo consideraremos un ejemplo cl´asico: la ecuaci´on del p´endulo. Su din´amica esta representada por la siguiente ecuaci´on diferencial de segundo orden: ˙ mlθ¨ = −mg sin θ − klθ, (1.1) 4
donde l representa la longitud de la varilla del p´endulo, m la masa de la bolilla que se encuentra al final de la varilla, θ es el ´angulo entre el eje vertical y la varilla, g es la aceleraci´on de la gravedad, y k es el coeficiente de fricci´on. Para poder trabajar en ecuaciones de estado, es decir ecuaciones de primer orden, ˙ Luego las ecuaciones de estado resultan, llamamos x1 = θ y x2 = θ. x˙ 1 = x2 g k x˙ 2 = − sin x1 − x2 l m En este caso las isoclinas est´an definidas por, x2 = −
1 sin x1 0.5 + c
6
4
x2
2
0
−2
−4
−6 −4
−3
−2
−1
0 x1
1
2
3
´ Figure 1.1: Orbitas del p´endulo con fricci´on. Isoclinas.
5
4
Sistemas Planares Lineales. Por qu´e los estudiaremos en particular? Para estudiar un sistema no-lineal planar se comienza analizando sus puntos de equilibrio y sus flujos (o trayectorias) en un entorno de cada equilibrio. Existen resultados, que veremos m´as adelante, que aseguran que el comportamiento de un sistema no-lineal localmente alrededor de cada equilibrio se puede determinar a partir del comportamineto de su linealizaci´ on alrededor de dicho punto. Queremos entonces estudiar las soluciones de un sistema lineal planar, a partir de la clasificaci´on de sus puntos de equilibrio. Consideramos el sistema lineal en el plano, x˙ = Ax,
(1.2)
con x ∈ R2 y A ∈ R2×2 . Se dice que x0 es punto de equilibrio del sistema si Ax0 = 0. Pueden darse entonces dos situaciones: A no-singular y entonces x0 = 0 es el u ´nico punto de equilibrio; ´o A singular y entonces el sistema tiene un subespacio no nulo de equilibrio. Analicemos el caso A no-singular. Sabemos que es siempre posible hallar una matriz M de orden 2 y no-singular tal que M −1 AM = J, siendo J la forma de Jordan real. Se pueden presentar cualquiera de los tres casos que siguen: µ ¶ µ ¶ µ ¶ λ1 0 λ k α −β J1 = , J2 = , J3 = . 0 λ2 0 λ β α El primer caso corresponde a autovalores λ1 6= λ2 , ambos reales y no nulos; el segundo caso corresponde a autovalores reales, iguales y no nulos (k puede ser 0 ´o 1); y el tercer caso corresponde a autovalores complejos λ1,2 = α ± iβ. Si consideramos el sistema lineal en coordenadas z = M −1 x, el sistema original resulta z˙ = Jz
(1.3)
Asi por ejemplo para el primer caso se tiene el sistema planar desacoplado, z˙1 = λ1 z1 z˙2 = λ2 z2 ; si la condici´on inicial es z 0 = (z10 , z20 ) las soluciones son z1 (t) = z10 exp λ1 t, z2 (t) = z20 exp λ2 t, y eliminando t se obtiene λ2/λ1
z2 = kz1
, con k = 6
z20 . (z10 )λ2/λ1
10
8
6
4
x
2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0 x1
2
4
6
8
10
Figure 1.2: Nodo estable. Autovalores: λ1 = −2, λ2 = −1. Si consideramos autovalores negativos, diremos que el origen como punto de equilibrio es un nodo estable, Fig.1.2. Si en cambio los autovalores son ambos positivos se trata de un nodo inestable, Fig.1.3. Cuando los autovalores son de distinto signo se tiene un saddle o punto de ensilladura, Fig.1.4. Para el tercer caso, es decir autovalores complejos, el sistema en coordenadas (z1 , z2 ) resulta, z˙1 = αz1 − βz2 z˙2 = βz1 + αz2 ;
(1.4) (1.5)
este sistema tiene soluciones oscilatorias. En efecto, si consideramos coordenadas polares q r = z12 + z22 , θ = tan−1 (z2 /z1 ) ,
7
10
8
6
4
x
2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0 x1
2
4
6
8
10
Figure 1.3: Nodo inestable. Autovalores: λ1 = 1, λ2 = 2. el sistema resulta r˙ = αr θ˙ = β.
(1.6) (1.7)
Si la condici´on inicial es (r0 , θ0 ) la soluci´on es (r(t), θ(t)) = (r0 exp αt, θ0 + βt), que resulta una espiral logar´ıtmica en el plano (z1 , z2 ), llamado foco. Para α < 0 resulta un foco estable, Fig.1.5.; y para α > 0 un foco inestable, Fig.1.6. Si α = 0 se tiene un centro, Fig.1.7. Observac´ on: el comportamiento de las trayectorias de un sistema lineal planar est´a completamente determinado por los autovalores de la matriz de orden 2 que define al sistema. Ejercicios propuestos 1. Las ecuaciones din´amicas no-lineales para un manipulador rob´otico de junta flexible 8
10
8
6
4
z
2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0 z1
2
4
6
8
10
Figure 1.4: Saddle. Autovalores: λ1 = 1, λ2 = −1. con un enlace est´an dadas por: I q¨1 + M gL sin q1 + k(q − 1 − q2 ) = 0 J q¨2 − k(q1 − q2 ) = u donde q1 y q2 son las posiciones angulares, I y J los momentos de inercia, k es una constante del resorte, M la masa total, L es una distancia y u el torque. Escribir las ecuaciones de estado para este sistema. 2. (a) Considerando las ecuaciones del oscilador de van der Pol x˙ 1 = x2 x˙ 2 = −x1 + (1 − x21 )x2 Graficar algunas isoclinas y algunas trayectorias del sistema (en el plano de fase x1 − x2 ). 9
10
8
6
4
z
2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0 z1
2
4
6
8
10
Figure 1.5: Foco estable: α < 0. (b) Idem a) para las ecuaciones de Rayleigh, x˙ 1 = x2 x˙ 2 = −x1 + ²(x2 −
x22 ) 3
considerando ² = 1 y ² = .1. 3. (a) Resolver x˙ = x + y y˙ = 4x − 2y con condiciones iniciales (x0 , y0 ) = (2, −3). (b) Dibujar el retrato de fase para el sistema anterior, en el plano x − y. 4. Resolver el sistema lineal x˙ = Ax, con µ ¶ a 0 A= 0 −1 10
10
8
6
4
z2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0
2
4
6
8
10
z1
Figure 1.6: Foco inestable: α > 0. Graficar el retrato de fase para: a < −1; a = −1; −1 < a < 1; a = 0; a > 0. 5. Considerar el circuito de ecuaci´on LI¨ + RI˙ + I/C = 0 donde L, C > 0 y R ≥ 0. (a) Reescribir la ecuaci´on como un sistema lineal de dimensi´on 2. (b) Mostrar que el origen es asint´oticamente estable si R > 0 y s´olo estable si R = 0, un si R2 C − 4L es positivo, negativo, o (c) Clasificar el equilibrio en el origen seg´ cero, y realizar en cada caso el retrato de fase.
11
10
8
6
4
z
2
2
0
−2
−4
−6
−8
−10 −10
−8
−6
−4
−2
0 z1
2
4
6
8
10
Figure 1.7: Centro: α = 0.
2
Segunda Clase: Sistemas Planares No-Lineales
En muchos casos el comportamiento local de un sistema no-lineal cerca de un punto de equilibrio se puede inferir a partir del sistema linealizado alrededor del punto y estudiar entonces el comportamiento lineal que resulta a partir de la linealizaci´on. Pensemos primero en el comportamiento de un sistema lineal bajo perturbaciones lineales, es decir, consideremos una matriz A que suponemos tiene autovalores λ1 6= λ2 , y ∆A una matriz diagonal cuyos elementos son magnitudes µ arbitrariamente chicas. Se tiene entonces, · ¸ λ1 + µ 0 A + ∆A = . 0 λ2 + µ Dado que los autovalores de una matriz dependen en forma cont´ınua de sus par´ametros, cualquier autovalor con parte real estrictamente negativa (o estrictamente positiva) permanecer´a en su correspondiente semiplano bajo perturbaciones suficientemente chicas. Luego, si el equilibrio x = 0 del sistema lineal x˙ = Ax es un nodo, foco o saddle, el equilibrio del sistema perturbado x˙ = (A + ∆A)x ser´a del mismo tipo. Si en cambio, el 12
equilibrio es un centro, el sistema perturbado tendr´a un foco estable o inestable, seg´ un µ sea negativo o positivo. Llamamos entonces al nodo, foco y saddle equilibrios estructuralmente estables, pues mantienen su comportamiento cualitativo bajo perturbaciones chicas. Definition 2.1 El origen x = 0 del sistema x˙ = Ax es un punto de equilibrio hiperb´ olico si es un nodo, un foco o un saddle. Ejemplo de un sistema no lineal planar . Consideramos nuevamente las ecuaciones de estado del p´endulo con fricci´on para k = 0.5, x˙ 1 = x2 g x˙ 2 = − sin x1 − 0.5x2 , l
(2.1) (2.2)
con −π ≤ x1 ≤ π. En este caso los puntos de equilibrio aisaldos son (0, 0), (π, 0) y (−π, 0). Observar que a diferencia de los sistemas lineales, en los sistemas no-lineales puede haber m´as de un equilibrio aislado. El comportamiento del (0, 0) es similar al de un foco estable de un sistema lineal; y el comportamiento de (±π, 0) es similar al de un saddle en un sistema lineal, Fig. 2.1. Esto que por ahora lo observamos en el retrato de fase del sistema, lo justificaremos luego. En general, sea el sistema no lineal planar x˙ 1 = f1 (x1 , x2 ) x˙ 2 = f2 (x1 , x2 ), y supongamos que p = (p1 , p2 ) es punto de equilibrio. Desarrollamos f en serie de Taylor alrededor de p, x˙ 1 = f1 (p1 , p2 ) + a11 (x1 − p1 ) + a12 (x2 − p2 ) + T.O.S. x˙ 2 = f2 (x1 , x2 ) + a21 (x1 − p1 ) + a22 (x2 − p2 ) + T.O.S., con aij =
∂fi (x1 , x2 ) |x=p , f1 (p1 , p2 ) = f2 (p1 , p2 ) = 0; ∂xj
(T.O.S.: t´erminos de orden superior).
13
6
4
x2
2
0
−2
−4
−6
−2.5
−2
−1.5
−1
−0.5
0 x1
0.5
1
1.5
2
2.5
Figure 2.1: P´endulo con fricci´on. Con el cambio y1 = x1 − p1 , y2 = x2 − p2 , se obtiene y˙ 1 = x˙ 1 = a11 y1 + a12 y2 + T.O.S. y˙ 2 = x˙ 2 = a21 y1 + a22 y2 + T.O.S. En un entorno suficientemente chico del equilibrio, de modo tal que los t´erminos de orden superior se desprecien, se obtiene la siguiente aproximaci´on lineal: y˙ 1 = a11 y1 + a12 y2 y˙ 2 = a21 y1 + a22 y2 Theorem 2.2 (Hartman-Grobman): Consideramos el sistema no lineal planar x˙ = f (x), con f suficientemente suave. Suponemos que x0 es punto de equilibrio aislado. | 0 no tiene autovalores nulos o imaginarios Suponemos, adem´as, que A(x0 ) = ∂f ∂x x=x puros. Entonces existe un homeomorfismo h (aplicaci´ on cont´ınua y con inversa cont´ınua) 2 0 2 definida en un entorno U ⊂ R de x , h : U → R , que lleva las trayectorias del no lineal sobre las del sistema linealizado. En particular h(x0 ) = 0. 14
Observaciones: El Teorema de Hartman-Grobman afirma que es posible “deformar” de manera cont´ınua todas las trayectorias del sistema no lineal, alrededor del equilibrio aislado, en las trayectorias del sistema linealizado, v´ıa el homeomorfismo h. En general, es muy dificultoso hallar el homeomorfismo h. Sin embargo, el teorema indica que el comportamiento cualitativo de un sistema no lineal alrededor de un equilibrio aislado es similar al del sistema linealizado, por ejemplo, el tipo de estabilidad. Consideramos nuevamente el ejemplo del p´endulo con fricci´on, en este caso las matrices del sistema linealizado, alrededor de cada equilibrio, resultan: · ¸ · ¸ ∂f ∂f 0 1 0 1 A1 = |(0,0) = A2 = |(π,0) = ; −1 −0.5 1 −0.5 ∂x ∂x los autovalores de A1 son 0.25 ± ı0.97, y los de A2 son −1.28 y 0.78. Luego, el (0, 0) es un foco estable y el (π, 0) es un saddle, el comportamiento de (−π, 0) es similar al de (π, 0). Definition 2.3 Un punto de equilibrio de un sistema no-lineal se dice hiperb´ olico, si la matriz Jacobiana, evaluada en ese punto, no tiene autovalores sobre el eje imaginario. Consideramos ahora el siguiente sistema: x˙ 1 = −x2 − µx1 (x21 + x22 ) x˙ 2 = x1 − µx2 (x21 + x22 ). El punto (0, 0) es equilibrio aislado del sistema, la matriz Jacobiana evaluada en este punto es ¸ · 0 −1 , 1 0 cuyos autovalores son ±i, luego la linealizaci´on del sistema tiene en (0, 0) un centro. En coordenadas polares el mismo sistema no-lineal se representa as´ı: r˙ = −µr3 θ˙ = 1; donde para µ > 0 resulta un foco estable, Fig.2.2. y para µ < 0 un foco inestable, Fig.2.3. Definition 2.4 El estado del sistema no lineal en el tiempo t empezando en x en t = 0 se llama flujo y se simboliza Φt (x), en particular Φ0 (x) = x.
15
Diagrama de fase 3
2
x
2
1
0
−1
−2
−3 −3
−2
−1
0 x1
1
2
3
Figure 2.2: Foco estable Otra manera de enunciar el Teorema de Hartman-Grobman: Supongamos que consideramos las mismas hip´otesis que en el Teorema de Hartman-Grobman; entonces existe U entorno de x0 tal que, si x ∈ U y Φt (x) ∈ U , se tiene que 0
h(Φt (x) = exp A(x )t h(x). Ciclos l´ımites. Ya hemos definido oscilaci´on y ´orbita cerrada. Para introducir el concepto de ciclo l´ımite, analizaremos primero un ejemplo sencillo. Oscilador lineal x˙ 1 = −x2 x˙ 2 = x1 ; sabemos ya que el equilibrio (0, 0) es un centro y sus trayectorias son ´orbitas cerradas, Fig.1.7. Si la condici´on inicial es (x01 , x02 ) las soluciones son x1 (t) = r0 cos(t + θ0 ), 16
Diagrama de fase 3
2
x
2
1
0
−1
−2
−3 −3
−2
−1
0 x1
1
2
3
Figure 2.3: Foco inestable p x2 (t) = r0 sin(t + θ0 ), con r0 = (x01 )2 + (x02 )2 y θ0 = tan−1 (x02 /x01 ). El sistema tiene una oscilaci´on de amplitud r0 , se lo llama oscilador arm´onico. Vale la pena observar que el oscilador lineal presenta algunos problemas: perturbaciones chicas (lineales o no lineales) destruyen la oscilaci´on, decimos entonces que el oscilador lineal no es estructuralmente estable; adem´as, la amplitud de la oscilaci´on depende de la condici´on inicial. Estos problemas pueden ser eliminados trabajando con osciladores no lineales. Ejemplo: Oscilador de van-der Pol. Consideramos la ecuaci´on de segundo orden, y¨ − µ(1 − y 2 )y˙ + y = 0, para µ constante positiva;
17
si llamamos x1 = y y x2 = y˙ obtenemos las ecuaciones de estado del sistema: x˙1 = x2 x˙ 2 = −x1 + µ(1 − x21 )x2 ; en este caso la matriz de la linealizaci´on alrededor del equilibrio (0, 0) es · ¸ 0 1 A= . −1 µ Observar que si µ > 0 los autovalores de A tienen parte real positiva, se trata entonces de un foco inestable. Por el Teorema de Hartman-Grobman concluimos que el (0, 0) es tambi´en un foco inestable del sistema no lineal. Observar, adem´as, que existe s´olo una Diagrama de fase 5
4
3
2
x
2
1
0
−1
−2
−3
−4
−5 −5
−4
−3
−2
−1
0 x1
1
2
3
4
5
Figure 2.4: Oscilador de van-der Pol ´orbita cerrada que atrae a todas las trayectorias que comienzan fuera de ella, Fig.2.4. Esta situaci´on es diferente a la que ocurre con el oscilador lineal, donde hay un cont´ınuo de ´orbitas cerradas, Fig.1.7.
18
Definition 2.5 Una ´orbita cerrada aislada se llama ciclo l´ımite. Nos planteamos ahora el siguiente problema: establecer condiciones bajo las cuales un sistema planar dado tiene o no ´orbitas cerradas. Theorem 2.6 (Bendixson). Consideramos el sistema planar x˙ = f (x); supongamos que D ⊂ R2 es un dominio simplemente conexo tal que ∇f (x) = ∂f1 /∂x1 (x1 , x2 ) + ∂f2 /∂x2 (x1 , x2 ) no es id´enticamente nulo en ninguna subregi´ on de D y no cambia de signo en D. Entonces D no contiene ´orbitas cerradas del sistema planar. Ejemplo: Ecuaciones de Duffing. x˙ 1 = x2 x˙ 2 = x1 − x31 − δx2 , en este caso ∇f = −δ. Entonces, si δ > 0, no existen ´orbitas cerradas en todo R2 . Theorem 2.7 (Poincar´e-Bendixson). Supongamos que, 1. R es un conjunto compacto del plano. 2. x˙ = f (x) es un sistema planar cuyo campo f es continuamente diferenciable y est´a definido sobre un conjunto abierto contenido en R. 3. R no contiene puntos de equilibrio del sistema. 4. Existe una trayectoria C que est´a confinada en R, es decir que comienza en R y permanece en R para todo tiempo futuro. Entonces o bien C es una ´orbita cerrada, o bien tiende a una ´orbita cerrada cuando t → ∞. En cualquier caso, R contiene una ´orbita cerrada. Ejemplo. Consideramos el siguiente sistema planar en coordenadas polares: r˙ = r(1 − r2 ) + µr cos θ θ˙ = 1, con r ≥ 0. Si µ = 0, resultan r = 1 y r = 0 los puntos de equilibrio del sistema. En el plano de fase x1 − x2 todas las trayectorias (excepto r = 0) se aproximan al c´ırculo unidad r = 1, que resulta un ciclo l´ımite estable. Se puede probar, adem´as, que existe una ´orbita cerrada para µ > 0 suficientemente chico. 19
Ejercicios propuestos 1. Encontrar todos los puntos de equilibrio del sistema: x˙ = −x + x3 y˙ = −2y Linealizar el sistema alrededor de cada equilibrio y determinar la naturaleza de cada uno de ellos. Verificar las conclusiones halladas mediante un gr´afico aproximado del retrato de fase del sistema (tener en cuenta que se trata de dos ecuaciones desacopladas). 2. Considerar el sistema x˙ = −y + ax(x2 + y 2 ) y˙ = x + ay(x2 + y 2 ) (a) A partir de la linealizaci´on, se puede predecir algo del comportamiento del sistema alrededor del equilibrio (0, 0)? (b) Hallar las ecuaciones del sistema en coordenadas polares. (c) Encontrar algunas trayectorias del sistema cuando: i)a > 0; ii)a = 0; iii)a < 0. 3. Para cada uno de los siguientes sistemas, construir el retrato de fase usando el m´etodo de las isoclinas y discutir el comportamiento cualitativo del sistema. Se puede usar informaci´on acerca de los puntos de equilibrio o del campo vectorial. (a) x˙ 1 = x2 cos x1 x˙ 2 = sin x2 (b) ¶ x1 = 1− x µ2 ¶ x1 x1 = − 1− x2 x2 µ
x˙ 1 x˙ 2
20
3
Tercera Clase: Teor´ıa de Estabilidad de Lyapunov
Para estudiar la estabilidad de puntos de equilibrio utilizaremos las ideas de Lyapunov. Definition 3.1 El equilibrio x = 0 del sistema aut´onomo x˙ = f (x) es estable si para cada ² > 0 existe δ > 0 tal que: k x(0) k< δ ⇒k x(t) k< ², ∀t ≥ 0; el equilibrio es inestable si no es estable; el equilibrio es asint´oticamente estable si es estable y adem´as δ puede elegirse de modo tal que k x(0) k< δ ⇒ x(t) → 0, si t → ∞. Ejemplo: ecuaci´ on del p´ endulo Conocemos ya las ecuaciones del p´endulo en variables de estado, x˙ 1 = x2 x˙ 2 = −(g/l) sin x1 − (k/m)x2 ; adem´as sabemos que (0, 0) y (π, 0) son puntos de equilibrio. Si suponemos k = 0, o sea el p´endulo sin fricci´on, en un entorno del (0, 0) se tienen ´orbitas cerradas. Luego, saliendo suficientemente cerca del origen, las trayectorias quedan dentro de una bola alrededor del origen; se concluye entonces que (0, 0) es equilibrio estable. Sin embargo, no es asint´oticamente estable, pues las trayectorias que empiezan fuera del equilibrio no tienden a ´el, sino que permanecen en sus ´orbitas cerradas, ver Fig.3.1. Cuando k > 0, el (0, 0) se comporta como un foco estable, y luego en este caso el (0, 0) es equilibrio asint´oticamente estable. El equilibrio x¯ = (π, 0) resulta un saddle que no es estable pues dado cualquier ² > 0, es siempre posible encontrar una trayectoria que deje la bola {x ∈ R2 : k x − x¯ k≤ ²}, a´ un cuando x(0) est´e arbitrariamente cerca del equilibrio, ver Fig.2.1. En general, c´omo podr´ıamos determinar la estabilidad de un punto de equilibrio? Para las ecuaciones planares del p´endulo hicimos uso del conocimiento que ten´ıamos del retrato de fase del sistema. Pero para generalizar esto a cualquier sistema, necesitar´ıamos conocer todas las soluciones. Sin embargo, las conclusiones que obtuvimos para la ecuaci´on del p´endulo y sus equilibrios, pueden obtenerse usando la noci´on de energ´ıa. Se define la energ´ıa del p´endulo E(x) como la suma de las energ´ıas potencial y cin´etica: Z x1 E(x1 , x2 ) = (g/l) sin y dy + 1/2x22 . 0
21
Si k = 0, el sistema es conservativo, es decir, no hay disipaci´on de energ´ıa. Luego, = 0 a lo largo de E se mantiene constante durante el movimiento del sistema o dE dt las trayectorias del sistema. Como E(x) = c representa una curva cerrada alrededor de x = 0 para c chico, podemos concluir que el origen es punto de equilibrio estable, Fig.3.1. Diagrama de fase 5
4
3
2
x2
1
0
−1
−2
−3
−4
−5 −10
−8
−6
−4
−2
0 x1
2
4
6
8
10
Figure 3.1: P´endulo sin fricci´on Cuando tenemos en cuenta la fricci´on (k > 0), la energ´ıa se disipa a lo largo del movimiento del sistema, es decir, dE ≤ 0 a lo largo de las trayectorias del sistema. Debido dt a la fricci´on, E no puede permanecer constante indefinidamente cuando el sistema est´a en movimiento. Luego, la energ´ıa comienza a decrecer hasta llegar a 0, y entonces la trayectoria tiende a 0 cuando t tiende a ∞. Concluimos entonces que examinando la energ´ıa E a lo largo de las trayectorias del sistema, es posible determinar la estabilidad de un punto de equilibrio. Lyapunov (1892) mostr´o que para determinar la estabilidad de un punto de equilibrio pueden usarse otra clase de funciones, no necesariamente la energ´ıa. Sea V : D → R una funci´on continuamente diferenciable definida en D ⊂ Rn , con D dominio que contiene al origen. La derivada de V a lo largo de las trayectorias del 22
sistema x˙ = f (x) se define como: V˙ (x) =
n X ∂V i=1
∂xi
x˙ i =
n X ∂V i=1
∂xi
fi (x) =
∂V f (x). ∂x
Observar que la derivada de V a lo largo de las trayectorias del sistema depende de las ecuaciones del sistema. Luego V˙ (x) ser´a diferente para sistemas diferentes. Adem´as, si V˙ (x) < 0, V decrece a lo largo de las soluciones del sistema. El siguiente resultado de Lyapunov garantiza estabilidad del equilibrio para un sistema no-lineal. Theorem 3.2 Sea x = 0 un punto de equilibrio de x˙ = f (x) y D ⊂ Rn un dominio que contiene a x = 0. Sea V : D → R una funci´on continuamente diferenciable tal que V (0) = 0, V (x) > 0 en D − {0}, V˙ (x) ≤ 0 en D. Entonces x = 0 es equilibrio estable. Adem´ as, si V˙ (x) < 0 en D − {0}, entonces x = 0 es equilibrio asint´oticamente estable. Regi´ on de atracci´ on. Supongamos que sabemos que x = 0 es equilibrio asint´oticamente estable de x˙ = f (x); desear´ıamos saber cuan lejos del origen puede partir una trayectoria y a´ un converger a 0 cuando t → ∞. Esta idea da la noci´on de regi´ on ´o dominio de atracci´ on del equilibrio. Definition 3.3 Sea φ(t, x) la soluci´on de x˙ = f (x) que empieza en x en t = 0, es decir, φ(0, x) = x, luego la regi´ on de atracci´ on del equilibrio x = 0 resulta, {x : lim φ(t, x) = 0, cuando t → ∞}. Nos preguntamos ahora bajo que condiciones la regi´on de atracci´on ser´a todo Rn . Esto sucede si para cualquier estado inicial x, la trayectoria φ(t, x) se aproxima a 0 cuando t → ∞, sin importar si kxk es grande. Si un punto de equilibrio asint´oticamente estable tiene esta propiedad, se dice que es globalmente asint´oticamente estable. El siguiente teorema establece condiciones suficientes que garantizan estabilidad asint´otica global. Theorem 3.4 (Barbashin-Krasovski) Sea x = 0 punto de equilibrio del sistema x˙ = f (x). Sea V : Rn → R una funci´on continuamente diferenciable tal que • V (0) = 0 y V (x) > 0, ∀x 6= 0; • si kxk → ∞, entonces V (x) → ∞; 23
• V˙ (x) < 0, ∀x 6= 0; entonces x = 0 es globalmente asint´oticamente estable, es decir, su regi´ on de atracci´ on n es todo R . Por u ´ltimo enunciaremos el siguiente resultado sobre inestabilidad. Theorem 3.5 (Chetaev) Sea x = 0 equilibrio del sistema x˙ = f (x). Sea V : D → R continuamente diferenciable con V (0) = 0 y V (x0 ) > 0 para alg´ un x0 con kx0 k arbitrariamente chica. Se define U = {x ∈ Br V (x) > 0}, y supongamos que V˙ (x) > 0 en U . Entonces x = 0 es equilibrio inestable. Recordemos que cuando estudiamos la ecuaci´on del p´endulo con fricci´on vimos que la funci´on de energ´ıa E(x) no satisfac´ıa la condici´on para garantizar la estabilidad asint´otica requerida en el Teorema de Lyapunov. En efecto, V˙ (x) = (−k/m)x22 ≤ 0, sin embargo sabemos que x = 0 es equilibrio asint´oticamente estable para la ecuaci´on del p´endulo. Luego, para que se mantenga la condici´on V˙ (x) = 0, la trayectoria del sistema debe estar confinada en la recta x2 = 0. A menos que x1 = 0 esto es imposible pues a partir de las ecuaciones del p´endulo vemos que x2 (t) ≡ 0 ⇒ x˙ 2 (t) ≡ 0 ⇒ sin x1 (t) ≡ 0, y luego, sobre el segmento −π < x1 < π de la recta x2 = 0, el sistema verifica V˙ (x) = 0 s´olo si x1 = 0. Luego, V (x(t)) debe decrecer al origen y entonces x(t) → 0 cuando t → ∞. Esto es consistente con el significado f´ısico que, debido a la fricci´on, la energ´ıa no se mantiene constante cuando el sistema est´a en movimiento. Resumimos lo anterior as´ı: si en un dominio alrededor del origen se puede hallar una funci´on V cuya derivada a lo largo de la trayectoria del sistema es menor o igual a 0, y si podemos asegurar que ninguna trayectoria puede quedarse en V˙ (x) = 0 salvo en el origen, entonces el origen es asint´oticamente estable. Este resultado es conocido como el Principio de Invariancia de Lasalle. Antes de enunciarlo en forma precisa daremos algunas definiciones. Definition 3.6 Sea x(t) una soluci´on de x˙ = f (x). Un punto p se llama punto l´ımite positivo de x(t) si existe una sucesi´ on {tn } con tn → ∞ tal que x(tn ) → p cuando n → ∞. Definition 3.7 El conjunto de todos los puntos l´ımite positivos de x(t) se llama conjunto l´ımite positivo de x(t).
24
Definition 3.8 Un conjunto M se llama positivamente invariante con respecto al sistema x˙ = f (x) si, x(0) ∈ M ⇒ x(t) ∈ M, ∀t ≥ 0. Definition 3.9 La soluci´on x(t) se aproxima a M cuando t → ∞, si para cada ² > 0, existe T > 0 tal que dist(x(t), M ) < ², para todo t > T . Para ilustrar las definiciones anteriores consideremos un punto de equilibrio asint´oticamente estable y un ciclo l´ımite estable en el plano: El equilibrio asint´oticamente estable es el conjunto l´ımite positivo de toda soluci´on que empieza suficientemente cerca del equilibrio. El ciclo l´ımite estable es el conjunto l´ımite positivo de toda soluci´on que empieza suficientemente cerca del l´ımite. Es decir, la soluci´on se aproxima al ciclo l´ımite cuando t → ∞. El punto de equilibrio asint´oticamente estable y el ciclo l´ımite son conjuntos invariantes pues cualquier soluci´on que comienza en alguno de estos conjuntos permanece en el conjunto, para todo t ∈ R. Lemma 3.10 Si una soluci´on x(t) de x˙ = f (x) es acotada y pertenece a D, para todo t ≥ 0, con D abierto que contiene a x = 0, entonces su conjunto l´ımite positivo que llamaremos L+ es no vac´ıo, compacto e invariante. Adem´ as, x(t) → L+ cuando t → ∞. Theorem 3.11 Principio de Invariancia de Lasalle: Sea Ω ⊂ D un conjunto compacto que es positivamente invariante con respecto al sistema x˙ = f (x). Sea V : D → R una funci´ on continuamente diferenciable tal que V˙ (x) ≤ 0 en Ω. Sea E = {x ∈ Ω : V˙ (x) = 0}. Sea M el mayor conjunto invariante contenido en E. Entonces, cualquier soluci´on que empieza en Ω se aproxima a M cuando t → ∞. Algunas observaciones: • A diferencia del Teorema de Lyapunov, el Teorema de Lasalle no pide que V (x) sea estrictamente positiva. • Si estamos interesados en mostrar que x(t) → 0 cuando t → ∞, debemos establecer que el mayor conjunto invariante en E es el origen. Esto se hace mostrando que ninguna soluci´on puede permanecer en E adem´as de la soluci´on trivial x(t) ≡ 0. Considerando el caso particular planteado en la u ´ltima observaci´on y tomando V (x) > 0 se obtiene los siguientes corolarios que extienden los Teoremas de Lyapunov y BarbashinKrasovskii, respectivamente. 25
Corollary 3.12 Sea x = 0 equilibrio de x˙ = f (x). Sea V : D → R una funci´on continuamente diferenciable y positiva sobre un dominio D que contiene al origen, tal que V˙ (x) ≤ 0 en D. Sea S = {x ∈ D : V˙ (x) = 0} y supongamos que ninguna soluci´on permanece en S salvo la trivial. Entonces, el origen es asint´oticamente estable. Corollary 3.13 Sea x = 0 equilibrio de de x˙ = f (x). Sea V : Rn → R una funci´on continuamente diferenciable tal que V (x) → ∞ si k x k→ ∞, estrictamente positiva y tal que V˙ (x) ≤ 0, para todo x ∈ Rn . Sea S = {x ∈ Rn : V˙ (x) = 0} y supongamos que ninguna soluci´on se mantiene sobre S, salvo la trivial. Entonces el origen es globalmente asint´ oticamente estable. Observar que cuando V˙ (x) es estrictamente negativa y S = {0}, entonces los corolarios anteriores coinciden con los teoremas de Lyapunov y Barbashin-Krasovskii.
26
Ejercicios propuestos. 1. Usando V (x) = x21 + x22 , estudiar la estabilidad del origen del sistema x˙ 1 = x1 (k 2 − x21 − x22 ) + x2 (x21 + x22 + k 2 ) x˙ 2 = −x1 (k 2 + x21 + x22 ) + x2 (−x21 − x22 + k 2 ) cuando: a)k = 0 y b)k 6= 0. 2. Considerar el sistema x˙ 1 = x2 x˙ 2 = −a sin x1 − kx1 − dx2 − cx3 x˙ 3 = −x3 + x2 donde todos los coeficientes son positivos y k > a. Usando Z x1 V (x) = 2a sin ydy + kx21 + x22 + px23 , 0
con alg´ un p > 0, mostrar que el origen es globalmente a.e. 3. Sea el sistema x˙ = f (x), donde f : Rn → Rn . Considerar el cambio de varaibles z = T (x), donde T (0) = 0 y T : Rn → Rn es un difeomorfismo en un entorno del origen. El sistema transformado es, ∂T z˙ = fˆ(z), donde fˆ(z) = f (x)|x=T −1 (z) ∂x (a) Mostrar que x = 0 es un punto de equilibrio aislado de x˙ = f (x) sii z = 0 es un punto de equilibrio aislado de z˙ = fˆ(z). (b) Mostrar que x = 0 es estable (a.e., inestable) sii z = 0 es estable (a.e., inestable). 4. Considerar el sistema x˙ 1 = (x1 x2 − 1)x31 + (x1 x2 − 1 + x22 )x1 x˙ 2 = −x2 (a) Mostrar que x = 0 es el u ´nico punto de equilibrio. (b) Mostrar, usando linealizaci´on, que x = 0 es a.e. (c) Mostrar que Γ = {x ∈ R2 : x1 x2 ≥ 2} es un conjunto positivamente invariante. (d) Es x = 0 globalmente a.e.? 27
Bibliograf´ıa “Nonlinear Systems”, Hassan Khalil, Prentice Hall, 1996. “Nonlinear Systems, Analysis, Stability, and Control”, Shankar Sastry, Springer, 1999. “Nonlinear Oscillations, dynamical systems and bifurcations”, J. Guckenheimer and P. Holmes, Springer-Verlag, 1983. Gr´ aficos en el plano. Los distintos gr´aficos de sistemas planares presentados en estas Notas fueron realizados con el programa dfase.m, cuyo autor es el Dr. Fernando Bianchi (Fac. de Ingenier´ıa, U.N.L.P.). Dicho programa corre bajo MatLab, y se puede acceder a ´el desde la p´agina de la Facultad de Ingenier´ıa, U.N.L.P.: http://davinci.ing.unlp.edu.ar/controlm/electronica/archivos.htm
Reuni´ on Anual de la UMA, Salta, septiembre de 2005
28