Universidad Nacional de Salta Facultad de Ciencias Exactas Departamento de Matemática DINÁMICA SIMBÓLICA APUNTES DE CÁTEDRA NOVIEMBRE DE 2016

 Universidad Nacional de Salta Facultad de Ciencias Exactas Departamento de Matemática DINÁMICA SIMBÓLICA A
Author:  Silvia Ojeda Rojas

1 downloads 81 Views 874KB Size

Recommend Stories


Universidad Nacional de La Plata Facultad de Ciencias Exactas Departamento de Química. Trabajo de Tesis Doctoral
Universidad Nacional de La Plata Facultad de Ciencias Exactas Departamento de Química Trabajo de Tesis Doctoral Tratamiento biológico de aguas residu

UNIVERSIDAD TECNOLÓGICA PRIVADA DE SANTA CRUZ FACULTAD DE CIENCIAS EXACTAS
UNIVERSIDAD TECNOLÓGICA PRIVADA DE SANTA CRUZ FACULTAD DE CIENCIAS EXACTAS” ( IND – 120) Unidad 1 : introducción al dibujo Técnico Ing. Juan Pablo Am

UNIVERSIDAD NACIONAL DE CORDOBA FACULTAD DE CIENCIAS EXACTAS, FISICAS Y NATURALES ESCUELA DE BIOLOGIA DEPARTAMENTO DE MATEMATICA DISEÑO EXPERIMENTAL
UNIVERSIDAD NACIONAL DE CORDOBA FACULTAD DE CIENCIAS EXACTAS, FISICAS Y NATURALES ESCUELA DE BIOLOGIA DEPARTAMENTO DE MATEMATICA DISEÑO EXPERIMENTAL

UNIVERSIDAD NACIONAL DE MAR DEL PLATA FACULTAD DE CIENCIAS EXACTAS Y NATURALES SEMINARIO DE INVESTIGACION
UNIVERSIDAD NACIONAL DE MAR DEL PLATA FACULTAD DE CIENCIAS EXACTAS Y NATURALES SEMINARIO DE INVESTIGACION CARACTERISTICAS MORFOLOGICAS y MORFOMET

Story Transcript



Universidad Nacional de Salta Facultad de Ciencias Exactas Departamento de Matemática

DINÁMICA SIMBÓLICA APUNTES DE CÁTEDRA NOVIEMBRE DE 2016

JORGE YAZLLE



CAMILO JADUR



Índice general Capítulo 1.

ESPACIOS SHIFT

1

1.

Deniciones básicas

2.

Full shifts

1

3.

Los Espacios Shift

3

4.

Lenguajes

5

5.

Shifts de bloques

8

6.

Códigos de ventana deslizante

Capítulo 2.

1

10

SHIFTS DE TIPO FINITO

19

1.

Restricciones de tipo nito

19

2.

Grafos y sus shifts

22

3.

Representación de shifts de tipo nito por medio de grafos

27

4.

Desdoblamiento de estados

30

Capítulo 3. 1.

SHIFTS SÓFICOS

37

Presentaciones de shifts sócos

Capítulo 4.

37

ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT Z

A

40

1.

Una métrica para

2.

Sucesiones

42

3.

Cilindros. Conexidad

44

4.

Continuidad

45

5.

Sistemas dinámicos

47

Capítulo 5.

ENTROPÍA

40

50

1.

Denición y propiedades básicas

50

2.

Cálculo de la entropía de shifts sócos irreducibles

52

3.

Los puntos períodicos y la entropía

55

4.

Cálculo de la entropía de shifts sócos

57

Capítulo 6.

CÓDIGOS DE ESTADOS FINITOS

61

1.

Coloreo de rutas y presentaciones cerrantes a derecha

2.

Códigos de estados nitos

66

3.

Autovectores aproximados

67

4.

Construcción de códigos de estados nitos

71

0

61

Capítulo 1

ESPACIOS SHIFT 1. Un

letras.

Deniciones básicas

alfabeto es un conjunto nito, Un bloque, o palabra, sobre

cuyos elementos se denominan un alfabeto

A

símbolos,

o también

es una sucesión nita (posiblemente

A. Formalmente, una palabra u sobre A es una función u del conjunto {x ∈ N : 1 ≤ x ≤ n} en A (para algún entero n ≥ 0). En el caso n = 0, se tiene la función vacía, o sucesión vacía, que llamaremos palabra vacía y denotaremos por ε. La longitud (o largo, o tamaño) de la palabra es n, es decir, la cantidad de términos de la sucesión, y se denota por |u|. La palabra vacía tiene largo 0. Para una palabra no vacía u, el k -ésimo término de la sucesión se denota, como es costumbre, mediante uk . Entonces, una palabra no vacía de largo n sobre A es u1 u2 · · · un , con ui ∈ A para todo i ∈ {1, . . . , n}. Un bloque de longitud n se llama un n-bloque. Dos palabras u y v son iguales si tienen el mismo largo n y, para todo j entre 1 y n, es uj = vj . n El conjunto de todas las palabras de largo n sobre un alfabeto A se designa por A , y el S ∞ n ∗ ∗ conjunto de todas las palabras sobre A se designa por A . Es decir, A = n=0 A . Notar n ∗ que, para todo n ≥ 0, A es un conjunto nito, en tanto que A es un conjunto que tiene una vacía) de letras de

cantidad innita de elementos. Un alfabeto que a menudo usaremos es

y las palabras que sobre él pueden 0 1 . Tenemos que, en este caso, es A = {ε}, A = {000, 001, 010, 011, 100, 101, 110, 111}, etc. Además, A∗ =

sucesiones binarias

formarse se llaman {0, 1}, A2 = {00, 01, 10, 11},

A3 =

A = {0, 1},

{ε, 0, 1, 00, 01, 10, 11, . . .}. Sea u un bloque. Un subbloque (o subpalabra) i ≥ 1 tal que ∀k ∈ Z, 1 ≤ k ≤ |w| ⇒ wk = ui+k−1 .

de

u

es una palabra

w

tal que existe

De la denición, se desprende que la

u = u1 · · · un es un n-bloque no vacío, sus subpalabras no vacías son de la forma ui · · · uj , en donde i, j son enteros tales que 1 ≤ i ≤ j ≤ n. Si w es subbloque de u, escribimos w v u, y decimos que w ocurre en u. Obviamente, w v u ⇒ |w| ≤ |u|. Si u y v son dos bloques sobre A, la concatenación de u y v es la nueva palabra que se obtiene al escribir los símbolos de u y, a continuación, los de v , sin ningún signo especial intermedio. La concatenación de u y v se escribe uv . Notar que, en general, uv 6= vu. Es directo ver que |uv| = |u|+|v|. De manera análoga, la concatenación de tres o más bloques es la palabra

palabra vacía es subbloque de cualquier palabra, y que si

que se obtiene de escribir los respectivos símbolos consecutivamente. La concatenación de un n bloque u consigo mismo una cantidad n de veces se designa por u . Formalmente:



n

u = Por ejemplo,

(01)3 = 010101,

Se cumple que para todo (um )n = umn .

ε uun−1

A,

si

n=0 n>0

013 = 0111. ∗ bloque u ∈ A y enteros y

2. Dado un alfabeto

si

se denomina

conjunto de todas las funciones de

Z

en

no negativos

m

y

n,

y

Full shifts

full shift sobre el alfabeto A, A.

um un = um+n

es

El full shift sobre 1

A

o

full A-shift,

se denota por

A

Z

.

al

2

1. ESPACIOS SHIFT

Una función de

Z

A

en

no es más que una sucesión bi-innita de símbolos de

A,

que puede

escribirse así:

x = (xn )n∈Z = · · · x−2 x−1 x0 x1 x2 x3 · · · A = {0, 1} es la que tiene 0 en sus términos · · · 01010101010 · · · . la coordenada 0 de x, escribiremos un signo de puntuación

Un ejemplo de tales sucesiones bi-innitas para impares, y

1

en sus pares, es decir,

Para tener una idea de cuál es a la izquierda de

x0 ,

así:

. . . x−2 x−1 .x0 x1 x2 . . . En nuestro ejemplo anterior, escribimos

· · · 010.10101010 · · · .

Debe quedar claro que el signo de puntuación no es un elemento del alfabeto, ni un término de la sucesión

x;

es sólo una manera de representar a

una referencia a sus posiciones. Z Los elementos de A reciben el nombre de

xi = yi para todo entero i. AZ no contiene palabras,

Notar que

de modo de tener

puntos. Cada punto es, entonces, una sucesión

bi-innita, o tirilla bi-innita, de símbolos. Dos puntos y sólo si,

· · · x−2 x−1 x0 x1 x2 · · ·

x = (xi )i∈Z

sino sucesiones bi-innitas.

e

y = (yi )i∈Z

A∗

y

AZ

son iguales si,

no tienen ningún

elemento en común.

x = · · · x−2 x−1 x0 x1 x2 x3 · · · ∈ AZ , designamos por x[i,j] a la sucesión (nita) de los símbolos de x que van desde la coordenada i hasta la coordenada j , ambas inclusive. Es decir, x[i,j] = xi xi+1 · · · xj−1 xj . Adoptamos la convención de que para i > j , x[i,j] = ε (formalmente, x[i,j] es la función u con dominio {n ∈ Z : 1 ≤ n ≤ j − i + 1} y codominio A tal que un = xi+n−1 ). Denotamos por x[i,∞) a la sucesión innita a derecha xi xi+1 · · · , mientras que x(−∞,i] ∗ Z es la sucesión innita a izquierda · · · xi−1 xi . Dados u ∈ A y x ∈ A , decimos que u ocurre en x, o también que u es palabra o bloque de x (y lo escribimos u v x) si existen enteros i, j tales que x[i,j] = u. Notar que la palabra vacía ocurre en cualquier punto del full shift: ∀x ∈ AZ , x[1,0] = ε. El (2k + 1)-bloque central de x es x[−k,k] . ∗ ∞ Z Para un bloque no vacío u = u1 · · · un ∈ A − {ε}, designamos por u al punto x ∈ A que resulta de la concatenación innita (hacia ambos lados) de la palabra u consigo misma de modo que ∀i ∈ {0, . . . , n − 1} , xi = ui+1 : Dado

u∞ = · · · uuuuu.uuuuuu · · · = · · · u1 · · · un u1 · · · un .u1 · · · un u1 · · · un · · · 0 es u1 . Por ejemplo, si u = 011, entonces u∞ = · · · 011011.011011011 · · · , · · · 0110110.11011011 · · · = (110)∞ .

Obsérvese que la coordenada que no es el mismo que

2.1.

La transformación shift.

i de una sucesión (xi )i∈Z representa el valor de la sucesión en el minuto i.

Se puede pensar en el subíndice

como indicador del tiempo, de modo que

xi

El paso de una unidad de tiempo equivale entonces a desplazar (shift) cada coordenada de Z Z la sucesión un lugar hacia la izquierda. Esto dene una transormación natural de A en A , llamada

transformación shift y denotada por σ , del siguiente modo: σ : AZ → AZ x 7→ y = σ (x)

con

yi = xi+1

x = (00111)∞ = · · · 00111.0011100111 · · · , entonces σ (x) = · · · 001110.011100111 · · · notación standard en teoría de sistemas dinámicos, usaremos σx para σ (x), y

Por ejemplo, si Conforme a

σxi

(σ (x))i . es una función biyectiva. Su inversa,

para

σ −1 , desplaza cada posición de una sucesión un lugar k hacia la derecha. Si k es un entero positivo, σ designa a la composición de σ consigo misma k veces, y produce el efecto de desplazar todas las coordenadas de una sucesión k lugares a la k −k −1 izquierda (σ xi = xi+k ), mientras que σ es la composición de σ consigo misma k veces, −k 0 y mueve k lugares a la derecha (σ xi = xi−k ). σ se dene como la función identidad. Se k puede resumir todo diciendo que σ xi = xi+k , sea k positivo o no. Nótese que, en consecuencia, σ

3. LOS ESPACIOS SHIFT

xi = σ k xi−k . k ∈ Z.

Por ser composición de biyecciones,

Proposición 1.1.

σk

3

es una biyección de

AZ ,

para cualquier

Sean u ∈ A∗ , x ∈ AZ y k ∈ Z; se tiene que u v x ⇔ u v σ k x.

Demostración. Puesto que

x[i,j] = σ k x[i−k,j−k] ,

se tiene que

u v x ⇔ ∃i, j ∈ Z : u = x[i,j] = σ k x[i−k,j−k] ⇔ u v σ k x  n ≥ 1 tal que σ n x = x, se llama punto periódico para σ , y, en ese caso, n es un período de x. Para el caso particular en que n = 1 (es decir, σx = x), x se llama punto jo para σ . Todo punto periódico es de la forma u∞ , con u ∈ A∗ . ∞ En particular, un punto jo para σ es de la forma a , para algún a ∈ A. Si x es periódico de período n, también es periódico de período 2n, 3n, . . . El menor de los números positivos k tales k que σ x = x se llama período mínimo de x. Un punto

x ∈ AZ

para el cual existe un

Sea x un punto periódico para σ de período mínimo n0 . Entonces, para cualquier entero positivo k , x tiene período kn0 . Lema 1.2.

k . Para k = 1, se cumple pues n0 es un período de σ (k+1)n0 x = σ n0 σ kn0 x = σ n0 x = x, por lo que (k + 1) n0 es 

Demostración. Por inducción sobre

x.

Supongamos que

un período de

σ kn0 x = x.

Es

x.

Proposición 1.3. Sea x un punto periódico para σ de período mínimo n0 . x tiene período n si, y sólo si, n es múltiplo de n0 .

tiene período n. Sean  n0 . Por el Lema 1.2, vemos que x = σ r σ kn0 x =

Demostración. Para la ida, supongamos que

n = kn0 + r con 0 ≤ r < r < n0 debe ser r = 0, y entonces n

es múltiplo de

x

k y r tales que σ r x, pero como

n0 . 

La vuelta es el contenido del Lema 1.2.

3.

Los Espacios Shift

∗ una colección de bloques sobre un alfabeto A, es decir, F ⊆ A . Z Designamos por XF al subconjunto de A formado por todos aquellos puntos en los que Definición 1.4. Sea

F

no

ocurre ningún bloque de F . Es decir, XF =



x ∈ AZ : ∀f ∈ F, f

=



x ∈ AZ : ∀i, j ∈ Z, x[i,j] ∈ /F

no ocurre en

x





x∈ / XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F . continuación, algunos ejemplos sobre A = {0, 1}:

Obsérvese que A

Ejemplo 1.5. Si

F1 = ∅,

es

XF1 = AZ ,

pues trivialmente se tiene que

Z, x[i,j] ∈ / F1 . Ejemplo 1.6. Si

F2 = {0, 1},

es

Ejemplo 1.7. Si

F3 = {ε},

XF3 = ∅,

Ejemplo 1.8. Si

F4 = {0}, es XF4 = {1∞ }, pues cualquier que xi = 0, y entonces x[i,i] ∈ F4 .

una coordenada

i

tal

Ejemplo 1.9. Si

xi = 0,

es

xi+1 = 0

o

es

XF2 = ∅,

∀x ∈ AZ , x[0,0] ∈ F2 .



∀x ∈ AZ , x[1,0] = ε ∈ F3 .



pues

pues

∀x ∈ AZ , ∀i, j ∈ 



F5 = {00, 01}, es XF5 = {1 } pues si un xi+1 = 1, y en cualquier caso x[i,i+1] ∈ F5 .

punto

x

distinto de

1∞

posee

 punto

x

tiene una coordenada



(01)∞ , (010)∞ , (00100010)∞ , · · · 0000.10000 · · · , · · · 00100000.00000 · · · , · · · 00001000100101.01010010001000010000010 · · · . XF6 Z es precisamente el conjunto de puntos de A que no contienen dos 1 consecutivos. Este espacio shift es conocido como el shift de la razón de oro.  Ejemplo 1.10. Si

F6 = {11},

algunos puntos de

XF6

son

4

1. ESPACIOS SHIFT

Ejemplo 1.11. Si

F7 = {1n : n ≥ 2},

Ejemplo 1.12. Si

F8 = A∗ ,

Ejemplo 1.13. Si

F9 = {102n+1 1 : n ∈ N}, XF9

es

es

X F7 = X F6 .



XF8 = ∅.

 es precisamente el conjunto de puntos de

A

tales que entre dos ocurrencias consecutivas de 1 hay una cantidad par de 0 (es decir, Z n aquellos puntos x ∈ A tales que 10 1 v x ⇒ n es par). Este espacio shift es conocido como el

Z

shift par.



Proposición 1.14.

1. 2. 3.

Sean F y F 0 subconjuntos de A∗ . Entonces:

XF ∪F 0 = XF ∩ XF 0 XF ∩F 0 ⊇ XF ∪ XF 0 Si F ⊆ F 0 , entonces XF ⊇ XF 0 .

Demostración. Para la primera aserción,

x ∈ XF ∩ XF 0 ⇔ ∀u v x, u ∈ / F ∧u ∈ / F0 ⇔

∀u v x, u ∈ / F ∪ F 0 ⇔ x ∈ XF ∪F 0 . Para la segunda, si x ∈ XF y u v x, se tiene que u ∈ / F , por lo que u ∈ / F ∩ F 0 , y entonces x ∈ XF ∩F 0 ; de aquí que XF ⊆ XF ∩F 0 . Análogamente, XF 0 ⊆ XF ∩F 0 , y, de las dos contenciones anteriores, es XF ∪ XF 0 ⊆ XF ∩F 0 . Para la tercera, si x ∈ XF 0 y u v x, u ∈ / F 0 ⊇ F , y entonces u ∈ / F . Por lo tanto, x ∈ XF .  F ⊆ A∗ ,

Z de la denición de XF resulta claro que XF ⊆ A . Ahora bien, dado un Z ∗ subconjunto cualquiera X de A , ¾existirá siempre un F ⊆ A tal que X = XF ? Resulta que Dado

no siempre, y aquellos

X

para los que sí existe tal

F

reciben un nombre especial y son objeto

de nuestro estudio. Definición 1.15. Un

existe un



F ⊆A

Pensamos en

sobre el alfabeto

A

es un conjunto

X ⊆ AZ

tal que

X = XF .

tal que

F

espacio shift

como en un conjunto de

bloques prohibidos para X .

Antes de ver ejemplos de subconjuntos de

AZ

que son o no espacios shift, veamos una

propiedad importante que cumplen los conjuntos que sí lo son. Proposición 1.16.

pertenece a X .

Sean X un espacio shift, x ∈ X y k ∈ Z. Entonces σ k x también

Demostración. Sea

k

F

tal que

X = XF .

Consideremos un bloque arbitrario

u

que ocurra

σ x. Por la Proposición 1.1, tenemos que también u ocurre en x, luego u no puede pertenecer F . Como u era un bloque arbitrario de σ k x, vemos que ningún bloque de σ k x está en F , por k k lo que σ x ∈ XF , es decir, σ x ∈ X . 

en a

Sea X ⊆ AZ , y supongamos que existen x ∈ X y k ∈ Z tales que σ x∈ / X . Entonces X no es un espacio shift. Corolario 1.17.

k

Corolario 1.18.

Si X es un espacio shift y k ∈ Z, entonces σ k (X) = X .

y ∈ σ k (X), existe x ∈ X tal que y = σ k (x), que, de acuerdo a la k −k Proposición 1.16, está en X ; luego σ (X) ⊆ X . Esto también muestra que σ (X) ⊆ X , por  k −k k k k −k lo que σ σ (X) ⊆ σ (X); pero como σ es biyectiva, se tiene que σ σ (X) = X , y k entonces tenemos que X ⊆ σ (X).  Demostración. Si

La propiedad de ser

σ (X) = X

se llama

invariancia por shift

o

shift invariancia.

Los corolarios anteriores dicen que todo espacio shift es shift invariante, o, igualmente, que un conjunto que no es shift invariante no puede ser un espacio shift. Por ejemplo, el conjunto ∞ ∞ unitario X = {(01) } no es un espacio shift pues σ (01) = (10)∞ ∈ / X . Sin embargo, la shift invariancia de un conjunto no garantiza que éste sea un espacio shift.

4. LENGUAJES

5

{0, 1} en las que hay exactamente una coordenada 1 y el resto son todas 0. Es decir, X = (xi )i∈Z : ∃k ∈ Z : (xk = 1 ∧ ∀i 6= Si x ∈ X , σx también pertenece a X , es decir, X es invariante por shift. Sin embargo, veamos que X no es espacio shift. Para arribar a una contradicción, supongamos que lo fuera. k Quiere decir que existiría un F tal que X = XF . Debe ocurrir que ∀k ≥ 1, 0 ∈ / F (pues k ∞ ∀k ≥ 1, 0 v · · · 000000.1000000 · · · ∈ X ). Pero entonces 0 pertenecería a XF , con lo cual 0∞ ∈ X , que contradice la denición de X . La contradicción proviene de suponer la existencia del conjunto F , es decir, de suponer que X es un espacio shift.  Ejemplo 1.19. Sea

X

el conjunto de todas las sucesiones bi-innitas sobre



Ejemplo 1.20. El conjunto vacío y el full shift

{0, 1}Z

son espacios shift, según se mostró

en los ejemplos 1.5 y 1.6. En general, cualquier full shift es un espacio shift. Los conjuntos y

XF6

X F4

de los ejemplos 1.8 y 1.10 son también espacios shift. Los ejemplos 1.8 y 1.9 muestran

que un mismo espacio shift puede ser descripto a través de diferentes colecciones de bloques



prohibidos. La restricción de

σ

a un espacio shift

X

será denotada por

σX .

En vistas del Corolario

es una biyección de X en X . Las deniciones anteriormente dadas para puntos jos y Z periódicos de A para σ son igualmente aplicables a un espacio shift X y su respectiva σX . 1.18,

σX

El siguiente resultado será útil en lo sucesivo, pues arma que el conjunto de bloques prohibidos para un espacio shift puede verse como constituido por palabras de longitud al menos donde

N

N,

es cualquier entero positivo.

Sean X un espacio shift y N un entero positivo. Entonces, existe F ⊆ A tal que todo bloque en F tiene longitud al menos N , y X = XF . Proposición 1.21.



Demostración. Siendo

X

un espacio shift, hay un

F1 = w ∈ AN : ∃u ∈ F 0 : u v w 

F 0 ⊆ A∗

tal que

X = XF 0 .

Hagamos

F2 = {u ∈ F 0 : |u| > N }



F = F1 ∪ F 2 Es decir,

F

consta de todas las palabras de

aquellas palabras de largo Observar que que

N

F0

que tengan largo mayor que

N,

más todas F 0.

sobre el alfabeto que contengan una subpalabra que esté en

F1 ∩ F2 = ∅. Es directo ver que todo bloque en F

tiene largo al menos

N . Veamos

X = XF :

x∈ / XF

⇔ ∃i, j ∈ Z : x[i,j] ∈ F ⇔ ∃i, j ∈ Z : x[i,j] ∈ F1 ∨ x[i,j] ∈ F2   ⇔ ∃i, j ∈ Z : j − i + 1 = N ∧ ∃u ∈ F 0 : u v x[i,j] ∨ j − i + 1 > N ∧ x[i,j] ∈ F 0 ⇔ ∃u ∈ F 0 : u v x ⇔ x∈ / XF 0 = X 

4. Definición 1.22. Un

Lenguajes

lenguaje sobre un alfabeto A es cualquier subconjunto de A∗ .

c ∗ es un lenguaje, designaremos por L a su complemento en A , es decir, el ∗ conjunto de todas las palabras de A que no pertenecen a L. Z Si X es un subconjunto de A (no necesariamente un espacio shift) y n un entero no En adelante, si

L

negativo, denotamos por de

X,

Bn (X)

al conjunto de bloques de longitud

n

que ocurren en puntos

es decir,

Bn (X) = {u ∈ An : ∃x ∈ X : u v x} Z n Por ejemplo, si X = A , entonces Bn (X) es precisamente A . Si X = X{11} , B1 (X) = {0, 1}, B2 (X) = {00, 01, 10}, B3 (X) = {000, 001, 010, 100, 101}.

es

B0 (X) = {ε},

6

1. ESPACIOS SHIFT

X = XF y f ∈ F , no puede haber un n tal que f ∈ Bn (X). Es decir, ∀n ∈ N, F ∩ Bn (X) = ∅. Sin embargo, bien puede ocurrir que un bloque de longitud n que no esté en F tampoco esté en Bn (X). Nótese que si

Definición 1.23. Sea

X

un subconjunto de

AZ

. El

lenguaje de X , denotado por B (X),

es el conjunto de todos los bloques que ocurren en puntos de

B (X) = {u ∈ A∗ : ∃x ∈ X : u v x} =

X. ∞ [

En otras palabras,

Bn (X)

n=0 Ejemplo 1.24.

 B X{11} = {ε, 0, 1, 00, 01, 10, 000, 001, 010, 100, 101, . . .}.

Ejemplo 1.25. Sean

X1 = {(01)∞ , (10)∞ }

y

X2 = {(01)∞ };



se tiene que

B (X1 ) = {ε, 0, 1, 01, 10, 010, 101, 0101, 1010, . . .} = B (X2 ) a pesar de que

X1 6= X2 ;

notar, sin embargo, que

X1

es un espacio shift, mientras que

X2

no lo



es. Así como

F

se interpretaba como un conjunto de bloques prohibidos para

conjunto de bloques permitidos para shift

X,

decimos de él que

permitido en X .

XF .

XF , B (XF )

es el

Cuando un bloque está en el lenguaje de un espacio

ocurre en X , o que aparece en X , o que está en X , o que está X = XF , entonces F ∩ B (X) = ∅. esté en F tampoco esté en B (X).

Una consideración análoga a la de más arriba: si embargo, bien puede ocurrir que un bloque que no

Sin

Si un bloque está en el lenguaje de un espacio shift, la denición nos dice que hay un punto del espacio en el cual, en determinada posición, encontramos ese bloque. Sin embargo, usando shift invariancia, podemos ver que el bloque aparece en algún punto del espacio en la coordenada que uno quiera. Proposición 1.26. Sean X un espacio shift, u un bloque en B (X), y k un entero. Entonces, existe x ∈ X tal que x[k,k+|u|−1] = u.

u ∈ B (X), existe x0 ∈ X tal que u v x0 , es decir, hay un i ∈ Z tal que x0[i,i+|u|−1] = u. Hagamos x = σ i−k x0 . Por Proposición 1.16, x pertenece a X , y  x[k,k+|u|−1] = σ i−k x0[k,k+|u|−1] = x0[i,i+|u|−1] = u. Demostración. Dado que

No cualquier lenguaje (en el sentido de la denición 1.22) es el lenguaje de algún espacio shift. Por ejemplo, resulta directo ver que el lenguaje de un espacio shift no vacío es un conjunto ∗ innito, de modo que un subconjunto nito no vacío de A no puede ser el lenguaje de ningún espacio shift sobre

A.

Buscamos caracterizar a aquellos lenguajes que son los lenguajes de los

espacios shift.

Sean X un espacio shift y B (X) su lenguaje. Si v ∈ B (X), entonces: cualquier subbloque de v pertenece también a B (X). hay bloques u y w no vacíos en B (X) tales que uvw ∈ B (X).

Proposición 1.27.

1. 2.

v ∈ B (X), existen i, j ∈ Z y x ∈ X tales que v = x[i,j] . Si v 0 v v , v 0 ocurre también en x, de modo que v 0 ∈ B (X). Además, haciendo u = xi−1 y w = xj+1 , se tiene que u y w son bloques no vacíos que están en B (X) y que uvw = x[i−1,j+1] v x, por lo que uvw ∈ B (X).  Demostración. Como

La proposición anterior establece condiciones necesarias para los bloques del lenguaje de un espacio shift. Resulta que esas condiciones son también sucientes: cualquier lenguaje cuyas palabras satisfagan esas condiciones, es el lenguaje de algún espacio shift. Proposición 1.28. Sea L un lenguaje con la propiedad de que para todo v ∈ L: (a) cualquier subbloque de v está en L, y (b) hay bloques no vacíos u y w en L tales que uvw está en L. Entonces L es el lenguaje de algún espacio shift.

4. LENGUAJES

Demostración. Consideremos el espacio shift

7

X = XLc ,

y veriquemos que

B (X) = L.

Lo haremos por doble inclusión:

v ∈ B (X), existe x ∈ X tal que v v x, de modo que v ∈ / Lc , o sea que v ∈ L. Sea ahora v un bloque de longitud n en L, digamos v = x0 · · · xn−1 . Por aplicación de la condición (b), hay bloques u y w , cuyos símbolos denotaremos, respectivamente, x−j · · · x−1 y xn · · · xk tales que el bloque v 0 = uvw = x−j · · · x−1 x0 · · · xn−1 xn · · · xk está en L. Aplicando 0 0 0 nuevamente la condición (b) a v hay bloques u = x−j 0 · · · x−j−1 y w = xk+1 · · · xk0 tales que el bloque x−j 0 · · · x−j−1 x−j · · · x−1 x0 · · · xn−1 xn · · · xk xk+1 · · · xk0 está en L. Continuando de esta manera, tenemos denido xi para todo entero i, de modo tal que el punto x = (xi )i∈Z cumple que todos sus bloques están en L, y v = x[0,n−1] . Luego, x ∈ XLc , ya que ningún bloque de x c está en L , y v v x, por lo que v ∈ B (XLc ) = B (X).  Si

De las dos proposiciones anteriores, vemos que un subconjunto de

A∗

es el lenguaje de algún

espacio shift si, y sólo si, todos sus bloques cumplen las propiedades (a) y (b) enunciadas en la Proposición 1.28. Hay una correspondencia biunívoca entre el conjunto de todos los espacios shift y el conjunto de todos los lenguajes de espacios shift. Es decir, el lenguaje de un espacio shift determina completamente a ese espacio shift. Dicho de otro modo, no hay dos espacios shift distintos que tengan el mismo lenguaje, según veremos a continuación. Proposición 1.29.

Sea X ⊆ AZ . X es un espacio shift si, y sólo si, X = XB(X)c .

Demostración. La vuelta es consecuencia inmediata de la denición de espacio shift.

Demostraremos la ida por doble inclusión: todos sus bloques están en B (X) (por la denición de c ninguno de ellos está en B (X) , y así x ∈ XB(X)c . Si

x

x ∈ X,

B (X)),

de modo que

Para la otra contención, dado que X es un espacio shift, hay un F tal que X = XF . Si ∈ XB(X)c y v v x, v ∈ / B (X)c , es decir, v ∈ B (X), por lo que v ∈ / F . Como v era un bloque

arbitrario de

x,

hemos demostrado que ningún bloque de

x

está en

F,

por lo que

quedando probada la otra inclusión. Corolario 1.30.

x ∈ XF = X , 

Sean X1 y X2 espacios shift. Entonces, X1 = X2 ⇔ B (X1 ) = B (X2 ).

Demostración. La ida es inmediata de la denición de lenguaje de un espacio shift.

B (X1 ) = B (X2 ), X1 = XB(X1 )c = XB(X2 )c = X2

Para la vuelta, suponiendo que proposición anterior,

En este corolario, es esencial que

X1

y

X2

tenemos que

B (X1 )c = B (X2 )c ,

y, por la



sean espacios shift (ver ejemplo 1.25).

Todos estos resultados muestran que si bien un mismo espacio shift

X

puede ser descripto

a través de varios conjuntos prohibidos, hay un conjunto de bloques prohibidos maximal, que es el complemento del lenguaje de ese espacio shift: cualquier c que F ⊆ B (X) , pues ya sabemos que F ∩ B (X) = ∅.

F

tal que

X = XF

cumple con

Resumimos la correspondencia entre espacios shift y lenguajes de espacios shift a través de las siguientes ecuaciones:

L = B (XLc )

X = XB(X)c

La Proposición 1.29 tiene otro útil corolario, que dice que si un punto sus bloques en el lenguaje de un espacio shift a

X,

entonces el punto

x

x

de

AZ

tiene todos

necesariamente pertenece

X. Corolario 1.31.

Demostración.

X = XB(X)

c,

Sea X un subconjunto de AZ . X es un espacio shift si, y sólo si,   ∀x ∈ AZ , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X   Z Notemos que ∀x ∈ A , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X si, y sólo

de modo que el corolario se deduce directamente de la Proposición 1.29.

si,



8

1. ESPACIOS SHIFT

4.1.

Irreducibilidad.

v ∈ B (X). Por la Proposición 1.28, v puede ser extendido hacia ambos lados para formar un bloque uvw que también está en el lenguaje de X . Ahora bien, dados dos bloques u y w en B (X), puede no ser posible encontrar un bloque v tal que uvw esté en B (X). Ejemplo 1.32. Sea

1

Supongamos que

X

es un espacio shift, y que

y tomemos u y w en B (X). Ni u ni w pueden contener dos · · · 00000u0w0000000 · · · no contiene dos 1 consecutivos, y B (X). 

X = X{11} ,

consecutivos. Entonces, el punto

por eso el bloque

u0w

está en

X = {0∞ , 1∞ }. Se tiene Sin embargo, no hay ningún bloque v tal que 1v0 contiene simultáneamente un 0 y un 1. Ejemplo 1.33. Sea

que

u = 1

y

w = 0

B (X). punto de X 

están ambos en

esté en el lenguaje, pues ningún

Los espacios shift en los que dos bloques del lenguaje pueden ser enganchados a través de un tercer bloque forman una clase importante de espacios shift.

X es irreducible si para cualquier par de bloques u y B (X) tal que uvw pertenece a B (X). Un espacio shift que

Definición 1.34. Un espacio shift

w

en

B (X),

existe un bloque

no es irreducible se llama

v

en

reducible.

El espacio shift del ejemplo 1.32 es irreducible, en tanto que el del ejemplo 1.33 es reducible.

5.

Shifts de bloques

Hemos denido un alfabeto como un conjunto nito de símbolos, sin exigir nada en especial

A

es un alfabeto y N es un entero positivo, cae también en la categoría N N de alfabeto el conjunto A . Por claridad notacional, cuando estemos pensando en A como a los símbolos. Si

alfabeto, representaremos su símbolos de la forma



aN



 ...     a  2 a1 a1 a2 · · · aN . Nótese que cada ai ∈ A. AN es un alfabeto (cuyos elementos son en realidad bloques sobre otro alfabeto),  N N Z Z tenemos derecho a pensar en la full A -shift, es decir, A . Dado un punto x de A , hay  N Z que de manera bastante natural pueden asociarse a x. Los llamaremos, dos puntos de A respectivamente, βN (x) y γN (x). El siguiente diagrama ilustra cómo se obtienen a partir de x: en lugar de Ya que

x

= ···

x−1 

βN (x) = · · ·

  

 γN (x) = · · ·

xN −2 . . .

x0 x−1 x−1

x0





  

 .  





.    . .   .   x   −N +1 x−N

Nótese que, a partir de cada posición.

.

βN (x),

xN −1 . . .

x1 x0 xN −1 . . .

x1 x0

x1 xN

x2









  

 ...     x  2 x1

  

 

x2N −1

 

xN +1 . . .

x3 x2 x3N −1

···

x3 



  

  

 

xN +2 . . .

x4 x3 x4N −1

   

···



. . .        . . . . . .        ···   x   x   x  N +1 2N +1 3N +1 xN x2N x3N

es posible recuperar

x,

leyendo los símbolos inferiores de

5. SHIFTS DE BLOQUES

βN

Formalizamos la denición de

y de

γN :

9

Ambas son funciones de

AZ

en

AN

Z

, y se

denen mediante:



xi+N −1

 (βN (x))i =   βN (x)

se llama la

. . .

xi+1 xi





  

 (γN (x))i =  

x(i+1)N −1 . . .

xiN +1 xiN

   

presentación en bloques de tamaño N , con solape, del punto

x. El término solape se reere al hecho de que dos coordenadas consecutivas cualesquiera de βN (x) consisten en bloques u = u1 · · · uN y v = v1 · · · vN con u2 · · · uN = v1 · · · vN −1 . Cuando dos bloques u y v cumplen esto, es decir, que la cola de u (lo que queda de u luego de eliminar el primer símbolo) es igual a la cabecera de v (lo que queda de v luego de eliminar el último símbolo), decimos que u y v solapan progresivamente. Entonces, dos símbolos consecutivos de βN (x), vistos como bloques sobre A, solapan progresivamente, y de allí el nombre para βN . γN (x) se llama la presentación en bloques de tamaño N , sin solape, del punto x, por la razón de que no necesariamente se cumple la condición de solape progresivo entre coordenadas consecutivas de

γN (x).

Las deniciones anteriores pueden generalizarse de la siguiente manera:

X un espacio shift y N un entero positivo. Hagamos AN X = BN (X).  N Z βN : X → AX mediante   xi+N −1 .   . .  (βN (x))i =   x 

Definición 1.35. Sean

Se dene la función

i+1

xi La imagen de X a través de [N ] se denota X . Es decir,

Análogamente, se dene la

βN

se llama

presentación en N -bloques de X , con solape, y

X [N ] = {βN (x) : x ∈ X} = βN (X)  N Z mediante función γN : X → AX   x(i+1)N −1 .   . .  (γN (x))i =   x  iN +1

xiN La imagen de X a través de N se denota X . Es decir,

γN

se llama

presentación en N -bloques de X , sin solape,

X N = {γN (x) : x ∈ X} = γN (X)       0 1 0 2 Ejemplo 1.36. Sea X = X{11} . Entonces, AX = , , . 0 0 1 Si x = · · · 000.01010 · · · , entonces               0 0 0 1 0 1 0 β2 (x) = · · · . ··· 0 0 0 0 1 0 1  γ2 (x) =

···

0 0



 .

1 0

 

1 0

 ···

X [2] = XF1 y que X 2 = XF2 con                 0 0 1 0 1 1 0 0 F1 = , , , 0 1 0 0 0 0 1 1

Se puede mostrar que

y

10

1. ESPACIOS SHIFT

 F2 = (notar que

F1

tiene cuatro elementos, y

F2



1 0

0 1

 

uno).

Por cuestiones de codicación que más adelante detallaremos, de ahora en más estaremos más interesados en las presentaciones con solape que en las sin solape. Nótese que la función −1 βN actúa inyectivamente, de modo que es una biyección entre X y X [N ] . De este modo, βN es [N ] una función bien denida desde X hacia X , o, más generalmente, desde el conjunto de todos  N Z Z los puntos de A cuyos símbolos consecutivos solapan progresivamente hacia A . Será conveniente sobrecargar el símbolo

βN ,

manera: para

w = w1 · · · wm

m ≥ N,   wN  ...   βN (w) =   w  con

2

denimos

   

w1 Es directo ver que

βN

βN se pueda conN , de la siguiente

de manera que la función

siderar también para actuar sobre bloques de tamaño mayor o igual que

wN +1 . . .

w3 w2

wm





  ··· 

.   . .    w  m−N +2 wm−N +1

actúa sobre bloques en forma inyectiva:



u 6= u0 ⇒ βN (u) 6= βN (u0 ).

Las presentaciones con (o sin) solape de cualquier espacio shift son también espacios shift.

Sea X un espacio shift sobre el alfabeto A. Para todo N ≥ 1, X [N ] es un espacio shift sobre el alfabeto BN (X). Proposición 1.37.

F 0 tal que X = XF 0 . En virtud de la Proposición 1.21, podemos 0 suponer que cada bloque de F tiene largo al menos N . Hagamos  F1 = {βN (w) : w ∈ F 0 } F2 = uv ∈ (BN (X))2 : u y v no solapan progresivamente Demostración. Sea

F = F1 ∪ F 2 X [N ] = XF , con lo que quedará establecido que X [N ] es un espacio shift. [N ] Primero veamos que X ⊆ XF1 . Sea x e ∈ X [N ] , y u e un bloque en x e. Existe x ∈ X tal que βN (x) = x e, por lo que hay un bloque u de x tal que βN (u) = u e. Dado que que βN es inyectiva y que u ∈ / F 0 , vemos que u e∈ / F1 . Como u e era arbitrario, x e ∈ XF1 . [N ] Ahora veamos que X ⊆ XF2 : sabemos que si x e ∈ X [N ] , ocurre que ∀i ∈ Z, x ei y x ei+1 solapan progresivamente. Entonces, ningún bloque de x e de tamaño 2 puede estar en F2 (que tiene sólo bloques de tamaño 2), por lo que x e ∈ X F2 . [N ] Como X ⊆ XF1 y X [N ] ⊆ XF2 , se tiene, usando la Proposición 1.14, que X [N ] ⊆ XF1 ∩ XF2 = XF1 ∪F2 = XF . [N ] Veamos ahora que XF ⊆ X : sea x e ∈ XF = XF1 ∪F2 = XF1 ∩ XF2 . Entonces, x e ∈ XF1 y −1 Z x e ∈ XF2 . Como x e ∈ XF2 , podemos hacer x = βN (e x), el cual pertenece a A ; pero dado que x e ∈ XF1 , debe ser x ∈ XF 0 = X , y entonces x e ∈ X [N ] . 

y veriquemos que

6.

Códigos de ventana deslizante

En Teoría de Códigos, interesan las maneras que hay de traducir un mensaje (fuente) sobre un alfabeto

A

en mensaje sobre otro alfabeto

U

(posiblemente el mismo que el del mensaje

fuente). Esto puede ser visto (sobre todo si el mensaje fuente es largo) como una manera de transformar puntos de un espacio shift en puntos de otro espacio shift, a través de una función. De las maneras en que esto se puede hacer, hay una clásica que explicamos seguidamente. Supongamos dados dos enteros

Φ

m

y

n,

con

m + n ≥ 0, y supongamos también dada una + n + 1 sobre A en símbolos de U . Entonces, y ∈ U Z es mirar el bloque que hay en una

que transforma bloques de tamaño m Z una manera de transformar un x ∈ A en un función

6. CÓDIGOS DE VENTANA DESLIZANTE

ventana de ancho la función

m+n+1

alrededor de la coordenada i-ésima de

11

x

y aplicarle a ese bloque

Φ para obtener la correspondiente coordenada del transformado. Más concretamente, y será Φ x[i−m,i+n] . Para calcular luego la (i + 1)-ésima coordenada

la i-ésima coordenada de de

y,

desplazamos toda la ventana una posición a la derecha, y repetimos. Llevando esto a

cabo para todo

i ∈ Z,

obtenemos el transformado de

la ventana, transformar usando

Φ

x.

Esta operación de ver el contenido de

y deslizar, motiva que la función transformadora reciba el

nombre de código de ventana deslizante, que abreviaremos CVD. Formalmente:

m, n ∈ Z con m + n ≥ 0, A y U alfabetos, X un espacio shift sobre A, y Φ una función de Bm+n+1 (X) en U . El código de ventana deslizante con memoria m y anticipación n inducido por Φ es la transformación φ : X → U Z denida por y = φ (x) con yi = Φ x[i−m,i+n] . Definición 1.38. Sean

Notar, en la denición de arriba, la distinción tipográca entre

φ

(que transforma tirillas

Φ (que transforma bloques de tamaño m + n + 1). Decimos que φ es inducida por Φ, o que Φ induce a φ, y, para expresar este hecho, escribimos φ = Φ[−m,n] . La función ∞ Φ se llama función de bloques, o función inductora, de φ. De los números m y n decimos que son, respectivamente, la memoria y la anticipación de φ (o también de Φ), por el hecho bi-innitas) y

de que indican cuántas coordenadas del pasado y del futuro hay que conocer para obtener el transformado en la posición que corresponde al presente. Ejemplo 1.39.

A = {0, 1} , U = {A, B, C} , m = 1, n = 2, X = X{110,101} , Φ : B4 (X) → U

dada por

Φ (0000) = A Φ (0001) = A Φ (0010) = B Φ (0011) = A Φ (0100) = C Φ (1000) = B Φ (1001) = C Φ (1111) = A [−m,n]

φ = Φ∞ y x = · · · 001.000010010001 · · · , tenemos que φ (x) = · · · BC.BAABCCBCBA ·    pues φ (x)−2 = Φ x[−2−m,−2+n] = Φ x[−3,0] = Φ (0010) = B , φ (x)−1 = Φ x[−1−m,−1+n] =    Φ x[−2,1] =Φ (0100) = C , φ (x)0 = Φ x[0−m,0+n] = Φ x[−1,2] = Φ (1000) = B , φ (x)1 = Φ x[1−m,1+n] = Φ x[0,2] = Φ (0000) = A, y así. 

Entonces, si

A, U, X, x y Φ iguales que en el ejemplo anterior, excepto que m = 0, n = 3. φ (x) = · · · BCB.AABCCBCBA · · · 

Ejemplo 1.40.

En este caso,

Ejemplo 1.41.

1 = Φ (1),

y

F =

A = {0, 1} = U, X = AZ , m = 0 = n, Φ : B1 (X) → U x ∈ AZ , F (x) = 1∞ .

[−m,n] Φ∞ . Entonces, para todo

dada por

Φ (0) = 

A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 0, n = [−m,n] 1, Φ (ab) = b, φ = Φ∞ . Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi xi+1 ) = xi+1 = σX (x)i .  Ejemplo 1.42.

A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 1, n = [−m,n] −1 0, Φ (ab) = a, φ = Φ∞ . Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi−1 xi ) = xi−1 = −1 σX (x)i .  Ejemplo 1.43.

U = AN (N ≥ 1), X cualquier espacio shift sobre A, y φ = βN (la presentación en N -bloques con solape de X ). Entonces φ es un CVD con memoria 0 y anticipación N − 1 inducido por Φ denida como   aN Φ (a1 · · · aN ) =  ...  a1 Ejemplo 1.44.

A

cualquier alfabeto,



12

1. ESPACIOS SHIFT

Ejemplo 1.45. En relación al ejemplo anterior,

X,

con memoria y anticipación

0,

inducido por

 Φ 

aN . . .

−1 βN

es también un CVD desde

Φ denida 

X [N ]

hacia

como

 = a1

a1  Al igual que con la transformación shift obligatoriamente) la notación Los CVD para los cuales

σ , si φ es un CVD, φxi para (φ (x))i .

emplearemos (aunque no

φx para φ (x) y m = 0 = n se llaman códigos monobloque,

dado que actúan

mirando bloques que tienen un solo símbolo (el que corresponde al presente).

Y

Si un CVD φ con dominio X es tal que φ (X) es un subconjunto de algún espacio shift ⊆ U Z , podemos mirar a φ como una función entre los espacios shift X e Y , y diremos

entonces que el CVD es un código entre los espacios shift

X

e

Y.

φ entre dos espacios shift X e Y es un CVD. Para que lo sea, debemos Φ : Bm+n+1 (X) → B1 (Y ) tal que ∀x ∈ X, ∀i ∈ Z, φxi = posible el hallazgo de una función inductora, φ no es un CVD.

No cualquier función

 m,

encontrar un

Φ x[i−m,i+n]

un

n

. Si no es

Ejemplo 1.46.

y una

A = {0, 1} = U, X = AZ , Y = U Z , φ : X → Y  ∞ ∞ 0 si x = 0 φ (x) = 1∞ si x 6= 0∞

denida por

φ no es un CVD. Supongamos que lo fuera. Debe haber una función inductora Φ m y anticipación n. Sea x = (xi )i∈Z denido por xn+1 = 1, y xi = 0 para todo ∞ i 6= n + 1. Ya que )0 = 0 (pues φ0∞ = 0∞ ), debe ser Φ (0m+n+1 ) = 0. Pero entonces  es (φ0 m+n+1 φx0 = Φ x[−m,n] = Φ (0 ) = 0. Contradicción, pues por la denición de φ se tiene que ∞ φ (x) = 1 , de donde φx0 = 1.  Veamos que

con memoria

A veces será conveniente agrandar el ancho de la ventana para la función inductora (sin modicar, obviamente, el CVD en cuestión). Para hacer esto, simplemente debemos ignorar las coordenadas añadidas a la ventana. Esto es lo que dice el siguiente resultado: Proposición 1.47. Sea φ : X → Y un código de ventana deslizante con memoria m y anticipación n. Sean M ≥ m y N ≥ n. Entonces existe un código de ventana deslizante φe : X → Y con memoria M y anticipación N tal que φe = φ. Demostración. Sea Φ : Bm+n+1 (X) → B1 (Y ) la función inductora de φ. e Φ : BM +N +1 (X) → B1 (Y ) mediante e (a−M a−M +1 · · · a−m · · · a−1 a0 a1 · · · an · · · aN ) = Φ (a−m · · · a0 · · · an ) Φ

Denamos

 ] e i=Φ e [−M,N e x[i−M,i+N ] = φe = Φ . Sea x ∈ X . Para cualquier i ∈ Z, se tiene que φx ∞  e = φx. Como x es arbitrario, se sigue que φe = φ. Φ x[i−m,i+n] = φxi , y entonces φx  y hagamos

Dado un código de ventana deslizante, se puede suponer que su memoria es igual a su anticipación. Corolario 1.48.

m y anticipación n inducido por una transformación de bloques Φ (que transforma bloques de tamaño m + n + 1 en símbolos), se puede denir, de manera ∗ natural, una función Φ que transforma bloques de tamaño m + n + k (k ≥ 1), haciendo Dado un CVD con memoria

Φ∗ (a−m a−m+1 · · · a0 a1 · · · an−1 an an+1 · · · an+k−1 ) = Φ (a−m · · · an ) Φ (a−m+1 · · · an+1 ) · · · Φ (ak−m−1,n+k−1 ) Si además convenimos en que

Φ∗ ,

aplicado a un bloque de tamaño menor que

produce la palabra vacía, tenemos que, para



Φ (a1 · · · ap ) =



p ≥ 0,

es

ε Φ (a1 · · · am+n+1 ) Φ∗ (a2 · · · ap )

si si

p 0, X ∼ Y ⇒ |{x ∈ X : x tiene período n}| = |{x ∈ Y : x tiene período n}|. 6.1.1. Recodicación a códigos monobloque. Sea φ : X → Y un CVD. Mostraremos cómo e conjugado a X y φ a un CVD monobloque φe de X e a es posible recodicar X a un shift X Y . Este procedimiento se denomina recodicación de φ a un código monobloque, y será de puntos periódicos de período cantidad de puntos de período

usado en varias demostraciones posteriores. Proposición 1.59. Sea φ : X → Y un código de ventana deslizante. Entonces existe un e , una conjugación ξ de X a X e y un código de ventana deslizante monobloque espacio shift X −1 e e φ : X → Y tales que ξ es una conjugación y φe ◦ ξ = φ. Si además φ es una conjugación, φe también lo es.

φ es inducida ◦ βm+n+1 . Dado

Φ con memoria m y anticipación n. −m Tomemos y ξ = que σ e y βm+n+1 son conjugaciones, y X e . Su inversa ξ −1 : X e →X teniendo en cuenta la Proposición 1.57, ξ es conjugación de X a X −1 −1 −1 m m está dada por ξ = βm+n+1 ◦ σXe , y es otra conjugación pues βm+n+1 y σXe lo son. Denamos e → Y mediante φe = φ◦ξ −1 . Tenemos que φe es CVD, por ser la composición de dos CVD, y φe : X   −1 e e e e → B1 (Y ) cumple que φ◦ξ = φ◦ξ ◦ξ = φ. Además, una función inductora para φ es Φ : B1 X Demostración. Supongamos que

e = X [m+n+1] X

−m σX e

por

16

1. ESPACIOS SHIFT

denida por



 pues para

   x e =   

xi+n . . .

xi . . .

an

 ..  .  e Φ  a0  .  .. a−m       

xi−m 

e ∈X

     = Φ (a−m · · · a0 · · · an )  

se tiene que

i∈Z

xi+n+m

.  . .   m σXe (e x) =  xi+m  . .  . xi y entonces, para cualquier entero

      

 −1 m βm+n+1 σX x) = (xi )i∈Z ∈ X e (e i∈Z

j

se cumple que

         −1 m exj = φ ξ −1 x e = Φ x = Φ φe e j = Φ βm+n+1 σX (e x )  [j−m,j+n] e [j−m,j+n]  

xj+n . . .

xj . . .

      

xj−m de donde se ve que

φe es

un CVD monobloque.

Si se tiene además que con

φ,

por la Proposición

6.2.

φ es una conjugación, siendo φe la composición de la conjugación ξ −1 e una conjugación de X e a Y. 1.57, es φ 

Imagen de un espacio shift por un código de ventana deslizante.

Hasta

ahora, hemos visto que un CVD φ actúa transformando puntos de un espacio shift X en Z puntos de algún full shift U . Cabe preguntarse cómo actúa globalmente φ, en el sentido de Z qué características tiene φ (X) como subconjunto de U . Mostraremos ahora que φ (X) es un espacio shift sobre el alfabeto

U.

Lema 1.60. Sea φ un código de ventana deslizante monobloque desde un espacio shift X hacia un full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U .

A al alfabeto de X . Supongamos que φ está inducida por Φ : B1 (X) → U . Hagamos L = {Φ (w) : w ∈ B (X)}, y veriquemos que φ (X) = XLc , con lo que quedará probado que φ (X) es un espacio shift. 1. Sea y ∈ φ (X). Existe x ∈ X tal que y = φx. Sea u tal que u v y . Entonces existen  i, j ∈ Z tales que u = y[i,j] = (φx)[i,j] = Φ x[i,j] , es decir, u = Φ (w) con w ∈ B (X). Luego, u ∈ L, por lo que u ∈ / Lc . Como u era un bloque arbitrario de y , vemos que y ∈ XLc . Entonces, φ (X) ⊆ XLc . 2. Sea y ∈ XLc . Entonces todo bloque de y está en L, de donde se deduce que para todo n ≥ 0, existe w ∈ B (X) tal que y[−n,n] = Φ (w). Porlo tanto,  para todo n ≥ 0,  (n) (n) (n) existe x ∈ X tal que x[−n,n] = w y φx(n) [−n,n] = Φ x[−n,n] = y[−n,n] . Usaremos  (n) la sucesión x para encontrar un punto x ∈ X tal que φx = y , con lo que n∈N quedará probado que y ∈ φ (X), y, con ello, que XLc ⊆ φ (X). Como A es nito, hay Demostración. Llamemos

6. CÓDIGOS DE VENTANA DESLIZANTE

17

x(n) tienen igual símbolo a0 en la posición 0. Sea S0 el conjunto de todos esos n. Como A3 es nito, hay un subconjunto innito S1 de S0 (n) y símbolos a−1 y a1 tales que ∀n ∈ S1 , x[−1,1] = a−1 a0 a1 . Continuando de esta manera, para cada k ≥ 1 conseguimos un subconjunto innito Sk de Sk−1 y símbolos a−k y (n) ak tales que ∀n ∈ Sk , x[−k,k] = a−k · · · a0 · · · ak . Denamos x = (ak )k∈Z . Ocurrirá que una cantidad innita de

(n)

n

tales que

∀k ≥ 0, ∀n ∈ Sk , x[−k,k] = x[−k,k] .

Si u = x[i,j] para algunos enteros i y j , haciendo (n) x[−k,k] para cualquier n ∈ Sk , por lo que existe n ≥ 0

k = m´ax {|i| , |j|} será x[−k,k] = (n) tal que u v x ∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está en el lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Sea ahora k ≥ 0. Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que

   (n) (φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k] Es decir,

∀k ≥ 0, (φx)[−k,k] = y[−k,k] .

Entonces,

φx = y . 

Teorema 1.61. Sea φ un código de ventana deslizante desde un espacio shift X hacia un full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U . Demostración. Por Proposición 1.59, existe un espacio shift

e y un CVD monobloque φe : X e → Y tales que φ = φe ◦ ξ . X →X   e . Entonces, φ (X) = φe (ξ (X)) = φe X e , que, por Lema ξ (X) = X en consecuencia φ (X) es espacio shift sobre U .

6.3.

Inversa de una conjugación.

e, X

Como

una conjugación

ξ

ξ :

es conjugación, es

1.60, es un espacio shift, y



Mostremos ahora que la inversa de una conjugación

es siempre una conjugación.

Sea φ una conjugación monobloque del espacio shift X al espacio shift Y . es una conjugación de Y a X .

Lema 1.62.

Entonces, φ

−1

A el alfabeto para X y U el de Y . Supongamos que φ está inducida Φ : B1 (X) → B1 (Y ). Hagamos ψ = φ−1 . Debemos mostrar que ψ es un CVD biyectivo de Y a X . Por ser la inversa de una función biyectiva, ψ es también biyectiva, así que sólo resta Demostración. Sean

por

vericar que es CVD, para lo que usaremos la Proposición 1.53.

φ un CVD, tenemos que φ ◦ σX = σY ◦ φ, por lo que ψ ◦ φ ◦ σX ◦ ψ = ψ ◦ σY ◦ φ ◦ ψ , σX ◦ ψ = ψ ◦ σY . Por lo tanto, ψ cumple la condición de conmutar con σ . Supongamos que no existe un N ≥ 0 tal que para todo y ∈ Y , (ψy)0 dependa de (n) y[−N,N ] . Esto quiere decir que para cada n ≥ 0 existen y (n) e yb(n) en Y tales que y[−n,n] =     (n) yb[−n,n] pero ψ y (n) 0 6= ψ yb(n) 0 . Llamemos x(n) = ψ y (n) y x b(n) = ψ yb(n) . Tenemos (n) que, para cada n ≥ 0, tanto x como x b(n) están en X , y además x(n) 6= b(n) pues  x (n) ambos dieren en la coordenada 0. Consideremos las dos sucesiones en X , x y n∈N  (n) 0 x b . Como A es nito, debe haber un símbolo a0 ∈ A, y un conjunto innito S0 n∈N   0 (n) de enteros tal que ∀n ∈ S0 , x = a0 ; nótese que ∀n ∈ S00 , x b(n) 0 6= a0 . Puesto que 0 0 A es nito, debe innito S0 de S0 tal que  haber un símbolo b0 6= a0 y un subconjunto   (n) (n) ∀n ∈ S0 , x b 0 = b0 . Observar que, entonces, ∀n ∈ S0 , x 0 = a0 6= b0 = x b(n) 0 . 3 0 Como la cantidad de bloques en A es nita, debe haber un subconjunto innito S1 de  S0 y símbolos a−1 y a1 tales que ∀n ∈ S10 , x(n) [−1,1] = a−1 a0 a1 , y consecuentemente 0 debe haber un subconjunto innito S1 de S1 y símbolos b−1 y b1 tales que ∀n ∈ S1 ,    x b(n) 0 = b−1 b0 b1 . Notar que ∀n ∈ S1 , x(n) [−1,1] = a−1 a0 a1 6= b−1 b0 b1= x b(n) [−1,1] . Continuando de esta manera, para cada k ≥ 1 encontramos un subconjunto innito Sk

1. Por ser

y entonces 2.

18

1. ESPACIOS SHIFT

 a−k , ak , b−k y bk tales que ∀n ∈ Sk , x(n) [−k,k] = a−k · · · a0 · · · ak 6=  b−k · · · b0 · · · bk = x b(n) [−k,k] . Tomemos x = (ak )k∈Z y x b = (bk )k∈Z . Obsérvese que ∀k ≥

de

Sk−1

y símbolos

(n)

0, ∀n ∈ Sk , x[−k,k] = x[−k,k]

yx b[−k,k]

(n)

= x b[−k,k] .

Si u = x[i,j] para algunos enteros i y j , (n) x[−k,k] para cualquier n ∈ Sk , por lo que existe

k = m´ax {|i| , |j|} será x[−k,k] = n ≥ 0 tal que u v x(n) ∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está en el lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Igualmente, x b ∈ X . Además, x 6= x b pues x0 = a0 6= b0 = x b0 . Sea ahora k ≥ 0. Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que    (n) (n) (n) (φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k] = yb[−k,k]    (n) = Φ x b[−k,k] = Φ x b[−k,k] = (φb x)[−k,k] haciendo

Es decir,

x 6= x b.

∀k ≥ 0, (φx)[−k,k] = (φb x)[−k,k] .

Contradicción a la inyectividad de

no hay un

N ≥0

tal que

ψy0

De allí, tendríamos que

φ. La contradicción y[−N,N ] .

φx = φb x

pese a ser

proviene de suponer que

es función de

 Teorema 1.63. Sea φ una conjugación del espacio shift X al espacio shift Y . Entonces, φ−1 es una conjugación de Y a X .

e , una conjugación ξ : X → X e . Entonces e y una conjugación monobloque φe : X e → Y tales que ξ es conjugación y φ = φ◦ξ X −1 −1 −1 −1 e φ = ξ ◦ φ , y, por aplicación de Lema 1.62 y Proposición 1.57, φ resulta ser también una conjugación.  Demostración. Por Proposición 1.59, existe un espacio shift

−1

Capítulo 2

SHIFTS DE TIPO FINITO Los espacios shift que pueden ser descriptos por un conjunto se llaman

shifts de tipo nito

nito

de bloques prohibidos

(abreviado STF). A pesar de ser los más simples, juegan un rol

fundamental en ciertas áreas de la Matemática, tales como sistemas dinámicos. Su estudio también ha proporcionado soluciones a problemas prácticos de importancia, tales como encontrar esquemas de codicación ecientes para almacenar datos en discos de computadoras. Una razón por la que los STF son tan útiles es que tienen una representación sencilla usando un grafo nito dirigido. Preguntas sobre el shift pueden, a menudo, reformularse como preguntas sobre la matriz de adyacencia del grafo. Resultados básicos del álgebra lineal nos ayudan a analizar esta matriz y encontrar respuestas. En este capítulo, primero presentamos los STF, y damos algunos ejemplos típicos. Luego se explica las conexiones con los grafos dirigidos y las matrices, e introducimos la fundamental operación de desdoblamiento de estados. Concluimos con una breve descripción sobre el almacenamiento magnético, indicando por qué la shift de paso limitado (1,3) es la característica central de la mayoría de los métodos más usados para el almacenamiento de datos en discos rígidos de computadoras.

1.

Restricciones de tipo nito

Primero denimos shifts de tipo nito, y luego explicamos el hecho de que tienen una propiedad (markoviana) de memoria nita. Definición 2.1. Un

shift de tipo nito (STF) es un espacio shift que puede describirse

por un conjunto nito de bloques prohibidos, es decir, un espacio shift algún conjunto nito

F

de bloques tal que

X

para el cual existe

X = XF .

Ya hemos tratado antes con varios STF.

AZ es un A = XF .

Ejemplo 2.2. El full shift

está prohibido, de modo que

STF: podemos tomar simplemente

Ejemplo 2.3. El shift de la razón de oro

F = {11},

obteniendo

F =∅

pues nada



Z

X

(ejemplo 1.10) es un STF, pues podemos tomar

X = XF .



X el conjunto de todos los puntos de {e, f, g}Z tales que e puede ser seguido sólo por e o por f , f puede ser seguido sólo por g , y g puede ser seguido sólo por e o por f . Entonces X es el espacio shift que resulta de tomar F = {eg, f e, f f, gg}, y, en consecuencia, es un STF.  Ejemplo 2.4. Sea

Notemos que un STF

X

podría también describirse mediante un conjunto innito de bloques

prohibidos. De hecho, la Proposición 1.29 muestra que ésto puede ocurrir siempre que

X

no

X es innito. La denición de STF sólo algún F adecuado. Z Supongamos que X ⊆ A es STF, y que X = XF para una colección nita F de bloques. Sea N la longitud del bloque más largo en F . Si formamos la colección FN de todos los bloques de longitud N sobre A que contienen algún subbloque en F , entonces tendremos que XFN = XF (prop. 1.21) y los bloques de FN tienen todos la misma longitud N . Por ejemplo, si A = {0, 1} y F = {11, 000}, entonces F3 = {110, 111, 011, 000}. A veces, será conveniente asumir que

sea el full shift, pues el complemento del lenguaje de pide que exista

19

20

2. SHIFTS DE TIPO FINITO

este procedimiento ya ha sido llevado a cabo, y que todos los bloques prohibidos tienen igual longitud. Si todos los bloques en

F

tienen longitud

N,

entonces

x ∈ AZ

está en

XF exactamente cuando x[i,i+N −1] ∈ / F para todo i ∈ Z, o, equivalentemente, cuando x[i,i+N −1] ∈ BN (XF ) para todo i ∈ Z (Supongamos que ∀i ∈ Z, x[i,i+N −1] ∈ / F . Sea u un bloque de x. Si |u| 6= N, u ∈ /F pues F tiene sólo bloques de tamaño N , y si |u| = N, u ∈ / F por la hipótesis; entonces ningún bloque de x está en F , por lo que x ∈ XF y ∀i ∈ Z, xi,i+N −1] ∈ B (XF ). Recíprocamente, si un bloque de tamaño N está en BN (XF ), no puede estar en F ). Luego, para determinar si x está o no en XF , sólo necesitamos escanear las coordenadas de x con una ventana de ancho N , y vericar que cada bloque visto a través de esta ventana está en la colección permitida BN (X). Esta observación es, a menudo, útil cuando se debe decidir si un dado espacio shift es o no de tipo nito. Ejemplo 2.5. El shift par

X

(ejemplo 1.13) no es un STF, pues, si lo fuera, existiría

N ≥1

y una colección de N -bloques tal que X = XF . En dicha colección, no puede haber bloques de la 0k , ni 0k 10l para ningún k, l ≥ 0, ya que 0∞ 10∞ ∈ X . Pero entonces 0∞ 102N +1 10∞ ∈ XF

forma

N -bloques

pues ninguno de sus

está en

F.

Sin embargo, ese punto no pertenece a

X

por la



denición del shift par. Hay también una noción de memoria para un STF: Definición 2.6. Un shift de tipo nito

es de memoria M

una colección de bloques prohibidos que tienen todos longitud

si puede describirse mediante

M + 1. F M.

Para motivar esta denición, supongamos que todos los bloques de Sea

u = a1 a2 . . . an

un bloque con longitud

u

máquina lee los símbolos de detecte si

u

n

mucho mayor que

tienen longitud

uno por vez, de izquierda a derecha. Para que esta máquina

contiene o no un bloque prohibido, sólo debe recordar los previos

leídos, es decir, necesita sólo Observación 2.7. Sea

bloques de longitud

M

X

M +1.

Supongamos que una

M

símbolos

espacios de memoria.

un STF de memoria

M,

descripto a través de un conjunto

F

de

M + 1.

u un bloque de A∗ que no contiene ningún subbloque en F . Esto no garantiza que u ∈ B(X). Por ejemplo: F = {10, 11}, u = 001. u no contiene subbloques en F , pero u∈ / B(X) pues X = {0∞ }. 0 M +1 Sea F = A − B(XF ). Entonces, F ⊆ F 0 , y XF 0 = XF . Para ver la primera aserción, si f ∈ F, |f | = M + 1 y f ∈ / B(XF ), luego f ∈ F 0 . Para la segunda, ya que F ⊆ F 0 , se tiene que XF 0 ⊆ XF . Si x ∈ XF y u es un bloque de longitud M + 1 que ocurre en x, u ∈ B(XF ), por lo que u ∈ / F 0 . Luego x no contiene bloques en F 0 , mostrando que x ∈ XF 0 y, consecuentemente, XF ⊆ XF 0 .

1. Sea

2.

Notar que un STF de memoria

M

es también de memoria

K

para todo

K ≥ M.

Un STF

de memoria 0 es simplemente un full shift, pues prohibir bloques de tamaño 1 es meramente quitar letras del alfabeto. Se puede pensar en un STF de memoria 1 como en uno dado por una colección de símbolos junto con una descripción de cuáles símbolos pueden seguir a cuáles, como en el ejemplo 2.4. Posteriormente veremos muchos ejemplos de tales STF de memoria 1. Proposición 2.8.

memoria M .

Si X es un shift de tipo nito, entonces hay un M ≥ 0 tal que X es de

X es de tipo nito, X = XF para alguna colección nita de M = 0. Si F = 6 ∅, sea M igual a la longitud del bloque más largo en F , menos 1. Nuestra discusión anterior muestra que X es descripto por FM +1 (el conjunto de todas las palabras de largo M + 1 que contienen algún subbloque en F ), por lo que X es de memoria M .  Demostración. Ya que

bloques

F.

Si

F = ∅,

sea

1. RESTRICCIONES DE TIPO FINITO

21

El lenguaje de un STF está caracterizado por la propiedad de que si dos palabras se solapan lo sufuciente, pueden ser unidas a lo largo del solape para formar otra palabra en el lenguaje.

Sea X un espacio shift sobre el alfabeto A, y M ≥ 0. X es STF de memoria M si, y sólo si, ∀u, v, w ∈ A∗ , uv ∈ B(X) ∧ vw ∈ B(X) ∧ |v| ≥ M ⇒ uvw ∈ B(X) Teorema 2.9.

F una colección de bloques de M + 1 tal que X = XF . Sean u, v y w en A∗ tales que uv y vw estén en B(X) con |v| ≥ M . Existen x e y en X tales que x[i,i+|uv|−1] = uv , y[j,j+|vw|−1] = vw. Consideremos el punto z = x(−∞,i+|uv|−1] y[j+|v|,∞) = · · · xi−2 xi−1 uvwyj+|vw| yj+|vw|+1 · · · . No puede contener un bloque en F pues, al ser |v| ≥ M , una ventana de ancho M + 1 no puede ver simultáneamente símbolos de u, v y w , por lo que todo bloque que esta ventana vea corresponde a un bloque en x o en y . Entonces z ∈ X y uvw ∈ B(X). M +1 Para la suciencia, denamos F = A − BM +1 (X), y veamos que X = XF . Si x ∈ X e i ∈ Z, x[i,i+M ] ∈ BM +1 (X), es decir, ∀i, x[i,i+M ] ∈ / F . Luego x ∈ XF , y se deduce que X ⊆ XF . Ahora, sea x ∈ XF . Mostremos, por inducción sobre n, que ∀n ≥ M, x[0,n] ∈ B(X). Para n = M es cierto pues x[0,M ] ∈ / F , por lo que x[0,M ] ∈ BM +1 (X), y, de allí, x[0,M ] ∈ B(X); esto muestra también que ∀n ∈ {0, . . . , M − 1}, x[0,n] ∈ B(X). Supongamos que x[0,n] ∈ B(X). Hagamos u = x[0,n−M ] , v = x[n−M +1,n] y w = xn+1 . Observemos que uv = x[0,n] ∈ B(X), vw = x[n−M +1,n+1] ∈ / F y |vw| = M + 1, por lo que vw ∈ BM +1 (X) ⊆ B(X). Además, |v| = M . Entonces uvw ∈ B(X), es decir, x[0,n+1] ∈ B(X). Un razonamiento análogo en la otra dirección muestra que ∀m, n ∈ Z, x[m,n] ∈ B(X), es decir, cualquier bloque en x está en B(X), y, siendo X espacio shift, x ∈ X , por lo que XF ⊆ X .  Demostración. Para la necesidad de la condición, sea

tamaño

Ejemplo 2.10. El teorema anterior da otra forma de ver que el shift par X no es de tipo 2M +1 nito. Pues si lo fuera, sería de memoria M para algún M ≥ 1. Ya que 10 ∈ B(X) y que 2M +1 2M +1 0 1 ∈ B(X), deberíamos tener que 10 1 ∈ B(X), lo que violaría la denición de shift

par.



φ con memoria 0 y anticipación 1 que tiene por dominio el shift de la X , inducido por Φ tal que Φ(00) = 1, Φ(01) = 0 = Φ(10). Ocurre que Φ(u) = 10k 1 2n si, y sólo si, existe n ≥ 0 tal que u = 0(01) 00, por lo que k = 2n. Luego, φ(X) ⊆ Y , donde Y es el shift par. Además, si y ∈ Y , es posible construir x ∈ X tal que y = φ(x) (teniendo 2k k en cuenta que si y[i,i+2k+1] = 10 1, entonces debe ser x[i,i+2k+2] = 0(01) 00). Entonces, φ es Consideremos el CVD

razón de oro

un código factor del shift de la razón de oro en el shift par, siendo el primero de tipo nito y el segundo no. Es fácil construir también códigos de ventana deslizante sobreyectivos desde espacios shift que no son de tipo nito hacia otros que sí lo son (por ejemplo, desde el shift par ∞ hacia {0 } por el CVD de memoria 0 y anticipación 0 inducido por Φ(0) = Φ(1) = 0). Sin embargo, las conjugaciones preservan el carácter de tipo nito. Teorema 2.11. Sea X un shift de tipo nito, e Y un espacio shift conjugado a X . Entonces Y es un shift de tipo nito.

A y U los alfabetos para X e Y respectivamente. Supongamos que M . Sea φ : X → Y una conjugación inducida por Φ, y ψ : Y → X su inversa, inducida por Ψ. Podemos suponer que φ y ψ tienen ambas la misma memoria y anticipación l . Sabemos que ψ ◦φ es código de ventana deslizante con memoria y anticipación 2l , y que una función inductora es Ψ ◦ Φ : B4l+1 (X) → B1 (X). Dicha composición de inductoras, aplicada a un bloque a−2l · · · a0 · · · a2l devuelve el carácter central a0 ; como consecuencia de ésto, si s, t y w son bloques con |s| = |t| = 2l , Φ ◦ Ψ(swt) = w . Mostraremos que Y es ∗ un STF de memoria M + 4l , usando el teorema anterior. Sean u, v, w ∈ U tales que uv ∈ B(Y ), vw ∈ B(Y ), |v| ≥ M + 4l, digamos v = v1 · · · vk con k ≥ M + 4l. Existen s, t ∈ B(Y ) : suv ∈ B(Y ), vwt ∈ B(Y ), |s| = |t| = 2l. Sea u0 = Ψ(suv1 · · · v2l ), w0 = Ψ(vk−2l+1 · · · vk wt). 0 0 Entonces Ψ(suv) = u Ψ(v) ∈ B(X), Ψ(vwt) = Ψ(v)w ∈ B(X). Como |v| ≥ M + 4, será 0 0 |Ψ(v)| = |v| − 2l ≥ M . Luego Ψ(suvwt) = u Ψ(v)w ∈ B(X). Por ello, Φ (Ψ(suvwt)) ∈ B(Y ), es decir, uvw ∈ B(Y ).  Demostración. Sean

X

es un STF de memoria

22

2. SHIFTS DE TIPO FINITO

2.

Grafos y sus shifts

Un método fundamental para construir shifts de tipo nito se basa en un grafo nito dirigido, considerando la colección de todos los caminos bi-innitos (es decir, sucesiones de aristas

consecutivas)

en el grafo. En un sentido que precisaremos más adelante, cualquier shift de tipo

nito fuede ser recodicado en un shift de aristas. En esta sección, introducimos los shifts de aristas, y usamos la matriz de adyacencia del grafo para responder preguntas sobre su shift. Realmente, la razón por la que un shift de aristas puede ser entendido mucho mejor que un shift general es que podemos aplicar la potente maquinaria del álgebra lineal a su matriz de adyacencia. Comenzamos con las deniciones básicas concernientes a la teoría de grafos. Definición 2.12. Un grafo nito dirigido G es una cuaterna (V, Σ, i, t) donde: V es un conjunto nito cuyos elementos llamaremos vértices, nodos o estados. Σ es un conjunto nito cuyos elementos llamaremos aristas o arcos. i es una función de Σ en V . Para una arista a, i(a) se llama vértice inicial de a. También decimos que la arista a arranca en el nodo i(a). t es una función de Σ en V . Para una arista a, t(a) se llama vértice terminal de a. También decimos que la arista a termina en el nodo t(a).

Una manera cómoda de visualizar un grafo es mediante un dibujo donde los nodos se representan por círculos (con el nombre del nodo en su interior) y cada arista

i(a) hasta t(a), con un rótulo que indica su un grafo con V = {I, J} y ocho aristas, teniéndose que, por i(f ) = t(f ) = i(g) = t(g) = J , etc.

una echa desde

a

mediante

nombre. La gura 1 muestra ejemplo,

i(e) = I , t(e) = J ,

Figura 1.

Muchas veces, cuando hagamos referencia a distintos grafos en forma simultánea, emplearemos la notación

V (G), Σ(G), iG G en

inicial y terminal de un grafo

y

tG

para indicar conjuntos de nodos, aristas y funciones

particular.

G = (V, Σ, i, t) un grafo. Para nodos I, J de G, denotaremos por ΣI al conjunto de todas las aristas de G que J arrancan en I , es decir, ΣI = {a ∈ Σ : i(a) = I}. Similarmente, Σ denotará al conjunto J de todas las aristas de G que terminan en J , es decir, Σ = {a ∈ Σ : t(a) = J}. J Reservamos el símbolo ΣI para el conjunto de todas las aristas de G que empiezan en I y terminan en J , es decir ΣJI = {a ∈ Σ : i(a) = I ∧ t(a) = J}. Llamamos grado de salida J de I a |ΣI |, la cantidad de aristas que arrancan en I , y grado de entrada de J a Σ , la cantidad de aristas que llegan a J . La matriz de adyacencia AG del grafo G se dene como la matriz J cuadrada de |V | × |V | indizada por V , cuyo elemento en la posición IJ es AIJ = ΣI . Es decir, AIJ es la cantidad de aristas de I a J en G. Un lazo, bucle o rulo en G es una arista a tal que i(a) = t(a). Un camino π en el grafo G es una sucesión nita de aristas π = e1 e2 · · · ek tal que ∀i ∈ {1, . . . , k − 1}, t(ei ) = i(ei+1 ). Denimos el vértice inicial del camino π como

Definición 2.13. Sea

2. GRAFOS Y SUS SHIFTS

23

i(π) = i(e1 ), el vértice inicial de la primera arista del camino, y el vértice nal de π como t(π) = t(ek ), el vértice nal de la última arista del camino. La longitud del camino π es la cantidad de aristas que contiene, denotada por |π|. Es decir, |π| = k . La sucesión vacía cumple también con la denición de camino, con longitud 0 y vértices

G. Un ciclo en G es un un ciclo π = e1 · · · ek tal

inicial y nal idénticos, pudiendo ser cualquiera de los nodos de camino

π

en

G

que los estados

tal que i(π) = t(π). Un ciclo simple i(e1 ), . . . , i(ek ) son distintos.

G

en

Desde el punto de vista de la dinámica simbólica, interesa la

es

conectividad

de las aristas de

un grafo, no los nombres de las mismas ni de los vértices del grafo. Por ello, grafos diferentes pueden en realidad representar un mismo objeto desde ese punto de vista.

G y H , un homomorsmo de G a H es un par de funciones (∂, Φ) con ∂ : V (G) → V (H) y Φ : Σ(G) → Σ(H) tales que ∀e ∈ Σ(G), iH (Φ(e)) = ∂ (iG (e)) y tH (Φ(e)) = ∂ (tG (e)). En caso de ser ambas funciones inyectivas, el homomorsmo se llama inmersión de G en H . Si ambas funciones son biyectivas, se llama isomorsmo entre G y H . Dos grafos se dicen isomorfos si hay un isomorsmo entre ellos, y en ese caso escribimos G ∼ = H . Un isomorsmo es, a los nes prácticos, simplemente un cambio de nombre Definición 2.14. Dados dos grafos

de nodos y aristas. La relación de ser isomorfos es una relación de equivalencia entre grafos. Definición 2.15. Un

Σ(G),

y las funciones

iH

subgrafo H tH

y

del grafo

G

son, respectivamente, las restricciones

En términos de matrices de adyacencia, si

H

V (H) ⊆ V (G), Σ(H) ⊆ de iG y tG a Σ(H).

es un grafo tal que

es subgrafo de

G se tiene que (AH )I,J ≤ (AG )I,J

I, J ∈ V (H).

para toda pareja de vértices

En cuanto a los isomorsmos, se tiene que dos grafos

y

H

son isomorfos si, y sólo si,

AG = P AH P . Recordemos que una matriz de 0 o 1 que tiene exactamente un 1 en cada la, y exactamente un 1 en cada columna. Es fácil demostrar si P es matriz de permutación, P también lo es, y P −1 = P T . Si (∂, Φ) es un isomorsmo entre G = (V, Σ, iG , tG ) y H = (W, Σ0 , iH , tH ), se dene P con las indizadas según V (G) y columnas indizadas según V (H) mediante  1 si ∂(I) = J PI,J = 0 si ∂(I) 6= J Resulta directo chequear que P es matriz de permutación. Además, teniendo en cuenta que e ∈ ΣJI ⇐⇒ Φ(e) ∈ Σ∂J ∂I , a través de un cálculo rutinario se puede ver que (AG P )I,J = (P AH )I,J −1 para todos I, J , de modo que AG = P AH P . Recíprocamente, si G y H son grafos tales que admiten una matriz de permutación P tal −1 que AG = P AH P , considerando a las las de P en el mismo orden que las de AG y a las columnas de P en el mismo orden que las de AH , se dene ∂I = J ⇐⇒ PI,J = 1. De la −1 condición AG = P AH P , se deduce que (AG )I,J = (AH )∂I,∂J , con lo que los grafos G y H son existe una matriz de permutación

P

G −1

tal que

permutación es una matriz cuadrada con entradas

isomorfos.

2.1.

Shifts de aristas.

Definición 2.16. Sea

denotado por

XG

o

XA ,

G

A continuación deniremos el espacio shift generado por un grafo. un grafo con matriz de adyacencia

A.

El

shift de aristas

es el conjunto de todos los caminos bi-innitos de

G.

de

G,

Es decir:

XG = {x = (xk )k∈Z : ∀k ∈ Z, xk ∈ Σ ∧ t(xk ) = i(xk+1 )} Como puede verse, conjunto

Σ

XG

ΣZ ,

que tiene como alfabeto el

de aristas del grafo.

Ejemplo 2.17. Sean

Entonces, shift

es un subconjunto del full shift

XG1

X{eg,f e,f f,gg}

G1

y

G2

los grafos mostrados en la gura 2.

es el full shift sobre el alfabeto del ejemplo 2.4.

{0, 1, . . . , r−1}, mientras que XG2

es el espacio



24

2. SHIFTS DE TIPO FINITO

G1

G2 Figura 2.

Justiquemos que el uso del término shift para los shifts de aristas es adecuado.

Si G = (V, Σ, i, t) es un grafo, entonces XG es un espacio shift. Más aún, es un shift de tipo nito de memoria 1. Proposición 2.18.

Demostración. Consideremos la colección nita

F = {ef ∈ Σ2 : t(e) 6= i(f )} XG = XF : Sea x ∈ XG , y k ∈ Z. Debe ser t(xk ) = i(xk+1 ) por la denición de xk xk+1 ∈ / F . Entonces, ningún bloque de x está en F , y x ∈ XF . Recíprocamente, sea x ∈ XF , y k ∈ Z. xk xk+1 ∈ / F , por lo que t(xk ) = i(xk+1 ). Como esto ocurre para todo k ∈ Z, se ve que x ∈ XG . Como F tiene todos sus bloques de tamaño 2, XG es un shift de tipo nito de memoria 1. 

y mostremos que

XG .

Luego

Es sencillo demostrar que si

(∂, Φ)

es un isomorsmo entre

G

G y

H son isomorfos, entonces XG y XH son conjugados: si H , Φ puede verse como la función inductora (biyectiva) de y

un código de ventana deslizante de memoria y anticipación 0, que, en vistas de la biyectividad de

Φ,

resultará ser una conjugación entre

También es fácil ver que si

H

XG

y

Observemos el grafo de la gura 3. En él, bi-innito, pues desde

I = t(a)

XH . G, XH ⊆ XG . la arista a no

es subgrafo de

forma parte de ningún camino

no arranca ninguna arista. Podemos pensar en el nodo

en un nodo muerto. Una situación análoga ocurre con el nodo arista, de modo que las aristas

b

y

c

que arrancan en

J

J,

I

como

al cual no llega ninguna

tampoco pueden formar parte de un

camino bi-innito.

Figura 3.

Definición 2.19. Un nodo de un grafo se llama

sale, ninguna arista.

nodo muerto si a él no llega, o de él no

2. GRAFOS Y SUS SHIFTS

Los nodos muertos de un grafo

G

25

pueden eliminarse, conjuntamente con todas las aristas

que a él llegan o salen, sin alterar el shift de aristas asociado. En el subgrafo que resulta de esta eliminación, pueden a su vez haber quedado nodos muertos. Sin embargo, repitiendo el proceso de eliminación sobre el subgrafo la cantidad de veces que sea necesaria hasta que no queden nodos muertos, se obtiene como resultado un subgrafo del grafo original que contiene todas las aristas que forman parte de algún camino bi-innito en

G.

Ejemplo 2.20. La gura 4 muestra el resultado del proceso de eliminación de nodos muertos



del grafo de la gura 3.

Figura 4. Definición 2.21. Un grafo se llama

esencial si no contiene nodos muertos.

u1 · · · uk es un bloque de largo k que está en el lenguaje de XG , entonces G (si u v x ∈ XG , existe j ∈ Z tal que x[j+1,j+k] = u1 · · · uk , de donde, para cualquier n ∈ {1, . . . , k − 1}, es t(un ) = t(xj+n ) = i(xj+n+1 ) = i(un+1 ), por lo que u1 · · · uk es camino en G). Sin embargo, no es cierto que cualquier camino en un grafo G sea un bloque del lenguaje de XG . Por ejemplo, cualquier arista vinculada a un nodo muerto en un grafo no esencial es un camino de longitud 1 en G, pero no puede formar parte de un camino bi-innito en G, por lo que no pertenece a B1 (XG ). Es fácil ver que si

u

es un camino en

Sea G un grafo esencial. Entonces, el conjunto de los caminos (nitos) en G es un precisamente el conjunto de bloques en el lenguaje de XG . Lema 2.22.

Demostración. Por nuestros comentarios anteriores, ya sabemos que los bloques en el

lenguaje de

XG

son caminos en

G.

Probemos ahora que, bajo la hipótesis de que

G

es esencial,

G son bloques en el lenguaje de XG . Sea π un camino en G. Por ser G esencial, a1 que llega a i(π) y una arista b1 saliendo de t(π). Inductivamente, para cada k ≥ 2, hay una arista ak llegando a i(ak−1 ) y una arista bk−1 saliendo de t(bk ). Entonces, · · · a2 a1 πb1 b2 · · · es camino bi-innito en G, y π ocurre en él. Luego, π está en B (XG ).   Proposición 2.23. Si G = V (G), Σ(G), iG , tG es un grafo, existe un único subgrafo H de G tal que H esencial y XG = XH . los caminos de hay una arista

Σ(H) = B1 (XG ), es decir, el conjunto de todas las aristas de G que intervienen en algún camino bi-innito en G. Hagamos V (H) = {i(a) : a ∈ Σ(H)}, el conjunto de nodos visitados por las aristas de H , y sean iH y tH las respectivas restricciones de iG y tG a Σ(H). Entonces H es subgrafo de G, y, en consecuencia, cualquier camino bi-innito en H es también camino bi-innito en G, así que XH ⊆ XG . Veamos que también XG ⊆ XH : si x ∈ XG , se tiene que para todo k ∈ Z, xk y xk+1 están ambos en B1 (XG ), y además tG (xk ) = iG (xk+1 ). Luego, para todo k ∈ Z, es xk ∈ Σ(H) y además tH (xk ) = tG (xk ) = iG (xk+1 ) = iH (xk+1 ), de donde x ∈ XH . Demostración. Sea

26

2. SHIFTS DE TIPO FINITO

H es esencial, pues si I ∈ V (H), debe haber una arista a ∈ Σ(H) tal que I = iG (a). Como a ∈ B1 (XG ), existe x ∈ XG tal que xk = a para algún k ∈ Z. Entonces tH (xk−1 ) = tG (xk−1 ) = iG (xk ) = iH (xk ) = I , mostrando que la arista xk−1 llega a I y la arista xk sale desde I. 0 Para ver que H es único, consideremos cualquier subgrafo esencial H de G tal que XH 0 = XG . Si hubiera una arista en H que no esté en H 0 o una en H 0 que no esté en H , sería B1 (XH ) 6= B1 (XH 0 ) (lema 2.22, considerando que H y H 0 son esenciales), por lo que B (XG ) = B (XH ) 6= B (XH 0 ), es decir, sería XG 6= XH 0 , y tendríamos una contradicción. Luego, H y H 0 tienen las mismas aristas, y siendo ambos esenciales, tienen también los mismos nodos, de donde concluimos que ambos son iguales.  Además,

Ya que el subgrafo

H

de la proposición anterior contiene la única parte de

G

usada para la

dinámica simbólica, usualmente restringiremos nuestra atención a los grafos esenciales. La matriz de adyacencia de un grafo puede usarse para obtener información sobre la cantidad de caminos de longitud

n ≥ 0

en el grafo, y, consecuentemente, si el grafo es esencial, para

obtener la cantidad de bloques de tamaño Proposición 2.24.

1. 2.

n

en

B (XG ),

esto es,

|Bn (XG )|.

Sea G un grafo con matriz de adyacencia A, y sea n ≥ 0. Entonces:

Para vértices I, J cualesquiera en G, el número de caminos de longitud n desde I hasta J en G es (An )IJ , es decir, la posición IJ de la matriz An . El número de ciclos de longitud n en G es tr(An ), la traza de An , y es igual al número de puntos periódicos de XG de período n.

Demostración.

I, J ∈ V (G). Si I = J , (A0 )IJ = 1, y el único camino de I a J de longitud 0 es el camino vacío; si I = 6 J , (A0 )IJ = 0 y no hay camino en G de I a J de longitud 0. Luego, la proposición es verdadera para n = 0. Supongamos que la proposición es cierta para n. Un camino de I a J de longitud n + 1 consiste en un camino de longitud n de I a K seguido de una arista desde K hasta J , donde K es algún nodo. La cantidad de caminos de longitud n + 1 de I a J cuyo penúltimo vértice visitado es K es entonces la cantidad de caminos de longitud n de I a K multiplicada por la cantidad de aristas de K a J , que por hipótesis inductiva y denición de matriz n de adyacencia es (A )IK AKJ . Para obtener todos los caminos desde I a J en G de longitud n + 1 hacemos variar a K en el conjunto de nodos de G y sumamos. Es decir, la cantidad de caminos de longitud n + 1 de I a J es X (An )IK AKJ

1. Probamos por inducción sobre

n.

Sean

K∈V (G) que es precisamente la denición de

(An+1 )IJ ,

con lo que queda demostrada la primera

parte. 2. La primera parte del enunciado se sigue del ítem anterior y de la denición de ciclo. ∞ Para la segunda parte, notar que que si π es un ciclo de longitud n en G, entonces π es un punto periódico en de período

n,

XG de período n, mientras que si x ∈ XG es un punto periódico x[0,n−1] debe ser un ciclo de longitud n en G. Esto establece una entre los ciclos en G de longitud n y los puntos en XG de período

entonces

correspondencia 1 a 1

n.  Recordemos que un espacio shift

u, w ∈ B(X),

existe

v ∈ B(X)

X se dice irreducible si uvw ∈ B(X). Es fácil

tal que

lugar a shifts de aristas irreducibles.

para cualquier pareja de bloques caracterizar a los grafos que dan

3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS

Definición 2.25. Un grafo

en

G,

existe un camino

reducible.

π

en

G

G

se dice

tal que

irreducible si para cualquier pareja I, J

i(π) = I

y

t(π) = J .

Si

G

27

de vértices

no es irreducible, se llama

La gura 5 muestra un ejemplo de grafo reducible, ya que no hay en él un camino desde hasta

I

J.

Figura 5.

Proposición 2.26.

shift irreducible.

Sea G un grafo esencial. G es irreducible si, y sólo si, XG es un espacio

G irreducible. Sean u, w ∈ B (XG ). Entonces u y w G (lema 2.22). Por ser G irreducible, hay un camino v en G desde t(u) hasta i(w), por lo que uvw es camino en G y, nuevamente por lema 2.22, uvw ∈ B (XG ). Supongamos ahora que XG es irreducible. Sean I, J vértices en G, y sean a y b aristas en G tales que t(a) = I , i(b) = J . Tales aristas existen pues G es esencial. Por lema 2.22, a y b están en B (XG ). Por irreducibilidad de XG , existe v ∈ B (XG ) tal que avb ∈ B (XG ). Tal v debe ser entonces camino en G desde t(a) hasta i(b), es decir, camino desde I hasta J . Luego, G es irreducible.  Demostración. Primero supongamos

son caminos en

3.

Representación de shifts de tipo nito por medio de grafos

Hemos presentado, en la sección anterior, los shifts de aristas, que resultaron ser STF de memoria 1. Por lo tanto, un STF que no tenga memoria 1 no puede ser un shift de aristas. Más aún, el siguiente ejemplo muestra que hay STF de memoria 1 que no son shifts de aristas.

G tal que XG sea el shift de la razón de oro. Para XG = X{11} . Por prop. 2.23, podríamos suponer que G es esencial. Entonces debería contener exactamente dos aristas llamadas 0 y 1. La arista 1 debería ∞ iniciar en un nodo y terminar en otro distinto (de lo contrario, 1 estaría en XG , lo que no puede ser) y entonces la arista 0 debería ir desde t(1) hasta i(1) (pues en otro caso G no sería esencial). Pero entonces XG 6= X{11} , contradicción que proviene de suponer la existencia de tal G.  Ejemplo 2.27. No existe un grafo

verlo, supongamos que

G

cumple que

A pesar de que los shifts de aristas aparecen como particulares shifts de tipo nito, mostraremos ahora que todo shift de tipo nito puede recodicarse a un shift de aristas.

Si X es un shift de tipo nito de memoria M , entonces X [M +1] es un shift de aristas. En consecuencia, todo shift de tipo nito es conjugado a un shift de aristas. Teorema 2.28.

M . Podemos suponer M ≥ 1. Sea F tal que X = XF , siendo todos los bloques en F de largo M + 1. Hagamos V = BM (X) y Σ = BM +1 (X). Para a = a1 a2 · · · aM aM +1 ∈ Σ, denamos i(a) = a1 · · · aM y t(a) = a2 · · · aM aM +1 . Puede verse que i(a) y t(a) están en V , ya que son subbloques de a1 · · · aM aM +1 ∈ B(X). Denamos Demostración. Sea

X

un STF de memoria

28

2. SHIFTS DE TIPO FINITO

G = (V, Σ, i, t). Notar que, dados vértices I = a1 · · · aM y J = b1 · · · bM , hay una única arista de I a J si, y sólo si, a2 · · · aM = b1 · · · bM −1 y a1 · · · aM bM ∈ BM +1 (X). Es decir, hay arista de I a J si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el último símbolo de J está en BM +1 (X). [M +1] Veriquemos ahora que XG = X . Sea x ∈ XG . Se tiene que, para todo k ∈ Z, xk ∈ Σ (es decir, xk es un bloque de tamaño M +1 en el lenguaje de X ), y t (xk ) = i (xk+1 ). Pero si xk = a1 · · · aM +1 y xk+1 = b1 · · · bM +1 , es t (xk ) = a2 · · · aM +1 e i (xk+1 ) = b1 · · · bM . Se tiene entonces que xk y xk+1 solapan progresivamente. −1 Denamos entonces x = βM +1 (x). Para cualquier k ∈ Z, x[k,k+M ] = xk ∈ BM +1 (X), por lo que x no tiene bloques en F , es decir, x ∈ X , y entonces x = βM +1 (x) pertenece a X [M +1] . [M +1] . Sea x tal que βM +1 (x) = x. Se tiene que, para cualquier k ∈ Z, Ahora sea x ∈ X es xk = xk · · · xk+M y xk+1 = xk+1 · · · xk+M +1 , por lo que xk ∈ BM +1 (X) = Σ y t(xk ) = xk+1 · · · xk+M = i(xk+1 ) de acuerdo a la denición de G. Entonces, x ∈ XG . [M +1] La última armación del teorema se deduce del hecho de que X ∼ X .  X = X{11} , X es STF de memoria 1. Tenemos que B1 (X) = {0, 1} = V y que B2 (X) = {00, 01, 10} = Σ. Denimos i(00) = i(01) = 0, i(10) = 1, t(00) = t(10) = 0 y t(01) = 1. El grafo (V, Σ, i, t) mostrado en la gura 6 es precisamente X [2] .  Ejemplo 2.29. Si

Figura 6.

Dado un shift de aristas

XG ,

nos preguntamos si las presentaciones con solape de

XG

son

también shifts de aristas, y, en caso de serlo, si podemos construir los correspondientes grafos directamente a partir de

G.

Definición 2.30. Sea

G

un grafo, y sea

N

un entero positivo. Se dene el grafo

G[N ]

del

siguiente modo:

G[1] = G. [N ] para N ≥ 2, los vértices de G son los caminos en G de longitud N − 1, y las aristas [N ] de G son los caminos en G de longitud N . Si a = a1 · · · aN es una arista, denimos iG[N ] (a) = a1 · · · aN −1 y tG[N ] (a) = a2 · · · aN . Obsérvese que G[N ] es un grafo bien denido. Ejemplo 2.31. Sea G = (V, Σ, i, t) con V = {I, J}, Σ = {e, f, g}, i(e = i(f ) = I , i(g) = J , t(e) = t(g) = I , t(f ) = J . G[1] es el propio G. G[2] tiene vértices {e, f, g} y aristas {ee, ef, f g, ge, gf }. G[3] tiene vértices {ee, ef, f g, ge, gf } y aristas {eee, eef, ef g, f ge, f gf, gee, gef, gf g}. Todos ellos se muestran en la gura 7.  Proposición 2.32.

XG[N ] .

Si G es un grafo esencial y N es un entero positivo, entonces (XG )[N ] =

Demostración. Los símbolos para

(XG )[N ]

son los

N -bloques

de

XG ,

que son los caminos

N en G (lema 2.22). Pero éstos son precisamente los símbolos para XG[N ] . Una sucesión bi-innita de estos símbolos está en ambos espacios shift precisamente cuando dos símbolos de largo

consecutivos solapan progresivamente, de donde se concluye el resultado.



3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS

G[1]

G[2]

29

G[3]

Figura 7.

Un camino bi-innito en un grafo

G

determina una sucesión bi-innita de vértices de ese

grafo, a saber, los vértices que el camino bi-innito atraviesa (pero a una sucesión bi-innita de vértices puede corresponderle más de un camino bi-innito, a menos que el grafo no posea

aristas en paralelo entre dos nodos). Formalmente, sea G = (V, Σ, i, t) un grafo, y sea (xk )k∈Z un punto de XG . Entonces, la sucesión bi-innita de vértices que este camino bi-innito determina Z es el punto (i(xk ))k∈Z , que pertenece al full shift V . Para considerar estos recorridos bi-innitos, introducimos la matriz de incidencia de un grafo.

G = (V, Σ, i, t) un grafo con matriz de incidencia de G es la matriz B , de tamaño |V | × |V | con V , tal que, para vértices m, n ∈ V ,  1 si (AG )mn > 0 Bmn = 0 si (AG )mn = 0 Definición 2.33. Sea

de adyacencia

G

desde

La

matriz

las y columnas indizadas por

(m, n) de la matriz de incidencia es 1 o 0, dependiendo m hacia n (en caso de haber, no importa cuántas hay).

Es decir, la entrada arista en

AG .

de si hay o no

Ahora consideraremos el conjunto de todas las sucesiones bi-innitas de vértices que determinan los caminos bi-innitos en Definición 2.34. Sea

G,

y que resultará ser también un espacio shift.

G = (V, Σ, i, t)

vértices de G es el conjunto

un grafo con matriz de incidencia

B.

El

shift de

 ˆ G = (xk )k∈Z ∈ V Z : ∀k ∈ Z, Bx x = 1 X k k+1 Proposición 2.35.

Los shifts de vértices son shifts de tipo nito de memoria 1.

Demostración. Sea G = (V, Σ, i, t) un grafo con matriz de incidencia B . Consideremos ˆ G = XF . F = {mn ∈ V 2 : Bmn = 0}, y veamos que X ˆ G , y consideremos j, k ∈ Z. Si k − j + 1 6= 2, x[j,k] ∈ Sea x ∈ X / F (pues F contiene sólo ˆ G , es Bx x = 1, palabras de largo 2). Y si k−j +1 = 2, es x[j,k] = xj xj+1 , pero, por estar x en X j j+1 por lo que x[i,j] ∈ / F . Entonces ningún bloque de x pertenece a F , es decir, x ∈ XF . Recíprocamente, si x ∈ XF , se tiene que, para todo j ∈ Z, x[j,j+1] ∈ / F , de donde Bxj xj+1 = 1, ˆ G. por lo que x ∈ X ˆ G es un STF de memoria 1.  Ya que todos los bloques de F tienen largo 2, se sigue que X Proposición 2.36.

1. 2. 3.

La familia de todos los shifts de tipo nito de memoria 1 es la familia de todos los shifts de vértices. Cualquier shift de aristas es un shift de vértices (en un grafo diferente). Si X es un shift de tipo nito de memoria M , X [M ] es un shift de vértices. De hecho, ˆ G = X [M ] y XG = X [M +1] . existe un grafo G tal que X

30

2. SHIFTS DE TIPO FINITO

Demostración.

1. La proposición 2.35 muestra que cualquier shift de vértices es un SFT de memoria 1. Ahora, sea

XF

un espacio shift con todos los bloques en

F

de largo 2. Denamos un

G como sigue: su conjunto de vértices es V = B1 (XG ), y para m, n ∈ V , pongamos mn de m a n si, y sólo si, mn ∈ / F . La matriz de incidencia de G tendrá entonces, en la posición (m, n), un 1 si mn ∈ / F , y un 0 si mn ∈ F . Luego, un punto de Z ˆ V está en XG precisamente cuando para todo k ∈ Z, Bxk xk+1 = 1, o, equivalentemente, ˆ G = XF . cuando xk xk+1 ∈ / F , mostrando que X grafo

una única arista

2. El enunciado es consecuencia directa del ítem anterior y del hecho de que todo shift de aristas es un STF de memoria 1. 3. Veamos que el grafo G construido en la prueba del teorema 2.28, aparte de satisfacer [M +1] ˆ G = X [M ] . que XG = X , cumple que X

G construido tiene conjunto de vértices V = BM (X), y entre los vértices I = a1 · · · aM y J = b1 · · · bM hay arista si, y sólo si, a2 · · · aM = b1 · · · bM −1 y a1 · · · aM bM ∈ BM +1 (X). Es decir, llamando B a la matriz de incidencia, se tiene que BIJ = 1 si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el último símbolo de J está en BM +1 (X). Recordemos también que es X = XF para alguna colección F de bloques de tamaño M + 1. ˆ G . Se tiene que, para todo k ∈ Z, xk ∈ V , y Bx x Sea x ∈ X = 1, de donde xk k k+1 −1 y xk+1 solapan progresivamente. Denamos x = βM (x). Se tiene que, para cualquier k ∈ Z, xk · · · xk+M ∈ BM +1 (X) (pues es el bloque que resulta de agregar a xk el último / F , y entonces x ∈ X , así que x ∈ X [M ] . símbolo de xk+1 ), es decir, xk · · · xk+M ∈ [M ] Ahora sea x ∈ X . Sea x tal que βM (x) = x. Se tiene que, para cualquier k ∈ Z, es xk = xk · · · xk+M −1 ∈ BM (X), xk+1 = xk+1 · · · xk+M ∈ BM (X), y xk · · · xk+M ∈ ˆ G. BM +1 (X), por lo que Bxk xk+1 = 1. Luego, x ∈ X Recordemos que el grafo



4.

Desdoblamiento de estados

El desdoblamiento de estados es un procedimiento para construir nuevos grafos a partir de uno dado. Comenzando con una partición del conjunto de aristas, cada estado es desdoblado en una cierta cantidad de estados derivados. Aunque el grafo resultante puede parecer muy distinto del original, ambos tienen shifts de aristas conjugados. Hay una operación inversa del desdoblamiento, llamada amalgama de estados. Resulta ser que cualquier conjugación entre shifts de aristas puede dividirse en una sucesión nita de desdoblamientos y amalgamas de estados. Esto, junto a aplicaciones para la producción de códigos de estados nitos, explica la crucial importancia del desdoblamiento de estados en dinámica simbólica. Comenzamos con una descripción del desdoblamiento de un solo estado, operación que

desdoblamiento elemental. Sea G un grafo con conjunto de estados V y conjunto de aristas Σ. Fijemos un estado I ∈ V , y supongamos, por el momento, que no hay bucles en I . Hagamos una partición del conjunto de aristas salientes de I (es decir, ΣI ) en dos subconjuntos 1 2 disjuntos no vacíos ΣI y ΣI . Construimos un nuevo grafo H , basándonos en esta partición, como 1 2 i sigue: el conjunto de estados es W = (V − {I}) ∪ {I , I }. Para cada arista e ∈ ΣI (donde i i es 1 o 2), pongamos una arista en H desde I hasta t(e) llevando el mismo nombre e (notar I que, como no hay bucles en I , t(e) 6= I , de modo que t(e) ∈ W ). Para cada f en Σ (es decir, 1 1 2 cada arista f llegando a I ), pongamos dos aristas f desde i(f ) hasta I y f desde i(f ) hasta 2 I . Todas las otras aristas de G (es decir, las que no están vinculadas al nodo I ) se copian en H con el mismo nombre e idénticos nodos inicial y terminal. Queda entonces completa la construcción de H . Hablando sin precisión, desdoblamos las aristas salientes y reproducimos las aristas entrantes a I . La gura 8 muestra cómo es la operación. denominaremos

4. DESDOBLAMIENTO DE ESTADOS

31

Figura 8.

G el grafo de la izquierda en la gura 9, y consideremos la partición de Σ2I = {b, c}. A la derecha de esa gura se muestra el grafo resultante I con esa partición. 

Ejemplo 2.37. Sea

ΣI

dada por

Σ1I = {a}

de desdoblar el estado

y

Figura 9.

Supongamos que

H

se forma a partir de

G

desdoblando el estado

I,

como se describió

más arriba. A continuación construimos una conjugación entre sus shifts de aristas XG y XH . i I Denamos la transformación monobloque Ψ : B1 (XH ) → B1 (XG ) mediante Ψ(f ) = f si f ∈ Σ I y Ψ(e) = e si e ∈ / Σ . En otras palabras, Ψ simplemente borra supraíndices. Es posible chequear (lo haremos más adelante) que borrar supraíndices de los caminos en

G,

de modo que

Ψ

H produce caminos en ψ : XH → XG . Ahora

induce un código de ventana deslizante monobloque

Φ : B2 (XG ) → B1 (XH ) mediante:  si f∈ / ΣI  f f 1 si f ∈ ΣI y e ∈ Σ1I Φ(f e) =  2 f si f ∈ ΣI y e ∈ Σ2I

denamos un código 2-bloque

Es decir,

Φ

se anticipa un símbolo y puede añadir un supraíndice, dependiendo de lo que ve.

G en 0 yanticipación 1. Puesto que agregar y eliminar supraíndices no tiene efecto, vemos que ψ φ(x) = x para todo x ∈ XG . Recíprocamente, los supraíndices están unívocamente determinados por la denición  1 2 de Φ, ya que ΣI y ΣI son una partición de ΣI , de modo que φ ψ(y) = y para todo y ∈ XH . Luego, φ es una conjugación de XG en XH .

Es factible chequear (también lo haremos más adelante) que caminos de

H , y, por lo tanto, induce un CVD φ de XG

Ejemplo 2.38. Las acciones de

2.37 se muestran a continuación:

φ

y

ψ

en

XH

Φ

transforma caminos de

con memoria

sobre puntos típicos

x ∈ XG , y ∈ XH

del ejemplo

32

2. SHIFTS DE TIPO FINITO

x = ···

d

a

d

b

d

φ



c

e

.a

d



ψ

c

e

b

···

d

d1 a d2 b d2 c e1 . a d2 c e2 b · · · Notar que no gura el símbolo en y debajo de la última d de x, pues para ello hace falta conocer el símbolo a la derecha de dicha d.  y = ···

El procedimiento general de desdoblamiento de estados es una extensión, en dos sentidos, del proceso elemental recientemente descripto: por un lado, las aristas salientes de un estado pueden particionarse en una cantidad de conjuntos que no necesariamente sea

2,

y, por otro

lado, se puede particionar simultáneamente los conjuntos de aristas salientes de todos los estados (incluyendo los que presentan bucles).

G = (V, Σ, iG , tGP ) un grafo. Para cada estado I ∈ V , sean denidos un entero positivo m(I) tal que m(I) ≤ | I |, y una partición de ΣI en conjuntos disjuntos m(I) 1 2 (no vacíos) ΣI , ΣI , . . . , ΣI (es decir, m(I) ≥ 1 es la cantidad de átomos en la partición de ΣI ). Sea P la partición resultante de Σ. El grafo de estados desdoblados G[P] formado a partir de G usando P es el grafo (W, Σ0 , iH , tH ) denido como sigue:  k Conjunto de estados: W = I : I ∈ V ∧ 1 ≤ k ≤ m(I) .  j  0 Conjunto de aristas: Σ = e : e ∈ Σ ∧ 1 ≤ j ≤ m tG (e) . n j n Función de nodos iniciales: iH (e ) = (iG (e)) donde n es tal que e ∈ Σi (e) . G j j Función de nodos terminales: tH (e ) = (tG (e)) . n j Es decir, si e ∈ Σ va de I a J en G, entonces existe n tal que e ∈ ΣI , y el estado inicial de e [P] n j j n j en G es I y el terminal es J ; es decir, e va de I a J . Un desdoblamiento elemental de G por el estado I ocurre cuando m(I) = 2 y m(J) = 1 para todo J 6= I . Definición 2.39. Sea

se tiene que m(J) = 1, los supraíndices 1 (en el nombre del 1 estado y de las aristas entrantes a J en el grafo desdoblado) se vuelven redundantes, y no hay Cuando para algún estado

J

problemas en omitirlos (pues se obtiene un grafo isomorfo), como hicimos en nuestras primeras discusiones respecto de los desdoblamientos elementales. Asumiremos que los elementos de las particiones de aristas salientes de cada nodo nunca son vacíos. Esto garantiza que el grafo obtenido de desdoblar estados en un grafo esencial (o irreducible) es también esencial (o irreducible). Observación 2.40. De la denición del grafo desdoblado, se desprende que una arista

n

ej

k

n va de I hasta J si, y sólo si, e ∈ ΣI (lo cual implica que iG (e) = I ), tG (e) = J y j = k . Por n k ello, la cantidad de aristas desde I hasta J en el grafo desdoblado es precisamente la cantidad n de aristas en ΣI que terminan en J en el grafo G. Es decir,

0 0J k ΣI n ∩ Σ = ΣnI ∩ ΣJ para todos

k ∈ {1, . . . , m(J)}, n ∈ {1, . . . , m(I)}, I, J ∈ V (G).

el grafo de la izquierda en la gura 10, de modo que ΣI = {e, f } y {g}. Tomemos las siguientes particiones: Σ1I = {e}, Σ2I = {f } y Σ1J = {g}, de modo que = 2 y m(J) = 1. Entonces P = {Σ1I , Σ2I , Σ1J }. El grafo resultante del desdoblamiento se

Ejemplo 2.41. Sea

ΣJ = m(I)

G

muestra a la derecha en esa misma gura. Notar que, en particular, el bucle 1 1 2 1 2 desdobla en un bucle e en el estado I y otra arista e desde I hasta I .

e

en el estado

ΣI ,

a saber,

Σ1I = {e}

y

se



{e, f }Z . EsenΣ2I = {f }. El grafo

Ejemplo 2.42. La gura 11 muestra a la izquierda un grafo del full shift

cialmente, hay una sola partición no trivial de

I

4. DESDOBLAMIENTO DE ESTADOS

33

Figura 10.

resultante del desdoblamiento se muestra en la misma gura a la derecha, y puede advertirse que, salvo cambio de nombres, es esencialmente la presentación del full shift en bloques de tamaño

2



con solape.

Figura 11.

1 Ejemplo 2.43. Para el grafo G a la izquierda en la gura 12, sea P denida por ΣI = {a}, [P] 2 2 1 1 ΣI = {b, c}, ΣJ = {d}, ΣK = {e} y ΣK = {f }. El grafo G se muestra a la derecha de esa misma gura. 

Figura 12.

34

2. SHIFTS DE TIPO FINITO

Como la construcción de [P] que G es el grafo de

G[P]

usa particiones de conjuntos de aristas

desdoblamiento de salidas

una correspondiente noción de

formado a partir de

desdoblamientos de entradas,

salientes, decimos G usando P. Hay

usando particiones de conjuntos

de aristas entrantes. un grafo. Para cada estado I ∈ V , sea denida una I I I partición de Σ en conjuntos disjuntos (no vacíos) Σ1 , Σ2 , . . . , Σm(I) , donde m(I) ≥ 1 es la canI tidad de conjuntos en la partición de Σ . Sea P la partición resultante de Σ. El Definición 2.44. Sea

G = (V, Σ, i, t)

I

grafo de desdoblamiento de entradas G[P] formado a partir de G usandoP tiene como conjunto de esta {Ik : I ∈ V ∧ 1 ≤ k ≤ m(I)} y como conjunto de aristas a ej : e ∈ Σ ∧ 1 ≤ j ≤ m i(e) J Si e ∈ Σ va de I a J en G, entonces existe j tal que e ∈ Σj , y el estado inicial de ei en G[P] Ii y el terminal es Jj . dos a

.

es

G el grafo a la izquierda en la gura 13. Denamos P mediante ΣI1 = = {f }. El correspondiente G[P] se muestra en esa misma gura, a la 

Ejemplo 2.45. Sea

{e}, ΣI2 derecha.

= {g}

J y Σ1

Figura 13.

también como un desdoblamiento de salidas de G (y similarmente para los desdoblamientos de entradas). También es apropiado dar Será conveniente considerar a un grafo isomorfo a

G[P]

un nombre a la operación inversa del desdoblamiento.

H

es un

desdoblamiento de un grafo G, y G es una amalgama

o a

G[P] ,

para alguna partición

Definición 2.46. Un grafo

de

H,

si

H

es isomorfo a

[P]

G

P

del conjunto de aristas de

G.

desdoblamiento de salidas, desdoblaamalgama de entradas. Notar que los isomorsmos

Si hace falta mayor precisión, emplearemos los términos

miento de entradas, amalgama de salidas

o

de grafos, de acuerdo a nuestra denición, pueden ser vistos como cualquiera de estas cuatro operaciones. Al igual que en los desdoblamientos elementales, los desdoblamientos en general producen grafos cuyos shifts de aristas son conjugados a los del grafo inicial.

Si un grafo H es un desdoblamiento de un grafo G, entonces los shifts de son conjugados.

Teorema 2.47.

aristas XG y XH

Demostración. Probaremos sólo para el caso de los desdoblamientos de salida, siendo el

otro caso similar. Ya que los isomorsmos de grafos establecen conjugaciones, y que la composición de con[P] jugaciones es otra conjugación, alcanza con probar el resultado para el caso en que H = G . Mostraremos, en sucesivos pasos, que existen CVD ψ : XH → XG y φ : XG → XH tales que φ = ψ −1 , con lo que quedará demostrado que φ es una conjugación, y, por lo tanto, XG ∼ XH .

4. DESDOBLAMIENTO DE ESTADOS

Denamos la transformación monobloque [0,0] y consideremos ψ = Ψ∞ .

35

Ψ : B1 (XH ) → B1 (XG )

mediante

Ψ (ej ) = e,

y ∈ XH , y tomemos k ∈ Z. Debe ser yk = ej , yk+1 = f m con e, f ∈ Σ y tH (e ) = iH (f m ); por denición de H , esto implica que (tG (e))j = (iG (f ))n con n tal n que f ∈ Σi (f ) , de donde concluimos que tG (e) = iG (f ) (es decir, ef es camino en G) y G j que j = n, es decir, f ∈ Σi (f ) . Por lo tanto, G  tG ((ψy)k ) = tG (Ψ(yk )) = tG Ψ(ej ) = tG (e) = iG (f ) = iG (Ψ(f m )) = iG ((ψy)k+1 ) Sea j

mostrando que

ψ(y) ∈ XG ,

y entonces

ψ (XH ) ⊆ XG ,

ψ : XH → XG

por lo que

es un

CVD monobloque bien denido. Ahora denamos la transformación de bloques siguiente: si

ef ∈ B2 (XG ),

entonces existe un

Φ : B2 (XG ) → B1 (XH ) por j único j tal que f ∈ Σi (f ) , G

medio de lo y denimos

[0,1] Φ∞ .

Φ(ef ) = ej . Consideremos φ = Sea x ∈ XG , y tomemos k ∈ Z. Tenemos que xk , xk+1 , xk+2 ∈ Σ, xk xk+1 , xk+1 xx+2 ∈ B2 (XG ), y existen I, J ∈ V tales que tG (xk ) = iG (xk+1 ) = I , tG (xk+1 ) = iG (xk+2 ) = J . n1 n2 n1 Sean n1 y n2 tales que xk+1 ∈ ΣI y xk+2 ∈ ΣJ . Entonces Φ(xk xk + 1) = xk y n2 Φ(xk+1 xk+2 ) = xk+1 . Luego, tH ((φx)k ) = tH (Φ(xk xk+1 )) = tH (xnk 1 ) = (tG (xk ))n1 = I n1  2 iH ((φx)k+1 ) = iH (Φ(xk+1 xk+2 )) = iH xnk+1 = (iG (xk+1 ))n1 = I n1 mostrando que

φ(x) ∈ XH ,

y entonces

φ (XG ) ⊆ XH ,

φ : XG → XH

por lo que

es un

CVD bien denido.

x ∈ XG y k ∈ Z. Entonces (φx)k = Φ (xk xk+1 ) = xnk para algún n, y entonces (ψ(φx))k = Ψ ((φx)k ) = Ψ (xnk ) = xk . En consecuencia, (ψ ◦ φ)(x) = x para todo x ∈ XG . Recíprocamente, sean y ∈ XH y k ∈ Z. Razonando como antes, debe ser yk yk+1 = ej f m con f ∈ ΣjiG (f ) , por lo que (ψy)[k,k+1] = ef (con ef ∈ B2 (XG ) pues ψ(y) ∈ XG )  j j y entonces Φ(ef ) = e , así que (φ(ψy))k = Φ (ψy)[k,k+1] = Φ(ef ) = e = yk . En consecuencia, (φ ◦ ψ)(y) = y para todo y ∈ XH . Sean

Queda entonces demostrado que

φ : XG → XH

es código de ventana deslizante que posee función

inversa que es también código de ventana deslizante, por lo que

XG

y

XH

son conjugados.



H es un desdoblamiento de salidas de G, hay un XG , que se denomina código de amalgama de salidas, cuyo inverso es un código con memoria 0 y anticipación 1 llamado código de de desdoblamiento de salidas. Análogamente, si H es un desdoblamiento de entradas de G, tenemos un código de La demostración anterior muestra que si

código monobloque desde

XH

a

amalgama de entradas monobloque con inverso denominado código de desdoblamiento de entradas que tiene memoria 0 y anticipación 1. Del teorema previo, se deduce que si un grafo (nita) de desdoblamientos y amalgamas de un grafo

H puede ser obtenido por una sucesión G, entonces XH ∼ XG (la conjugación es

la composición de los sucesivos códigos de desdoblamiento o amalgama). Aunque no lo haremos aquí, es posible probar también el recíproco: cualquier conjugación entre shifts de aristas puede escribirse como una composición de códigos de desdoblamientos y amalgamas. Este importante resultado se conoce como

4.1.

Teorema de la Descomposición.

Los desdoblamientos y las matrices de adyacencia.

Consideremos el ejem-

plo 2.43. Los estados de G y de su desdoblado son, respectivamente, V = {I, J, K} y W = {I 1 , I 2 , J 1 , K 1 , K 2 }. Podemos representar cómo los estados en W se derivan a partir de los estados en

V

por medio de la siguiente matriz

D

con las indizadas por

V

y columnas indizadas

36

2. SHIFTS DE TIPO FINITO

por

W

(en el orden dado):



 1 1 0 0 0 D= 0 0 1 0 0  0 0 0 1 1 1 2 Por ejemplo, DI,I 1 = 1 = DI,I 2 pues I e I resultan de desdoblar DI,J 1 = 0 pues J 1 no procede del desdoblamiento de I .

el estado

I,

mientras que

Por otro lado, podemos especicar las cantidades de aristas en cada partición que terminan en un estado dado, por medio de la siguiente matriz indizadas por

V

E

con las indizadas por

W

y columnas

(en el orden dado):

   E=   donde, por ejemplo,

EI 1 ,J

0 0 1 0 1

1 1 0 1 0

0 1 0 0 0

es la cantidad de aristas en

      Σ1I

que terminan en

J,

en este caso una

sola arista. Un cómputo directo muestra que el producto y que

ED

DE

es igual a la matriz de adyacencia de

G,

da la matriz de adyacencia del grafo desdoblado. Veremos ahora que esta situación

se cumple en general.

G = (V, Σ, i, t) un grafo, P una partición de salida de Σ, y H = G[P] . conjunto de vértices de H . La matriz de división D para P es la

Definición 2.48. Sea

W al V × W denida

Designemos por matriz sobre

por

 DI,J k = La

1 0

si si

I=J I 6= J

matriz de aristas E para P es la matriz sobre W × V EI n ,J

denida por

= ΣnI ∩ ΣJ

De la observación 2.40, surge que EI n ,J corresponde a la cantidad de aristas en el grafo I n hasta J k (cualquiera sea k ∈ {1, . . . , m(J)}).

desdoblado que van desde desde

Las matrices de división y de aristas permiten obtener las matrices de adyacencia de los grafos involucrados en un desdoblamiento, de acuerdo al siguiente resultado. Teorema 2.49.

Sean G, P, H , D y E como en la denición anterior. Entonces,

DE = AG

ED = AH

Demostración. Se tiene que

X

(DE)I,J =

DI,K EK,J =

X m(L) X L∈V i=1

K∈W

m(I)

DI,Li ELi ,J =

X

m(I)

DI,I i EI i ,J =

i=1

X

EI i ,J

i=1

  m(I) m(I) X [ [  i J i J i J ΣI ∩ Σ = = ΣI ∩ Σ =  ΣI  ∩ Σ i=1 i=1 i=1 = ΣI ∩ ΣJ = (AG )I,J m(I)

mostrando que

DE = AG .

Por otro lado,

(ED)I i ,J j =

X

EI i ,K DK,J j = EI i ,J DJ,J j = EI i ,J

K∈V

j = ΣiI ∩ ΣJ = Σ0I i ∩ Σ0J = (AH )I i ,J j por lo que

ED = AH .



Capítulo 3

SHIFTS SÓFICOS Supongamos que las aristas de un grafo son rotuladas con símbolos de algún alfabeto

A,

con la posibilidad de que dos o más aristas puedan llevar el mismo rótulo. Cualquier camino Z biinnito en el grafo produce un punto en el full shift A por lectura de los rótulos de sus aristas, y el conjunto de todos los puntos que así pueden obtenerse se llama un shift sóco. Los shifts sócos son importantes por un número de razones. Veremos en este capítulo que son precisamente aquellos espacios shift que son factores de shifts de tipo nito. Así, la clase de los shifts sócos es la más pequeña colección de espacios shift que contiene a los STF y que también contiene a todos los factores de cada espacio de la colección. Los shifts sócos son los análogos de los lenguajes regulares de la teoría de autómatas, y varios de los algoritmos que veremos en ÿ3.4 son adaptaciones de los de autómatas de estados nitos. Los shifts de tipo nito y los sócos son modelos naturales para almacenamiento y transmisión de la información; estudiaremos su uso en los códigos de estados nitos en el capítulo 5.

1.

Presentaciones de shifts sócos

Los shifts sócos se denen usando grafos a cuyas aristas se asigna rótulos, donde varias aristas pueden llevar el mismo rótulo.

grafo rotulado G es un par (G, L), donde G es un grafo con conjunto rotuladora L : Σ → A asigna a cada arista e de G un rótulo L(e) del alfabeto A. El grafo subyacente de G es G. Un grafo rotulado se dice irreducible si su grafo Definición 3.1. Un

de aristas

Σ,

y la

subyacente es irreducible. A veces nos referiremos a un grafo rotulado simplemente como un grafo, y a estados o aristas del grafo subyacente

G

de un grafo rotulado

G

G . La rotuladora L de G. En un extremo,

como estados o aristas de

A a las aristas A = Σ y L(e) = e para toda e ∈ Σ, dando una rotulación uno a uno de aristas por sus nombres. En el otro extremo, A podría consistir de una única letra a y todas las aristas estarían rotuladas con a, es decir, L(e) = a para toda e ∈ Σ. Usualmente, L será no inyectiva, de modo que varias aristas llevarán el mismo rótulo. Aunque L no necesita ser sobreyectiva, toda letra que no esté en la imagen de L no son usadas. Usaremos normalmente caracteres como e, f o g para los nombres de las aristas, y a, b, c o enteros pequeños para sus rótulos. La

puede ser cualquier asignación de letras de un alfabeto podríamos tener

gura ... muestra dos ejemplos de grafos rotulados típicos. Así como un grafo grafo rotulado

(I, J)

G

G

es convenientemente descripto por su matriz de adyacencia

tiene como análogo una

contiene la suma formal de los rótulos de todas las aristas que van de

carácter



AG ,

un

matriz de adyacencia simbólica AG , cuya entrada

si no hay tal arista. Por ejemplo, si

G

y

H

I

a

J,

o un

son los grafos rotulados de la gura ... a

izquierda y derecha respectivamente, entonces

 AG =

a b b a



 a c b AH =  ∅ b a + b  a c ∅



Hay un análogo del homomorsmo de grafos para grafos rotulados, que añade el requisito de que los rótulos se preserven.

G = (G, LG ) y H = (H, LH ) grafos rotulados. Un homomorsmo de grafos rotulados desde G a H es un homomorsmo de grafos (∂Φ, Φ) : G → H tal que Definición 3.2. Sean

37

38

3. SHIFTS SÓFICOS

LH (Φ(e)) = LG (e) para toda arista e ∈ Σ(G). En este caso, escribimos (∂Φ, Φ) : G → H. Si ambas ∂Φ y Φ son biyecciones, entonces (∂Φ, Φ) se llama isomorsmo de grafos rotulados, denotado mediante (∂Φ, Φ) : G ∼ = H. Dos grafos rotulados son isomorfos como grafos

rotulados (o simplemente isomorfos) si existe un isomorsmo de grafos rotulados entre ellos.

Se puede pensar que dos grafos rotulados isomorfos son el mismo para nuestros propósitos. Si

G = (G, L)

es un grafo rotulado, entonces

caminos biinnitos del grafo subyacente de

G

G.

L

puede ser usada para rotular caminos y

Denimos el

rótulo de un camino π = e1 e2 . . . en

mediante

L(π) = L(e1 )L(e2 ) . . . L(en ) n-bloque sobre A, y al cual a veces nos referiremos como un bloque rotulado. Para el camino vacío ε, denimos L(ε) = ε, la palabra vacía sobre A. Si ξ = . . . e−1 e0 e1 . . . es un camino biinnito en G, de modo que ξ es un punto del shift de aristas XG , denimos el rótulo del camino xi como L∞ (ξ) = . . . L(e−1 )L(e0 )L(e1 ) . . . ∈ AZ que es un

El conjunto de los rótulos de todos los caminos biinnitos en

G

es denotado por



XG = x ∈ AZ : x = L∞ (ξ) para algún ξ ∈ XG = {L∞ (ξ) : ξ ∈ XG } = L∞ (XG )



A-shift. Por ejemplo, si G es el grafo rotulado de la izquierda XG es el full {a, b}-shift; el grafo rotulado H de la derecha produce un subconjunto propio del full {a, b, c}-shift (¾por qué?). Notar también que si G y H son isomorfos, entonces XG = XH .

Así,

XG

es un subconjunto del full

en la gura ..., entonces

Este capítulo trata los espacios shift que surgen de grafos rotulados. Definición 3.3. Un subconjunto

algún grafo rotulado cual

XG = X .

G.

Una

X

de un full shift es un

presentación de un shift sóco X

La transformación shift en

XG

es denotada por

shift sóco

si

X = XG para G para el

es un grafo rotulado

σG .

El término sóco fue acuñado por Weiss, y se deriva de la palabra hebrea para nito. Es importante darse cuenta de que un shift sóco dado tiene muchas presentaciones diferentes. Por ejemplo, la gura ... muestra cuatro presentaciones del full 2-shift, ninguna de las cuales son isomorfas entre sí (aunque los grafos subyacentes de (b) y (c) son grafos isomorfos). Si

X

G = (G, L) y w es un bloque en B(X), decimos que presentación de w si L(π) = w. Un bloque w dado puede tener

es un shift sóco presentado por

un camino

π

en

G

es una

varios caminos diferentes que lo presenten. Por ejemplo, en la gura ...(d), el bloque 010001 tiene tres presentaciones, una empezando en cada uno de los tres vértices. Si que un camino biinnito caminos, un punto de

ξ

XG

en

XG

es una

x ∈ XG ,

decimos

presentación de x si L∞ (ξ) = x. Al igual que con los

puede tener varias presentaciones diferentes.

Nuestra denición de un shift sóco no requiere que sea un espacio shift. Sin embargo, siempre lo es. Teorema 3.4.

Los shifts sócos son espacios shift.

X un shift sóco sobre A, y G = (G, L) L : Σ → A induce un código monobloque L∞ : XG → XG , X = L∞ (XG ) es un espacio shift por teorema 1.61. Demostración. Sea

Entonces

una presentación de

X.

de modo que su imagen



Nótese que los shifts de aristas son shifts sócos, pues podemos simplemente usar el conjunto de aristas

L(e) = e.

Σ

como alfabeto y, como rotuladora, la función identidad

L : Σ → Σ

dada por

El siguiente resultado extiende esta observación para mostrar que los shifts de tipo

nito son sócos. Teorema 3.5.

Todo shift de tipo nito es un shift sóco.

1. PRESENTACIONES DE SHIFTS SÓFICOS

39

M ≥ 0. Sea G el grafo construi[M +1] do según la demostración del teorema 2.28, de modo que X = XG . Recordemos que V (G) = BM (X), Σ(G) = BM +1 (X) y cada arista e1 . . . eM +1 va desde e1 . . . eM hasta e2 . . . eM +1 . Rotulemos la arista e1 . . . eM +1 con el símbolo e1 . Mostraremos que el grafo rotulado G = (G, L) es una presentación de X . [M +1] Sea βM +1 : X → X = XG el código de bloques dado por Demostración. Sea

X

un STF, digamos de memoria

βM +1 (x)[i] = x[i,i+M ] 

L x[i,i+M ] = xi , vemos que L∞ (βM +1 (x)) = x para todo x ∈ X , probando que X ⊆ XG . [M +1] Recíprocamente, cada punto ξ ∈ XG = X tiene la forma ξ = βM +1 (x) para algún x ∈ X , así que L∞ (ξ) = L∞ (βM +1 (x)) = x ∈ X . Luego, XG = L∞ (XG ) ⊆ X , y entonces X = XG .  Como

Capítulo 4

ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT El objetivo de este capítulo es analizar a los espacios shift a través de sus características topológicas. Mediante la denición de una manera adecuada para medir distancias entre tirillas biinnitas, podremos ver a la full shift como un espacio métrico y estudiarla con las herramientas clásicas de la topología y el análisis. De ésto, resultará una caracterización de los espacios shift y de los códigos de ventana deslizante a través de propiedades topológicas. Esto forma parte de investigaciones más o menos recientes (alrededor de 1970) en el área de la Dinámica Simbólica, de modo que se trata de tópicos relativamente nuevos en Matemática, y en franco proceso de expansión. No se pretende dar aquí un estudio detallado de la teoría general de espacios métricos, sino más bien enunciar las deniciones y propiedades básicas de los mismos con el único objetivo de aplicarlos al estudio de los espacios shift. En el presente capítulo, primero deniremos una métrica para la full shift y veremos algunas propiedades básicas importantes de la misma, para luego estudiar la convergencia de sucesiones y arribar a la conclusión de que los espacios shift están caracterizados por ser subconjuntos compactos y shift-invariantes de la full shift. Luego analizaremos la continuidad de acuerdo a la métrica denida, encontrando que los códigos de ventana deslizante se caracterizan por ser las funciones entre espacios shift que son continuas y conmutan con la función shift.

1. Definición 4.1. Una

d : X × X → R+ 0 1. 2. 3.

métrica

Una métrica para AZ o

función distancia

para un conjunto

d (x, y) = 0 ⇔ x = y ∀x, y ∈ X, d (x, y) = d (y, x) (axioma de simetría) ∀x, y, z ∈ X, d (x, z) ≤ d (x, y) + d (y, z) (desigualdad

El par

(X, d)

X

es una función

con las siguientes propiedades:

se denomina

triangular)

espacio métrico.

Para llevar adelante el objetivo planteado en la introducción, debemos dotar a

AZ

de una

métrica adecuada. Para nuestros propósitos, adecuada va a querer decir que dos puntos x e y de AZ estarán tanto más cerca cuanto más grande sea el bloque central en que coinciden. Así, por ejemplo,

· · · 00010.110101110000 · · ·

y

· · · 10010.110101110010 · · ·

deberán estar entre

sí a una distancia menor que la distancia que haya entre los puntos · · · 00010.1101110000 · · · y · · · 00011.11111111 · · · Para ello, deniremos d : AZ × AZ → R+ 0 mediante

 d (x, y) =

0

si

− m´ın{|k|:xk 6=yk }

2

si

x=y x 6= y

En palabras, para encontrar la distancia entre dos puntos distintos coordenada entera −|k| y evaluar 2 .

k

(positiva o negativa) en la que

x

e

y

x e y , hay que detectar la

dieren más cercana a la coordenada

0,

Ejemplo 4.2. Encontremos la distancia entre los puntos

x = · · · 00010.110101110000 · · ·

y = · · · 10010.110101110010 · · · 40

1. UNA MÉTRICA PARA

AZ

41

A n de visualizar mejor, dispongamos ambos puntos uno debajo del otro, y marquemos con

×

las coordenadas en que

xk 6= yk :

−5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 x ... 0 0 0 1 0 1 1 0 1 0 1 1 1 0 0 0 0 ... × × × y ... 1 0 0 0 0 1 1 0 1 0 1 1 1 0 0 1 0 ... × más = 1/4.

La marca −|−2|

2

cercana a la coordenada

0

corresponde a

k = −2,

de modo que

Notemos que, de acuerdo a esta denición, el mayor valor que puede tomar

d

d (x, y) =  es

1,

que

corresponde al caso en que los dos puntos entre los que se está midiendo la distancia dieren en la coordenada

0.

Justiquemos que la función

d

así denida es efectivamente una métrica para

AZ :

x e y en AZ , o bien son iguales o bien son distintos. En el primer + caso, es d (x, y) = 0 ∈ R0 . En el caso en que x 6= y , el conjunto {k : xk 6= yk } ⊆ Z es no vacío, de modo que el conjunto {|k| : xk 6= yk } ⊆ N tampoco es vacío, y entonces tiene −t un mínimo elemento N . Ya que la función exponencial 2 es estrictamente positiva + −N para t ∈ R, d (x, y) = 2 ∈ R0 . Esto muestra también que d (x, y) = 0 ⇔ x = y . Dados dos puntos

El cumplimiento del axioma de simetría es directo de ver. Z Para la desigualdad triangular, sean x, y, z ∈ A dos a dos distintos. Llamemos

Nxy = m´ın {|k| : xk 6= yk }

Nyz = m´ın {|k| : yk 6= zk }

Nxz = m´ın {|k| : xk 6= zk }

N = m´ın {Nxy , Nyz }. N = 0, es y0 6= x0 o y0 6= z0 , de modo que d (x, y) = 1 o d (y, z) = 1, y por lo tanto es d (x, y) + d (y, z) ≥ 1 ≥ d (x, z). • Si N > 0, es x[−N +1,N −1] = z[−N +1,N −1] , pues si tomamos i tal que |i| < N , tenemos que |i| < Nxy y |i| < Nyz , de donde xi = yi e yi = zi , por lo que xi = zi . O sea que Nxz ≥ N . Por lo tanto, observando que 2−Nxz ≤ 2−N y que es N = Nxy o N = Nyz ,

Tomemos



Si

se tiene

d (x, z) = 2−Nxz ≤ 2−N ≤ 2−Nxy + 2−Nyz = d (x, y) + d (y, z) Es decir, en cualquier caso se verica la desigualdad triangular. La función distancia puede restringirse de de la full shift, y el par

(X, d)

AZ × AZ

a

X ×X

para cualquier subconjunto

X

sigue siendo un espacio métrico.

La métrica recientemente denida recibe el nombre de

métrica usual para los espacios

shift, y es a la que haremos referencia por defecto siempre que hablemos de distancia en espacios shift, a menos que especiquemos lo contrario. Una condición necesaria y suciente para que dos puntos distintos estén a distancia menor

ε esrictamente   positivo es que ambos coincidan en una ventana central de tamaño 2k +1, 1 en donde k = log (a menos que especiquemos otra cosa, log siempre signicará logaritmo ε en base 2; además, para r ∈ R, brc es la parte entera o piso de r , es decir, el mayor entero que no supera a r ). Para probar la armación, notemos que 1 d (x, y) < ε ⇔ 2− m´ın{|k|:xk 6=yk } < ε ⇔ m´ın {|k| : xk 6= yk } > log ε   1 ⇔ m´ın {|k| : xk 6= yk } > log ⇔ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε ε Juntando esto con el hecho de que dos puntos de la full shift que están a distancia 0 coinciden en el bloque central de tamaño 2k + 1 cualquiera sea k ∈ N, tenemos el siguiente resultado.

que un

Proposición 4.3.

Sea ε > 0, y x e y dos puntos de AZ . Se tiene que

d (x, y) < ε ⇐⇒ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε

42

4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT

En particular, para cualquier K ∈ N, tenemos que d (x, y) < 2−K ⇔ x[−K,K] = y[−K,K] .

(X, d) un espacio métrico, x ∈ X y r ∈ R+ . El entorno de radio r con centro en x, denotado Br (x), es el conjunto de puntos del espacio cuya distancia a x es menor que r . Definición 4.4. Sea

En virtud de la Proposición 4.3, el entorno de radio

ε

con centro en

x ∈ X ⊆ AZ ,

para la

métrica usual, es

Particularmente,

n o Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε  para K ∈ N, B2−K (x) = y ∈ X : x[−K,K] = y[−K,K] .

E de un espacio métrico (X, d), se dice que un punto x ∈ E es un punto interior a E si existe r > 0 tal que Br (x) ⊆ E . E es abierto en X si todos sus puntos son puntos interiores a E . Definición 4.5. Dado un subconjunto

Como caso particular, los entornos de cualquier espacio métrico son conjuntos abiertos. Puede demostrarse que cualquier conjunto abierto de un espacio métrico es una unión de entornos, y viceversa. Además, la unión arbitraria de conjuntos abiertos es un conjunto abierto, y la intersección nita de conjuntos abiertos es también un conjunto abierto. En el caso particular de la full shift, a partir de la denición de conjunto abierto y de la Z caracterización de los entornos, se deduce que un subconjunto X de A es abierto si, y sólo si, Z para cada x ∈ X , existe K ∈ N tal que cualquier punto y ∈ A que satisface y[−K,K] = x[−K,K] pertenece también a

X.

Tal

K

dependerá, en general, de

x.

E de un espacio métrico (X, d), se dice que un punto x ∈ X es un punto de acumulación de E si todo entorno con centro en x tiene un punto de E − {x}. E es cerrado si contiene a todos sus puntos de acumulación. La clausura de E es la unión de E con el conjunto de sus puntos de acumulación. Definición 4.6. Dado un subconjunto

Se tiene que

E

es cerrado si, y sólo si, su complemento es abierto. Además,

y sólo si, la clausura de

E

coincide con

E.

E

es cerrado si,

Puede verse, usando las leyes de De Morgan, que la

intersección arbitraria de conjuntos cerrados es un conjunto cerrado, así como la unión nita de conjuntos cerrados es también un conjunto cerrado.

2.

Sucesiones

(X, d) es una función de N en X . Denotaremos por xn al n-ésimo término de la sucesión, y por {xn }n∈N a la sucesión completa. Cuando el espacio (n) métrico en cuestión sea un espacio shift, denotaremos x al n-ésimo término de la sucesión, pues seguiremos usando xn para referirnos al símbolo que haya en la n-ésima coordenada de la tirilla biinnita x. Una sucesión en un espacio métrico

{xn }n∈N en el espacio (X, d) se dice convergente en X si l´ımn→∞ d (xn , p) = 0. En este caso, escribimos l´ımn→∞ xn = p, o también

Definición 4.7. Una sucesión

p∈X xn −→ p existe

tal que

n→∞

Obsérvese que

l´ımn→∞ xn = p

si, y sólo si,

∀ε > 0, ∃N ∈ N : ∀n ≥ N, d (xn , p) < ε.

Caracterizaremos ahora la convergencia de sucesiones en espacios shift. Básicamente, una  (n) Z x en un espacio shift converge a x ∈ A cuando para cualquier K natural, n∈N por grande que sea, el bloque central de tamaño 2K + 1 de x coincide con el bloque central de (n) tamaño 2K + 1 de x , para todo n sucientemente grande.

sucesión

Proposición 4.8.

 Sea x(n) n∈N una sucesión en el espacio shift X con la métrica usual, (n)

y x ∈ AZ . Se tiene que l´ımn→∞ x(n) = x si, y sólo si, ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] = x[−K,K] .

2. SUCESIONES

43

Demostración. Dado que la función exponencial a tasa menor que

mente a

0,

1

tiende asintótica-

por la Proposición 4.3 tenemos que:

 l´ım x(n) = x ⇔ ∀ε > 0, ∃N ∈ N : ∀n ≥ N, d x(n) , x < ε ⇔ n→∞  ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, d x(n) , x < 2−K ⇔ (n)

∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] = x[−K,K]  Ejemplo 4.9. Estudiar la convergencia de la sucesión

(n)

xi

 =

1 0

si si



x

(n)

n∈N

en

{0, 1}

Z

denida por

|i| = n |i| = 6 n

Veamos el siguiente cuadro:

(0)

x x(1) x(2) x(3)

−4 −3 −2 −1 0 1 2 3 0 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 1

··· ··· ··· ···

4 0 0 0 0

··· ··· ··· ···

. . . Rápidamente nos damos cuenta que la ventana central de tamaño puros

0,

para todo

2K + 1

de

x(n)

consta de

n ≥ K + 1.

Luego, de acuerdo al criterio de convergencia en espacios shift, ∞ el límite de la sucesión es el punto 0 .  Ejemplo 4.10. Estudiar la convergencia de la sucesión

x(n) =



(0001)∞ (01)∞



x(n)

n∈N

en

{0, 1}Z

denida por

n es par n es impar

si si

Dispongamos los términos encolumnados, como antes:

x(0) x(1) x(2) x(3)

−4 −3 −2 −1 0 1 2 3 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 1

··· ··· ··· ···

4 0 0 0 0

··· ··· ··· ···

. . .

1,

Aquí vemos que la coordenada tural y

a

en el alfabeto

{0, 1},

por ejemplo, no se estabiliza nunca: para cualquier N na(n) n > N tal que x1 6= a. Entonces, esta sucesión no es

existe



convergente.

{xn }n∈N y {zk }k∈N dos sucesiones en el espacio métrico (X, d). Se {zk }k∈N es subsucesión de {xn }n∈N si existe una sucesión de números naturales estrictamente creciente {nk }k∈N tal que para todo k ∈ N, es zk = xnk . Definición 4.11. Sean

dice que

(X, d) un espacio métrico. Un subconjunto K K posee subsucesión convergente en K .

Definición 4.12. Sea

si toda sucesión en

Es bien sabido que un subconjunto que unidos cubren a

K

K

de

X

se dice

compacto

es compacto si, y sólo si, cualquier familia de abiertos

posee una subfamilia

nita

que también cubre a

K.

Además, todo

subconjunto compacto de un espacio métrico es un conjunto cerrado, y si el espacio métrico es compacto, entonces la familia de los subconjuntos compactos del espacio es precisamente la de los subconjuntos cerrados. El siguiente resultado muestra que cualquier espacio shift (en particular la full shift) es compacto para la métrica usual.

44

4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT

Sea X un espacio shift con la métrica usual. Entonces X es un subconjunto compacto de A .  (n) Demostración. Sea x una sucesión en X . Ya que A es un conjunto nito, debe n∈N existir a0 ∈ A y un subconjunto innito B0 de números naturales tal que para todo n ∈ B0 , (n) x0 = a0 . Elijamos cualquier n0 ∈ B0 . Como A3 es nito, deben existir a−1 y a1 en A, (n) y un subconjunto innito B1 ⊆ B0 tal que para todo n ∈ B1 , x[−1,1] = a−1 a0 a1 . Elijamos n1 ∈ B1 tal que n1 > n0 (tal elección es posible, pues B1 es un conjunto innito de números naturales, y por tanto no acotado). Siguiendo de esta manera, para cada k ∈ N, como A2k+1 es nito, deben existir a−k y ak en A, y un subconjunto innito Bk ⊆ Bk−1 tal que (n) para todo n ∈ Bk , x[−k,k] = a−k · · · a0 · · · ak . Elijamos nk ∈ Bk tal que nk > nk−1 . De este modo, hemos denido (inductivamente) a−k , ak y nk para todo k ∈ N. Como {nk }k∈N es  (n )  (n) creciente, x k es subsucesión de x . denamos x = (ak )k∈Z . Dado que todo blok∈N n∈N (nk ) que de x ocurre en algún x ∈ X , tenemos que x pertenece al espacio shift X . Además, l´ımk→∞ x(nk ) = x, pues dado K ∈ N, tomando N = K , tenemos que para todo k ≥ N es (nk ) = a−K a−K+1 · · · a0 · · · aK−1 aK = x[−K,K] . Entonces X es compacto.  x[−K,K] Proposición 4.13.

Z

La sola compacidad no caracteriza completamente a los espacios shift: por ejemplo, el con∞ junto unitario {(01) } es un subconjunto compacto de la full {0, 1}-shift (como cualquier conjunto nito de cualquier espacio métrico) pero no es un espacio shift pues carece de la shift-invariancia. Precisamente, compacidad más shift-invariancia equivalen a tener carácter de espacio shift.

Un subconjunto de AZ es un espacio shift si, y sólo si, es compacto (para la métrica usual de los espacios shift) y shift-invariante. Teorema 4.14.

Demostración. La shift-invariancia de un espacio shift fue demostrada en el primer ca-

pítulo, y la compacidad en la Proposición 4.13.

Z es un subconjunto compacto y shift-invariante de A . c c Por ser compacto, X es cerrado, y entonces X es abierto. De allí que para cada y ∈ X existe  c K (y) ∈ N tal que B2−K(y) (y) está contenido en X . Tomemos F = y[−K(y),K(y)] : y ∈ X c , y Recíprocamente, supongamos que

veriquemos que

X

X = XF .

c

x ∈ X , entonces x[−K(x),K(x)] ∈ F , de donde x ∈ / XF . Luego, XF ⊆ X . Si x ∈ / XF , debe existir u ∈ F tal que u v x. Por denición de F , u debe ser de longitud impar, es decir, |u| = 2n + 1 para algún n ∈ N. Entonces u ocurre en x desde alguna 0 m+n posición m ∈ Z, es decir, x[m,m+2n] = u. Llamando x = σ (x), es x0[−n,n] = u. Como u ∈ F , hay un y ∈ X c tal que y[−K(y),K(y)] = u, debiendo entonces ser K(y) = n. Pero 0 0 c 0 entonces x[−n,n] = y[−n,n] , de donde x ∈ B2−K(y) (y) ⊆ X , o sea, x ∈ / X . Y, por la shift invariancia, x ∈ / X . Luego, X ⊆ XF . Si



3. AZ

Cilindros. Conexidad

puede ser visto como el producto cartesiano innito

cartesiano, se dene un

cilindro

como un subconjunto

C

Xi∈Z A. Como en cualquier producto

del producto para el cual un número

nito de coordenadas están jas. En el caso particular de los espacios shift, nos van a interesar los cilindros en que un número nito de coordenadas consecutivas están jas. Formalmente:

A, u ∈ A∗ y k ∈ Z. El cilindro en X asociado al bloque u en la posición k es el conjunto CkX (u) denido por  CkX (u) = x ∈ X : x[k,k+|u|−1] = u Definición 4.15. Sea

A

un alfabeto,

X

un espacio shift sobre

4. CONTINUIDAD

45

X , el cilindro asociado a u en la posición k es el conjunto de puntos del espacio X tales que el bloque u ocurre en la posición k . Obsérvese que para cualquier  X n / B (X). (u). Además, CkX (u) = ∅ si, y sólo si, u ∈ n ∈ Z, es σX CkX (u) = Ck−n Si x es un punto del espacio shift X y ε es un real positivo, entonces n o   Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] = C−Xblog 1 c x[−blog 1 c,blog 1 c] En palabras, en el espacio shift

ε

En particular, para

k ∈ N,

ε

ε

ε

ε

ε

ε

se tiene que

  X B2−k (x) = y ∈ X : y[−k,k] = x[−k,k] = C−k x[−k,k] Como vemos, los entornos en un espacio shift son cilindros. La recíproca no es cierta en general: no todo cilindro es un entorno. Sin embargo, todo cilindro es un conjunto abierto. En efecto, X sea x ∈ Ck (u). Tomando N = m´ ax {|k| , |k + |u| − 1|}, se tiene que −N ≤ k ≤ k + |u| − 1 ≤ N , de modo que

  X B2−N (x) = C−N x[−N,N ] = y ∈ X : y[−N,N ] = x[−N,N ]  ⊆ y ∈ X : y[k,k+|u|−1] = x[k,k+|u|−1] = CkX (u) Pero además los cilindros son cerrados, pues

c  = x ∈ X : x[k,k+|u|−1] 6= u = CkX (u)

[



x ∈ X : x[k,k+|u|−1] = v



v∈A|u| −{u}

[

=

CkX (v)

v∈A|u| −{u} Es decir, el complemento de un cilindro es una unión de conjuntos abiertos, y por lo tanto es un conjunto abierto; luego, el cilindro es cerrado. Entonces, los cilindros en un espacio shift son conjuntos a la vez abiertos y cerrados. Esto revela otra característica topológica de los espacios shift: son conjuntos

nexos.

totalmente disco-

Recordamos que una forma de caracterizar a los conjuntos disconexos de un espacio

métrico es como aquellos conjuntos que poseen un subconjunto propio no vacío que es a la vez abierto y cerrado. Y un conjunto totalmente disconexo es aquel para el cual todo subconjunto de más de un punto es disconexo. El conjunto clásico de Cantor en la recta real tiene esta misma estructura: se trata de una nube de puntos no aislados en la cual ningún par de puntos distintos pertenece a una misma pieza conexa.

4. Definición 4.16. Sean

se dice

(X, dX )

continua en x ∈ X

e

Continuidad

(Y, dY )

φ:X →Y l´ımn→∞ xn = x, se

dos espacios métricos. Una función

si para toda sucesión

{xn }n∈N

en

X

tal que

l´ımn→∞ φ (xn ) = φ (x). Si A ⊆ X , φ se dice continua en A si φ es continua en cada φ es continua en X , biyectiva y además su función inversa es también continua, φ se denomina un homeomorsmo entre X e Y , y los espacios X e Y se dicen homeomorfos. tiene que

x ∈ A.

Si

Una función entre dos espacios métricos es continua en todo su dominio si, y sólo si, la preimagen de cualquier subconjunto abierto del codominio es un subconjunto abierto del dominio. La composición de funciones continuas es también una función continua. La denición de continuidad que hemos dado corresponde en realidad a la denición de la

continuidad secuencial o sucesional, y equivale a la clásica denición ε − δ de continuidad: φ es continua en x si ∀ε > 0, ∃δ > 0 : dX (y, x) < δ ⇒ dY (φ (y) , φ (x)) < ε. Pero la continuidad desde el punto de vista de las sucesiones es más fácil de manejar cuando el espacio métrico es un espacio shift, ya que tenemos completamente caracterizadas a las sucesiones que convergen en un espacio shift.

Todo código de ventana deslizante entre dos espacios shift es una función continua en todo su dominio. Proposición 4.17.

46

4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT

Y dos espacios shift yφ : X → Y un CVD inducido por Φ con memoria y anticipación L ≥ 0. Sean x ∈ X y x(n) n∈N una sucesión en X tal que  l´ımn→∞ x(n) = x. Debemos ver que ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, φx(n) [−K,K] = (φx)[−K,K] .  (n) Sea K ∈ N. Por la hipótesis de convergencia de x a x, tenemos que existe N ∈ N tal n∈N  (n) (n) que ∀n ≥ N, x[−K−L,K+L] = x[−K−L,K+L] . Veamos que para todo n ≥ N es φx = [−K,K] (φx)[−K,K] : si i es un entero tal que −K ≤ i ≤ K , será −K − L ≤ i − L ≤ i + L ≤ K + L, por n lo que x[i−L,i+L] = x[i−L,i+L] , y entonces     (n) φx(n) i = Φ x[i−L,i+L] = Φ x[i−L,i+L] = (φx)i  Luego, l´ ımn→∞ φ x(n) = φ (x), de donde se deduce que φ es continua en x, y ya que x es arbitrario, φ es continua en X .  Demostración. Sean

X

e

La sola continuidad de una función entre dos espacios shift no garantiza que sea un CVD. Hace falta algo más: la conmutabilidad de la función con las shifts de los respectivos espacios. Este resultado se obtuvo por Hedlund y otros en el año 1969. Antes de demostrarlo, enunciemos algunos resultados conocidos de la teoría general de espacios métricos, y cuyas demostraciones quedan de ejercicio. Proposición 4.18. Sean A y B dos subconjuntos compactos disjuntos no vacíos de un espacio métrico. Existe un número real estrictamente positivo δ tal que para todos a ∈ A y b ∈ B , d (a, b) ≥ δ .

Sea {Ak }nk=1 una familia nita de subconjuntos compactos no vacíos de un espacio métrico, dos a dos disjuntos. Existe δ > 0 tal que si x ∈ Ai e y ∈ Aj con i 6= j , entonces d (x, y) ≥ δ . Corolario 4.19.

Sea φ una función continua entre los espacios métricos X e Y , con X compacto, y sea F un subconjunto compacto de Y . Entonces, φ−1 (F ) es un subconjunto compacto de X . Proposición 4.20.

Teorema 4.21.

(Curtis, Lyndon, Hedlund) Sean X e Y dos espacios shift, y φ una

función de X en Y . φ es un código de ventana deslizante si, y sólo si, φ es una función continua tal que φ ◦ σX = σY ◦ φ. Demostración. Sabemos, de los primeros capítulos, que si

las

σ,

y la Proposición 4.17 muestra que

φ

φ

es un CVD, conmuta con

es continua.

φ es un CVD si, y sólo si, x[−N,N ] . El hecho de conmutar con σ lo tenemos por hipótesis, así que sólo resta probar la existencia de un tal N , para lo cual usaremos la hipótesis de la continuidad de φ. Sea U = B1 (φ (X)), el conjunto de símbolos que aparecen en los transformados de los puntos de X . Obviamente, U es un subconjunto Y del alfabeto de Y . Para cada b ∈ U , el cilindro C0 (b) es un subconjunto cerrado de Y , y Y como Y es compacto, C0 (b) es compacto. Además, si b y c son elementos de U con b 6= c, es  Y Y C0 (b) ∩ C0 (c) = ∅. Para cada b ∈ U , hagamos Eb = φ−1 C0Y (b) . Por su denición y por la Proposición 4.20, cada Eb es un subconjunto compacto no vacío de X , y si b 6= c, Eb ∩ Ec = ∅, Y pues si x ∈ Eb , es φ (x) ∈ C0 (b), luego φ (x) ∈ / C0Y (c), y entonces x ∈ / Ec . Además, cada x ∈ X pertenece a un único Eb . Así que la familia {Eb }b∈U es una familia de conjuntos compactos que constituye una partición para X . Luego, por el Corolario 4.19, existe δ > 0 tal que d (x, y) ≥ δ toda vez que x ∈ Eb e y ∈ Ec con b 6= c. Tomemos N ∈ N sucientemente grande como para −N que 2 < δ . Si x e y son puntos de X tales que x[−N,N ] = y[−N,N ] , entonces d (x, y) < 2−N < δ , por lo que x e y deben estar en un mismo Eb . Esto signica que existe b ∈ U tal que φ (x) y φ (y) están ambos en C0Y (b), o sea, φ (x)0 = b = φ (y)0 . Pero esto quiere decir que la coordenada 0 del transformado por φ de x ∈ X depende sólo de x[−N,N ] , como queríamos probar.  Para la vuelta, recordemos otra caracterización de los CVD:

conmuta con las

σ

y existe un

N ∈ N tal que φ (x)0

es función de

5. SISTEMAS DINÁMICOS

5.

47

Sistemas dinámicos

Los sistemas físicos pueden usualmente describirse a través de una cantidad nita de mediciones. Por ejemplo, un péndulo oscilante constituye un sistema que queda totalmente caracterizado por el ángulo respecto de la vertical y por la velocidad angular. Un gas se describe a través de la posición y momentum de cada molécula. A medida que transcurre el tiempo, esos valores cambian. Si denotamos por

M

al conjunto de todos los valores posibles para un dado sistema,

el estado del mismo en un instante dado corresponde a uno de esos estados. Imaginemos que lmamos el sistema y que luego observamos los cuadros que corresponden al instante luego a

t=1

seg,

t=2

t = 0,

seg, etc. Cada cuadro depende del anterior, de acuerdo a la manera

en que el sistema evolucione durante cada intervalo de un segundo. Si suponemos que las leyes que gobiernan el sistema no cambian con el tiempo, la dependencia de cada cuadro respecto del anterior se traduce en una función estado del sistema en

t = 0, T (x0 )

T :M →M

x0 es el t = 1, T ◦ T (x0 ) en t = 2,

que usualmente es continua. Así, si

describe el estado del sistema en

y así. Por lo tanto, estudiar el comportamiento del sistema en el tiempo se reduce a estudiar las iteraciones de T , es decir, la composición de T consigo misma. Para n ≥ 0, designaremos n 0 por T a la composición de T consigo misma n veces. Es decir, T es la identidad, y, para n > 0, T n = T ◦ T n−1 . Notar que T n es continua si T lo es, pues la continuidad se preserva por composición.

sistema dinámico

Definición 4.22. Un

métrico compacto y

T

(M, T ), en donde M es un espacio M . Si T es un homeomorsmo, el

es un par

es una transformación continua en

sistema dinámico se dice

inversible.

Para nosotros, los sistemas dinámicos más interesantes serán aquellos en los que el conjunto

M

X

sea un espacio shift. En particular, si

dinámico que denominamos

(X, φ)

es un espacio shift, el par

sistema dinámico shift.

φ

Si

(X, σX ) es un sistema X en X , el par

es un CVD de

es también un sistema dinámico.

(M, T ),

Definición 4.23. Para un sistema dinámico

sucesión

n

{T x}n∈N .

la

Si el sistema es inversible, la órbita de

x

órbita

de un punto x ∈ n es la sucesión {T x}n∈Z .

M

es la

punto periódico es un punto x ∈ M tal que T x = x para algún n > 0, y tal n se llama un período de x. Si x es un punto n periódico, el menor de los n > 0 tales que T x = x se llama período mínimo de x. Una n órbita {T x} es periódica si x es un punto periódico. Definición 4.24. Para un sistema dinámico

(M, T ),

un

n

Un conjunto de problemas que interesan en relación a estos tópicos involucra el estudio del comportamiento de la órbita de puntos y de conjuntos en un dado sistema dinámico. Por ejemplo, si se tiene un sistema dinámico

(M, T )

en particular, puede interesar saber cómo se

distribuyen las órbitas de los puntos de un dado subconjunto abierto

U

de

M,

o si el conjunto

de puntos periódicos del espacio es denso. Otro conjunto de problemas tiene que ver con problemas de clasicación de sistemas dinámicos: ¾Cuándo dos sistemas dinámicos aparentemente distintos son el mismo sistema? Definición 4.25. Sean

(M, T )

a

(N, S)

(M, T )

y

(N, S) dos sistemas dinámicos. Un homomorsmo θ de θ : M → N tal que θ ◦ T = S ◦ θ. Los homomorsmos

es una función continua

de un sistema dinámico a sí mismo se denominan Una simple inducción muestra que si

θ

endomorsmos del sistema dinámico.

es un homomorsmo de n n para cualquier entero positivo n, se tiene que θ ◦ T = S ◦ θ .

(M, T )

a

(N, S),

entonces,

Notemos que, debido al Teorema de Curtis, Lyndon y Hedlund, los homomorsmos entre los sistemas dinámicos shift son precisamente los códigos de ventana deslizante.

inmersión es un homomorsmo inyectivo, un factor es un homouna conjugación topológica es un homomorsmo biyectivo. Dos

Definición 4.26. Una

morsmo sobreyectivo, y

48

4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT

sistemas dinámicos se dicen

topológicamente conjugados si existe una conjugación topoló-

gica entre ellos. Las nociones de inmersión, factor y conjugación conducen a problemas de clasicación de sistemas dinámicos. Dos sistemas dinámicos conjugados son esencialmente el mismo, pero la cuestión de si dos dados sistemas dinámicos son conjugados, o uno factor del otro, o uno inmerso en el otro, puede ser muy difícil de resolver. Para detectar si dos sistemas dinámicos

no

son conjugados, una estrategia es la siguiente:

asociemos a cada sistema dinámico con alguna entidad (que puede ser un número, un conjunto, o lo que sea) de manera que dos sistemas conjugados tengan asociados la misma entidad. Luego, dados dos sistemas dinámicos en particular, obtengamos las entidades asociadas respectivas, y si éstas no coinciden sabremos que los sistemas no son conjugados (aunque puede ocurrir que no podamos deducir nada si vemos que ambas entidades coinciden). Dichas entidades reciben el nombre de

invariantes por conjugación.

Una de tales entidades es el conjunto de puntos periódicos de período

n,

donde

n

es un

natural jo. Ya hemos visto, en el capítulo primero, la demostración para el caso en que los sistemas involucrados son sistemas dinámicos shift. Veamos el resultado en general. Proposición 4.27. Sea n un entero positivo. La cantidad de puntos periódicos de período n es un invariante por conjugación.

(M, T ) y (N, S) sistemas dinámicos conjugados, y θ : M → N una conjugación. Denotemos por pn (T ) al cardinal del conjunto de puntos periódicos de período n para T , y pn (S) al de los puntos periódicos para S . Para x ∈ M , se tiene que Demostración. Sean

T n x = x ⇔ θ (T n x) = θ (x) ⇔ S n (θ (x)) = θ (x) θ establece pn (T ) = pn (S). de modo que

una biyección entre los puntos jos de

Tn

y los de

S n.

Por lo tanto,



Un argumento similar al anterior muestra que el número de puntos periódicos de período mínimo

n

es también invariante por conjugación.

Veamos ahora otro invariante por conjugación.

(M, T ) es topológicamente transitivo V , existe n > 0 tal que (T n U ) ∩ V 6= ∅.

Definición 4.28. Un sistema dinámico

cualquier par de abiertos no vacíos

U

y

si para

Es decir, un sistema topológicamente transitivo mueve a cada conjunto abierto lo suciente como para que llegue a tocar a cualquier otro conjunto abierto, en alguna iteración. La denición implica que ese toque se producirá una cantidad innita de veces, según demostraremos a continuación.

Sean (M, T ) un sistema topológicamente transitivo, U y V dos conjuntos abiertos no vacíos y m un natural arbitrario. Existe n > m tal que (T n U ) ∩ V 6= ∅. Lema 4.29.

W = (T m )−1 (V ).

T continua en M , W es k abierto, así que, por hipótesis de transitividad topológica, existe k > 0 tal que T U ∩ W 6= ∅. −1 k m Eso quiere decir que existe z ∈ T U tal que z ∈ (T ) (V ); lo primero signica que existe k m x ∈ U tal que T x = z , y lo segundo dice que T z ∈ V . Poniendo n = m + k , tendremos que  n > m y que T n x = T m T k x = T m z ∈ V . Es decir, existe x ∈ U tal que T n x ∈ V , de donde (T n U ) ∩ V 6= ∅.  Demostración. Sea

Ya que

V

es abierto y

De manera directa, se desprende de allí el siguiente resultado.

Sean (M, T ) un sistema topológicamente transitivo, y U y V dos conjuntos abiertos no vacíos. Existe una sucesión {nk }k∈N de naturales estrictamente creciente tal que para todo k ∈ N, es (T nk U ) ∩ V 6= ∅. Proposición 4.30.

Proposición 4.31.

La transitividad topológica es invariante por conjugación.

5. SISTEMAS DINÁMICOS

49

(M, T ) y (N, S) sistemas dinámicos conjugados, con (M, T ) topológicamente transitivo, y θ : M → N una conjugación. Sean U y V abiertos en N . Denotemos U 0 = θ−1 (U ) y V 0 = θ−1 (V ). Como θ es continua, U 0 y V 0 son abiertos en M , por lo que existe n > 0 tal que (T n U 0 ) ∩ V 0 6= ∅, es decir, (T n (θ−1 (U ))) ∩ θ−1 (V ) 6= ∅. Por lo tanto, siendo θ una Demostración. Sean

biyección, tenemos que

∅= 6 θ Entonces,

(N, S)

    T n θ−1 (U ) ∩ θ−1 (V ) = θ T n θ−1 (U ) ∩ θ θ−1 (V )  = S n θ θ−1 (U ) ∩ V = (S n U ) ∩ V 

es también topológicamente transitivo.

En el primer capítulo, hemos denido irreducibilidad: un espacio shift para cualquier par de palabras tal que

uvw ∈ B (X).

u

w

y

en el lenguaje, hay una palabra

v

X

es irreducible si

también en

B (X)

Veremos ahora que en el contexto de los sistemas dinámicos shift, la

irreducibilidad de un espacio shift

X

equivale a la transitividad topológica del sistema dinámico

(X, σX ). Proposición 4.32. Un sistema dinámico shift es topológicamente transitivo si, y sólo si, el espacio shift es irreducible.

(X, σX ) es topológicamente X X transitivo. Sean u y w en B (X). Hagamos U = C0 (u) y V = C0 (w). Ya que U y V son n abiertos y no vacíos, por Lema 4.29, existe n > |u| tal que (σX U ) ∩ V 6= ∅, es decir, hay un  n X x ∈ X tal que x ∈ σX C0X (u) = C−n (u) y x ∈ C0X (w). Es decir que x[−n,−n+|u|−1] = u y x[0,|w|−1] = w. Como n > |u|, es −n + |u| − 1 < 0, de modo que podemos tomar v = x[−n+|u|,−1] Demostración. Supongamos que el sistema dinámico shift

uvw ∈ B (X). X es un espacio shift irreducible, y sean U y V dos abiertos no vacíos en el espacio métrico X . Sean x ∈ U , y ∈ V , y tomemos k, l ∈ N tal que B2−k (x) ⊆ U X y B2−l (y) ⊆ V . Hagamos u = x[−k,k] y w = y[−l,l] . Sabemos que B2−k (x) = C−k (u) y que X B2−l (y) = C−l (w). Como X es irreducible, existe v ∈ B (X) tal que uvw ∈ B (X). Tomemos X z ∈ X tal que z[−k,−k+|u|+|v|+|w|−1] = uvw. Tenemos que z ∈ C−k (u) ⊆ U , y además, puesto que |u| = 2k + 1 y |w| = 2l + 1,   k−|u|−|v|−l −k−1−|v|−l −k−1−|v|−l X X X z ∈ C−k+|u|+|v| (w) = σX C−l (w) = σX C−l (w) ⊆ σX (V )

para ver que

uvw v x,

es decir,

Recíprocamente, supongamos que

Es decir, z n que (σX U )

k+l+|v|+1

∈ U y σX ∩ V 6= ∅.

(z) ∈ V .

Por lo tanto, tomando

n = k + l + |v| + 1 > 0,

tenemos



De nuestros resultados anteriores, deducimos que, en el universo de los espacios shift, el carácter de irreducible es invariante por conjugación. Teorema 4.33.

o ninguno lo es.

Sean X e Y espacios shift conjugados. Entonces o ambos son irreducibles

(X, σX ) es topológicamente transitivo (prop. 4.32), lo que, por ser e Y conjugados, equivale a que (Y, σY ) es topológicamente transitivo (prop. 4.31), lo que ocurre si, y sólo si, Y es irreducible.  Demostración.

X X

es irreducible si, y sólo si,

En el próximo capítulo deniremos e investigaremos un importante invariante por conjugación entre espacios shift: la entropía.

Capítulo 5

ENTROPÍA X es observar la cantidad de los n en el lenguaje de X a medida que n crece; cuanto más grande es el número de n-bloques en B(X), más complejidad tiene el espacio X . Veremos que, conforme n aumenta, |Bn (X)| crece exponencialmente, es decir, se comporta como λn para algún real no negativo λ. Poniendo c = log λ (recordando nuestra convención de que log signica logaritmo en base 2), tendremos que, para n sucientemente grande, es |Bn (X)| ∼ = 2cn , de modo que c ∼ = n1 log |Bn (X)|. Esa tasa de crecimiento c, en el límite cuando n → ∞, recibe el nombre de entropía del espacio shift X , y es un invariante por conjugación entre espacios shift. El objetivo de este capítulo es Una manera de medir la complejidad de un espacio shift

bloques de largo

estudiar propiedades de esta entidad, y encontrar métodos para saber calcularla para distintas clases de espacios shift.

1. Definición 5.1. Sea

X

Denición y propiedades básicas un espacio shift. La

entropía de X

se dene como

1 log |Bn (X)| n→∞ n

h(X) = l´ım con la convención de que

log 0 = −∞.

X = AZ , para todo n ∈ N es Bn (X) = An , así que log |Bn (X)| = log |An| = log |A| = n log |A|. Dividiendo por n y tomando límite cuando n → ∞, vemos que h AZ = log |A|. Es decir, la entropía de un full shift es el logaritmo de la cantidad de letras de su alfabeto. De la denición, se desprende también directamente que h(∅) = −∞. Por ejemplo, si n

Nuestra primera tarea es ver que la entropía es un número bien denido, para lo cual debemos garantizar que ese límite que la dene efectivamente existe. Primero observemos que, siendo

X

no vacío, es

|Bn (X)| ≥ 1

para todo

n ∈ N,

así que el límite, de existir, es un real no

negativo. Sean

m, n ∈ N y sea u ∈ Bm+n (X). Tal u debe ser la concatenación de un bloque v ∈ Bm (X) w ∈ Bn (X). Por lo tanto, Bm+n (X) ⊆ {vw : v ∈ Bm (X), w ∈ Bn (X)} (la contención

y un bloque

puede ser estricta, ya que la concatenación de dos bloques en el lenguaje de un espacio shift no necesariamente produce otro bloque en ese lenguaje). Entonces, por el principio fundamental del conteo, ocurre que

|Bm+n (X)| ≤ |Bm (X)| · |Bn (X)| En consecuencia,

log |Bm+n (X)| ≤ log |Bm (X)| + log |Bn (X)| Poniendo an = log |Bn (X)| para cada n ∈ N, resulta que la sucesión {an }n∈N es una sucesión subaditiva de reales no negativos, es decir, am+n ≤ am + an para todos m, n ∈ N. Una simple + inducción muestra que si an es cualquier sucesión subaditiva en R0 , entonces, para enteros positivos c y k cualesquiera, ack ≤ cak y, en particular, ar ≤ ra1 para cualquier entero positivo r. + Las sucesiones subaditivas en R0 poseen una interesante propiedad que establecemos en el siguiente resultado.

Sea {an }n∈N una sucesión subaditiva de reales no negativos. Entonces l´ımn→∞ existe y vale ´ınf n≥1 ann . Lema 5.2.

50

an n

1. DEFINICIÓN Y PROPIEDADES BÁSICAS

Demostración. Designemos

n ≥ 1.

Debemos ver que

α = ´ınf n≥1

a an , teniéndose entonces que n n n

51

≥ α

para todo

an ∀ε > 0, ∃N : ∀n ≥ N, α − < ε n

k ≥ 1 tal que akk ≤ α + 2ε . Por otro lado, sea m cualquier entero positivo mayor que 2a1 /ε. Hagamos N = mk . Sea n ≥ N . Por el teorema de la división, existen naturales c y r tales que n = ck + r con 0 ≤ r < k . Ya que (c + 1)k > n ≥ N = mk , tenemos que (c + 1) > m, por lo que c ≥ m ≥ 1. Si fuese r = 0, Consideremos entonces

ε>0

tendremos

jo. Por propiedad de ínmo, existe

an ack cak ak ε = ≤ = ≤ α + < α + ε, n ck ck k 2

r > 0, tendremos an ack+r ack + ar cak + ra1 ak a1 ak a1 ε ε = ≤ ≤ < + ≤ + 0) si todos sus coecientes son positivos; similarmente, diremos que A es no negativa (A ≥ 0) si todos sus coecientes son reales no negativos. Más generalmente, si A y B son matrices de igual tamaño, escribimos A > B cuando cada coeciente de A es estrictamente mayor que el respectivo coeciente de B ; escribimos A ≥ B cuando cada coeciente de A es mayor o igual que el respectivo coeciente de B . Toda esta notación se aplica también a los vectores (por ser Diremos que una matriz

A

(no necesariamente cuadrada) es

casos particulares de matrices rectangulares).

G es esencial si desde cualquier vértice sale al menos una arista, y a G no tiene las nulas ni columnas nulas. Por otro lado, un grafo G es irreducible si desde cualquier vértice hay camino en G hasta cualquier otro vértice. Esto equivale a que para cualquier pareja n de vértices I, J , existe n ≥ 0 tal que (A )IJ > 0. Todo esto motiva las siguientes deniciones: Recordemos que un grafo

cualquier vértice llega al menos una arista. Esto se traduce en que la matriz de adyacencia de

Definición 5.7. Sea

nulas ni columnas nulas.

A ≥ 0 una matriz cuadrada. A se dice esencial si A se dice irreducible si ∀I, J, ∃n ≥ 0 : (An )IJ > 0.

no contiene las

Notar que un grafo es esencial si, y sólo si, su matriz de adyacencia es esencial. Similarmente, un grafo es irreducible si, y sólo si, su matriz de adyacencia es irreducible. 0 Convendremos que A = Id|A|×|A| cualquiera sea la matriz cuadrada A. Como caso particu0 lar, [0] = [1]; entonces, [0] es irreducible pero no esencial. Cualquier matriz distinta de [0] que no sea esencial no puede ser irreducible, ya que si A tiene alguna la nula, la correspondiente n la de A (cualquiera sea n ≥ 1) es también nula (y análogamente si A tiene alguna columna nula). Dicho de otro modo, toda matriz irreducible debe necesariamente ser esencial (salvo el caso excepcional de la matriz

[0]).

La matriz de adyacencia es una valiosa herramienta para computar la entropía de shifts G un grafo esencial de r vértices con matriz de adyacencia A. Sabemos que An

de aristas. Sea

contiene la información necesaria para calcular la cantidad de caminos de largo la cantidad de bloques de tamaño

n

en el lenguaje de

|Bn (XG )| =

r X r X

n en G, es decir,

XG : (An )IJ

I=1 J=1 Por lo tanto, para conocer la entropía de XG , debemos averiguar cómo van variando los coeAn conforme crece n. Veremos a continuación que, para ello, el conocimiento de los

cientes de

autovalores de

A

es fundamental.

2. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS IRREDUCIBLES

53

Sea A ≥ 0 una matriz r × r no nula que posee un autovector v > 0. Entonces, el correspondiente autovalor λ es positivo, y existen constantes positivas c0 y d0 tales que r X r X n c0 λ ≤ (An )IJ ≤ d0 λn Proposición 5.8.

I=1 J=1

En consecuencia, si G es un grafo cuya matriz de adyacencia es A, entonces h (XG ) = log λ. Demostración. Como

Av = λv.

Ya que

A

v

es autovector correspondiente al autovalor

posee al menos un coeciente

de donde se deduce que

λ

AKL > 0,

es

(Av)K > 0,

se cumple que

es decir,

λvK > 0,

v

tiene todos sus coecientes positivos. n n Una simple inducción muestra que, ya que Av = λv, se tiene que A v = λ v para cualquier Pr n n n ≥ 1. Entonces, para cualquier índice I , es (A v)I = (λ v)I , de donde J=1 (An )IJ vJ = λn vI . De allí que r X r r X X n n (A )IJ vJ = λ vI I=1 J=1 I=1 Designemos

es positivo pues

λ,

c = m´ın{v1 , . . . , vr }

d = m´ax{v1 , . . . , vr }.

y

Notemos que tanto

c

como

d

son

estrictamente positivos. Por un lado, tendremos que

r X r X

n

(A )IJ vJ ≥

I=1 J=1

r X r X

n

(A )IJ c = c

r X r X

I=1 J=1

(An )IJ

I=1 J=1

y que

n

λ

r X

n

vI ≤ λ

I=1 Entonces

r X

d = λn rd

I=1

r r X X

rd n λ c

(An )IJ ≤

I=1 J=1 Llamemos

d0 = rd/c,

resultando

d0 > 0

r, d

pues

y

c

son positivos.

Por otro lado, tendremos que

r X r X

n

(A )IJ vJ ≤

I=1 J=1

r X r X

n

(A )IJ d = d

I=1 J=1

r X r X

(An )IJ

I=1 J=1

y que

n

λ

r X

vI ≥ λ

n

I=1 Entonces

r X

c = λn rc

I=1

r r X X

(An )IJ ≥

I=1 J=1 Llamemos

c0 = rc/d,

, resultando

c0 > 0

pues

rc n λ d r, d

y

c

son positivos.

Juntando las dos desigualdades de más arriba, tenemos que, para cualquier

c0 λ n ≤

r X r X

n ∈ N,

es

(An )IJ ≤ d0 λn

I=1 J=1 es un PrG P r

Si

I=1

grafo esencial que tiene matriz de adyacencia

n J=1 (A )IJ .

A,

se cumple que

Por nuestro resultado anterior, esto signica que

c0 λn ≤ |Bn (XG )| ≤ d0 λn

|Bn (XG )| =

54

5. ENTROPÍA

de donde

Tomando límites

1 1 1 1 1 log c0 + n log λ ≤ log |Bn (XG )| ≤ log d0 + n log λ n n n n n cuando n → ∞, resulta h (XG )) = log λ.



Si una matriz no nula A a coecientes enteros admite un autovector positivo, todos los autovectores positivos de ella corresponden a un mismo autovalor. Corolario 5.9.

0 el shift de aristas correspondiente a A. Sean v, v autovectores 0 positivos correspondientes a autovalores λ, λ respectivamente. Aplicando la proposición 5.8, 0 0 concluimos que log λ = h (XG ) = log λ , de donde λ = λ .  Demostración. Sea

G

Dada una matriz A ≥ 0 que admite un autovector positivo v correspondiente al autovalor λ > 0, cualquier autovalor µ de A cumple que |µ| ≤ λ. Corolario 5.10.

r el tamaño de A. Sean µ un autovalor de A y v0 µ. Como A v = µn v0 y A ≥ 0, es, por un lado, r r r r X X X X n n 0 n 0 n 0 |vI0 | |(A v )I | = |(µ v )I | = |µ vI | = |µ|

Demostración. Sea

asociado a

un autovector

n 0

I=1

I=1

I=1

I=1

y, por otro lado,

r r X r X r r X r X X X n 0 n 0 (A ) v ≤ |(A ) v | = (An )IJ |vJ0 | |(An v0 )I | = IJ J IJ J I=1 I=1 J=1 I=1 J=1 I=1 J=1 ! r r r X XX |vI0 | d0 λn (An )IJ ≤ ≤ m´ax |vI0 |

r X

1≤I≤r

donde

d0 > 0

I=1 J=1

I=1

es el garantizado en la proposición 5.8.

|µ|n ≤ d0 λn ,

Juntando todo esto, resulta que, para todo n ≥ 0, es 1/n Como d0 > 0, es l´ ımn→∞ d0 = 1, y entonces |µ| ≤ λ. Dado un grafo esencial

XG

G

con matriz de adyacencia

A,

Teorema de PerronFrobenius,

1/n

|µ| ≤ d0 λ. 

para poder calcular la entropía de

por aplicación de la proposición 5.8, necesitamos saber si

Para ello, contamos con el

es decir,

A

posee un autovector positivo.

que enunciaremos sin demostración

y que es válido para una clase especial de matrices que comprende a las matrices de adyacencia de los grafos irreducibles. Teorema 5.11.

(PerronFrobenius) Sea A ≥ 0 una matriz irreducible no nula. Entonces

A posee un autovector vA positivo con autovalor correspondiente λA positivo que es geométricamente y algebraicamente simple. Cualquier autovalor µ de A tiene módulo menor o igual que λA , y cualquier autovector positivo de A es un múltiplo positivo de vA . El autovalor λA del teorema anterior se denomina autovalor de Perron de A, y vA es autovector de Perron de A. El teorema muestra que vA es único salvo multiplicación por

un un

escalar. Por combinación de la proposición 5.8 con el teorema de PerronFrobenius, obtenemos el siguiente resultado principal. Teorema 5.12.

1. 2.

Si G es un grafo irreducible con matriz de adyacencia A, entonces h(XG ) = log λA . Si X es un shift de tipo nito irreducible de memoria M y G es el grafo esencial con matriz de adyacencia A tal que X [M +1] = XG , entonces h(X) = log λA .

Demostración.

3. LOS PUNTOS PERÍODICOS Y LA ENTROPÍA

1. Como

G

es irreducible,

A

55

es irreducible, por lo que admite un autovector positivo que

λA . Entonces, por proposición 5.8, h(XG ) = log λA . [M +1] X es conjugado a X , siendo la entropía invariante por conjugación, es  [M +1] = h(XG ). Como X es irreducible, también lo es X [M ] (teor. 4.33), h(X) = h X de donde G es irreducible, lo que implica que A también lo es. Entonces, por el inciso anterior, h(X) = log λA .  corresponde a

2. Ya que

Sea X un shift sóco irreducible y G = (G, L) una presentación irreducible resolvente a derecha de X . Entonces h(X) = log λA , siendo A la matriz de adyacencia de G. Corolario 5.13.

Demostración. Por proposición 5.6,

el teorema 5.12,

h(XG ) = log λA

3.

h(X) = h(XG ) = h(XG ), y, siendo G irreducible, por 

Los puntos períodicos y la entropía

Queremos ahora investigar cómo crece la cantidad de puntos periódicos de período hay en un espacio shift

X,

a medida que crece

n.

X

un espacio shift y

la cantidad de puntos periódicos (para

σ)

n

que

Veremos que existe una vinculación entre la

tasa de crecimiento de esa cantidad y la entropía de Definición 5.14. Sea

n

X.

un entero positivo. Designamos por

de período

n

que hay en

pn (X)

a

X.

Z Por ejemplo, si X = {0, 1} y n es cualquier entero positivo, tomando cualquier bloque u ∈ An se tiene que u∞ es un punto periódico de X , y bloques diferentes generan puntos periódicos n diferentes, por lo que pn (X) = 2 . Como vemos, al igual que lo que ocurre con |Bn (X)|, pn (X) puede crecer sin cota, por lo que resulta pertinente considerar la tasa de crecimiento de pn (X), 1 log pn (X), y ver qué ocurre con esta sucesión cuando n → ∞. Debe advertirse, desde n un comienzo, que puede no existir el límite de dicha sucesión, ni siquiera restringiendo X a la

es decir,

familia de los shifts de tipo nito. Ejemplo 5.15. Sea

X

un shift de aristas con conjunto de vértices

total de 6 aristas, de las cuales una es un rulo en

I,

2 van de

J

a

K

y

{I, J, K} teniendo un 3 de K a J . Su matriz

de adyacencia es

 1 0 0 A= 0 0 2  0 3 0 

An y sumamos n/2 en cada paso los coecientes de su diagonal, obtenemos que, para n par, es pn (X) = 1 + 2 · 6 1 y, para n impar, es pn (X) = 1, así que la subsucesión de log pn (X) correspondiente a los n √ términos pares tiende a log 6, y la correspondiente a los impares tiende a 0. Por lo tanto, 1 log p (X) carece de límite.  n n Por la proposición 2.24, sabemos que

pn (X)

es la traza de

An .

Si computamos

1 log pn (X) puede no existir, consideraremos l´ım supn→∞ n1 log pn (X), recorn dando que el límite superior de una sucesión es el mayor de sus puntos de acumulación, y Ya que

l´ımn→∞

siempre existe (y coincide con el límite de la sucesión si éste existe). Proposición 5.16.

Sea X un espacio shift. Entonces, l´ım supn→∞

Demostración. Cada punto

por lo que

x∈X

de período

n

1 n

log pn (X) ≤ h(X).

está determinado por

x[0,n−1] ∈ Bn (X),

pn (X) ≤ |Bn (X)|. En consecuencia, 1 1 1 l´ım sup log pn (X) ≤ l´ım sup log |Bn (X)| = l´ım log |Bn (X)| = h(X) n→∞ n n→∞ n n→∞ n 

56

5. ENTROPÍA

La proposición anterior muestra que la tasa de crecimiento de

X

pn (X)

tiene a la entropía de

como cota superior. Sin embargo, para muchos espacios shift esa tasa iguala a Proposición 5.17.

h(X).

Si X es un shift de aristas irreducible, entonces l´ım supn→∞

G = (V, Σ, i, t) J en G cualesquiera

Demostración. Sea

camino desde

I

hasta

N = m´ax {m´ın {|π| : π I,J∈V

un grafo irreducible tal que sean los vértices camino desde

I

I, J , hasta

h(X). 1 n

log pn (X) =

X = XG .

Como hay

sea

J

en

G}}

I, J arbitrarios en G, hay un camino en G desde I hasta J de N. Sea π un bloque en Bn (X) (y, por lo tanto, un camino en G), y sea τ un camino en G desde t(π) hasta i(π) con |τ | ≤ N . Entonces, πτ es ciclo en G, por lo que (πτ )∞ determina un punto periódico en X , con período n + |τ | ≤ n + N . Así vemos cómo construir, para cada bloque en Bn (X), un punto periódico en X cuyo período está entre n y n + N . Notar que dos bloques diferentes en Bn (X) generan diferentes puntos periódicos. Por lo tanto, Por lo tanto, dados vértices longitud menor o igual que

|Bn (X)| ≤ pn (X) + pn+1 (X) + · · · + pn+N (X) n, elijamos kn en el conjunto {0, 1, . . . , N } i ∈ {0, 1, . . . , N }. Tendremos que Para cada

tal que

pn+kn (X) ≥ pn+i (X)

para cada

|Bn (X)| ≤ (N + 1)pn+kn (X) por lo que

1 1 1 log |Bn (X)| ≤ log(N + 1) + log pn+kn (X) n n n En consecuencia,

1 1 log |Bn (X)| = l´ım sup log |Bn (X)| n→∞ n n→∞ n 1 1 n + kn 1 ≤ l´ım sup log(N + 1) + l´ım sup log pn+kn (X) = l´ım sup log pn+kn (X) n n + kn n→∞ n n→∞ n n→∞ n + kn 1 1 = l´ım sup l´ım sup log pn+kn (X) ≤ l´ım sup log pn (X) n n→∞ n→∞ n + kn n→∞ n

h(X) =

Es decir,

l´ım

h(X) ≤ l´ım supn→∞

1 n

log pn (X).

Entonces, aplicando la proposición 5.16, tenemos la



igualdad deseada.

Si X es un shift de tipo nito irreducible, entonces l´ım supn→∞

Corolario 5.18.

h(X).

G

log pn (X) =

X tiene memoria M . Entonces existe un grafo XG = X [M +1] . Siendo X y X [M +1] conjugados, es  1 1 h(X) = h X [M +1] = h(XG ) = l´ım sup log pn (XG ) = l´ım sup log pn (X) n→∞ n n→∞ n

Demostración. Supongamos que

cible

1 n

irredu-

tal que

pues, siendo la cantidad de puntos periódicos invariante por conjugación, es para todo

n.

Corolario 5.19.

h(X).

Si X es un shift sóco irreducible, entonces l´ım supn→∞

1 n

log pn (X) =

G = (G, L) una presentación resolvente a derecha para X , con G h(X) = h(XG ) (prop. 5.6). Supongamos que G tiene r vértices. Por resolvente a derecha, cada punto en XG tiene a lo sumo r presentaciones

Demostración. Sea

irreducible. Sabemos que ser una presentación

pn (XG ) = pn (X) 

4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS

en

XG .

Como

L

57

es código de ventana deslizante, transforma puntos de período

n

puntos de período

de

XG ,

n

de

XG

en

por lo que

pn (XG ) ≤ r · pn (XG ) Entonces,

1 1 log pn (X) = l´ım sup log pn (XG ) n n→∞ n 1 1 1 1 ≥ l´ım sup log + l´ım sup log pn (XG ) = l´ım sup log pn (XG ) r n→∞ n n→∞ n n→∞ n = h(XG ) = h(X)

l´ım sup n→∞

Es decir,

h(X) ≤ l´ım supn→∞

1 n

log pn (X).

Entonces, aplicando la proposición 5.16, tenemos la



igualdad deseada.

4.

Cálculo de la entropía de shifts sócos

Previamente vimos cómo calcular la entropía de shifts sócos irreducibles: obtener una presentación resolvente a derecha irreducible, y tomar el logaritmo del autovalor de Perron de la matriz de adyacencia del grafo subyacente. Ahora generalizaremos el método de cálculo para el caso de shifts sócos en general (no necesariamente irreducibles). Como siempre, arrancaremos considerando los shifts de aristas, en este caso correspondientes a grafos arbitrarios (no necesariamente irreducibles). Veremos cómo, en este caso, el correspondiente grafo

G

la entropía de

contiene ciertos subgrafos irreducibles cuya identicación nos permitirá obtener

XG .

La idea es reorganizar las las y columnas de la matriz de adyacencia

A

de

G

de modo de

triangular por bloques, según veremos enseguida, y usar ciertas submatrices cercanas a la diagonal para calcular la entropía de XG .

llevarla a una forma cuadradas

Definición 5.20. Dado un grafo G = (V, Σ, i, t) con matriz de adyacencia A, y estados I, J ∈ V , decimos que I se comunica con J (denotado I J ) si existe camino en G desde I n hasta J ; equivalentemente, si existe n ≥ 0 tal que (A )IJ > 0. Decimos que I se intercomunica con J (denotado I ! J ) si I J y J I .

Es fácil chequear que la intercomunicación establece una relación de equivalencia entre los

clases de intercomunicación. Una clase de éstas consiste en un conjunto maximal de estados tal que desde cualquiera de

vértices del grafo (ejercicio). Sus clases de equivalencia se llaman ellos se puede ir a cualquier otro de la clase por un camino en

G. G es irreducible precisamente

tiene una sola clase de intercomunicación. Una arista de

G

que sale de un estado perteneciente a una clase de intercomunicación

y termina en un estado de una clase de intercomunicación

transición de C1 a C2 . C1 ∪ C2

diferente se llama

Debe notarse que si hay una arista de transición de

puede haber al mismo tiempo arista de transición de estados en

C2

C2

a

C1 ,

C1

arista de

C1

a

C2 ,

no

pues, en ese caso, todos los

estarían intercomunicados, contradiciendo la maximalidad de las clases de

intercomunicación.

G se puede construir otro grafo H cuyos G, y hay una arista (única) desde un vértice Ci en G una arista de transición de Ci a Cj .

Con las clases de intercomunicación de un grafo vértices son las clases de intercomunicación de en

H

si, y sólo si, hay

Ejemplo 5.21. Sea

G

grafo mostrado a continuación, con su correspondiente matriz de

hacia otro vértice

adyacencia

A:

Cj

58

5. ENTROPÍA

1 2 3 4 5 6 7 8 Notar que

5 ! 4

1 0 1 0 0 0 0 0 0

2 1 0 0 0 0 0 1 0

3 0 1 0 0 0 0 0 0

4 0 1 1 0 2 0 0 0

5 0 0 0 1 1 0 0 0

6 0 0 0 0 0 2 0 0

7 1 0 0 0 0 0 0 0

8 0 0 0 1 0 1 1 0

y ningún otro vértice se intercomunica con 5 (ni con 4: por ejemplo,

a pesar de haber camino de 1 a 4, es imposible en el grafo ir de 4 a 1). Luego, una clase de intercomunicación es C1 = {5, 4}. Análogamente se ve que hay otras cuatro clases: C2 = {8}, C3 = {1, 2, 7}, C4 = {6} y C5 = {3}, según puede observarse en la gura que sigue, que es básicamente el mismo grafo G excepto que con los vértices de cada clase agrupados según una línea discontinua.

La arista de G que va de 4 a 8 es de transición de C1 a C2 . Hay también aristas de transición C3 a C1 , de C3 a C5 , de C3 a C2 , de C3 a C4 , de C5 a C1 y de C4 a C2 . Por lo tanto, el grafo H de las clases de intercomunicación tiene cinco vértices (C1 , C2 , C3 , C4 , C5 ) y siete aristas (C1 − C2 , C3 − C1 , C3 − C5 , C3 − C2 , C3 − C4 , C5 − C1 , C4 − C2 ), según se muestra a continuación. de

 Notar que el grafo

H

que se construye de esta manera no puede tener rulos (pues por

denición las aristas de transición vinculan vértices de clases distintas) ni, más generalmente, ciclos, pues, en ese caso, habría nodos de una clase intercomunicados con nodos de otra clase distinta, lo que no puede ser por la maximalidad de las clases. Esto implica que no todo estado de

H

H ). Entonces, anterior, C2 es

puede tener aristas salientes (si fuera ése el caso, se podría generar un ciclo en

debe haber al menos un estado en

H

sin aristas salientes (en nuestro ejemplo

sumideros. Análogamente debe haber al menos un estado en H sin aristas entrantes (C3 es el único del ejemplo anterior) y tales nodos se llaman fuentes. el único). Tales nodos se llaman

4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS

Si quitamos los sumideros de

H

59

(y las aristas conectadas a ellos) de a uno por vez, recursi-

vamente, hasta que no quede ninguno, obtendremos una manera de renombrar los vértices de

H de acuerdo al orden en que se fueron quitando los vértices; así, el primer nodo quitado será C10 , el segundo C20 , y así sucesivamente. De este modo, las clases de intercomunicación quedarán 0 0 ordenadas de manera tal que sólo puede haber camino en H desde Ci hasta Cj cuando i > j . En nuestro ejemplo, el procedimiento anteriormente descripto tiene varias alternativas; una C10 = C2 = {8}, C20 = C1 = {5, 4}, C30 = C4 = {6}, C40 = C5 = {3} y C50 = C3 = {1, 2, 7}. de ellas es

Este orden nos permite reescribir la matriz de adyacencia A de G usando el orden en que 0 0 aparecen los vértices de G en C1 , C2 , etc. Al hacer este reordenamiento, la matriz asume una forma triangular inferior por bloques que puede esquematizarse de la siguiente manera:

C10 C20 C30 . . . Ck0 En ese esquema,

0

C10 C20 C30 A1 0 0 ∗ A2 0 ∗ ∗ A3

··· ··· ··· ···

C 0k 0 0 0 . . .

. . .

. . .

. . .

..







···

.

Ak

representa submatrices rectangulares nulas, y

tangulares posiblemente no nulas. Cada una de las matrices



Ai

representa submatrices reccorresponde a la matriz de

adyacencia del subgrafo irreducible Gi de G que se obtiene de considerar los vértices pertene0 cientes a la clase Ci con las aristas de G que inician y terminan en dichos vértices. Cada Gi se llama una G, y las Ai se llaman las

componente irreducible de

de A. También nos referiremos a los XGi

componentes irreducibles como las componentes irreducibles de XG .

Para el ejemplo 5.21, un posible reordenamiento siguiendo este proceso es el siguiente:

8 5 4 6 3 1 2 7

8 0 0 1 1 0 0 0 1

5 0 1 1 0 0 0 0 0

4 0 2 0 0 1 0 1 0

6 0 0 0 2 0 0 0 0

3 0 0 0 0 0 0 1 0

1 0 0 0 0 0 0 1 0

2 0 0 0 0 0 1 0 1

7 0 0 0 0 0 1 0 0

Ya que el polonomio característico de una matriz no cambia por una permutación simultánea de las y columnas, podemos calcular el polinomio característico

χA (t)

de la matriz

A

original

más fácilmente usando la forma triangular por bloques. Al realizar la expansión (de Laplace) para obtener el determinante, cualquier producto que involucre un término debajo de la diagonal involucrará también un término Por ello, sólo los bloques de

A,

Ai



de la porción por

0 de la porción por encima de la diagonal.

sobre la diagonal importan al calcular el polinomio característico

resultando éste ser el producto de los determinantes de las componentes irreducibles de

A: χA (t) = χA1 (t)χA2 (t) · · · χAk (t) En consecuencia, los autovalores de A son exactamente los autovalores de las Ai . En particular, el mayor de los λAi (en valor absoluto) será también un autovalor de A. Esto sugiere la siguiente denición. Definición 5.22. Sea

El

A

una matriz no negativa con componentes irreducibles

autovalor de Perron de A es λA = m´ax{λAi : 1 ≤ i ≤ k}. Ya que el conjunto de autovalores de

autovalor de

A

A

es la unión de los autovalores de las

tiene módulo acotado por alguno de los

λAi .

A1 , . . . , A k .

Ai ,

cualquier

Luego, el autovalor de Perron de

60

5. ENTROPÍA

A es el más λA controla

grande (en valor absoluto) de los autovalores de A. Veremos, a continuación, que n la tasa de crecimiento de A (y, en consecuencia, la entropía de XG corresponde

al máximo de las entropías de sus componentes irreducibles

XGi ),

lo que es una extensión del

teorema 5.12 a grafos en general. Teorema 5.23.

Sea G un grafo con matriz de adyacencia A. Entonces, h (XG ) = log λA .

A son A1 , . . . , Ak . Será λA = λAq para algún q ∈ {1, . . . , k}. Como XG ⊇ XGq , es h (XG ) ≥ h XGq = log λAq = log λA . Resta probar la desigualdad en el otro sentido. Si λA = 0, es porque cada λAi es 0, lo que implica que cada Ai es la matriz [0]. En ese caso, G no tiene caminos biinnitos, lo que implica que XG = ∅, quedando en ese caso el resultado establecido. Supongamos entonces que λA > 0. Probaremos la desigualdad deseada acotando el número de caminos de longitud n en G. Cualquiera de tales caminos se puede descomponer en subcaDemostración. Supongamos que las componentes irreducibles de

minos dentro de clases de intercomunicación separados por aristas de transición entre clases. Es decir, cualquier

π ∈ Bn (XG )

es de la forma

π = τ (1) e(1) τ (2) e(2) · · · τ (j−1) e(j−1) τ (j) i ∈ {1, . . . , j}, τ (i) es camino (digamos de largo ni ) en alguno de los subgrafos (i) irreducibles de G (digamos Gqi ), y, para cada i ∈ {1, . . . , j − 1}, e es una arista en G desde algún estado en Gqi hasta algún estado de Gqi+1 . Observar que q1 > q2 > · · · > qj , y entonces j ≤ k . Sea M la cantidad total de aristas de transición entre clases que hay en G. Cada e(i) tiene a lo sumo M posibilidades, y a lo sumo n lugares en los que pueden ocurrir. O sea que k la cantidad total de maneras de acomodar aristas de transición es a lo sumo (M n) . Por cada  (i) una de tales maneras, el número de opciones para cada τ es Bni XGq . i m Nótese que, siendo Gi irreducible para cada i entre 1 y k , es |Bm (XGi )| ≤ di λA para i + algún di ∈ R (prop. 5.8). Denamos entonces d = m´ ax{di : 1 ≤ i ≤ k}. Tendremos que |Bm (XGi )| ≤ dλm A . Por lo tanto, siendo n1 + · · · + nk ≤ n, la cantidad de formas de elegir los (i) τ es, a lo sumo,   Bn1 XGq × · · · × Bn XGq ≤ dj λn1 +···+nj ≤ dk λnA donde, para cada

1

j

i

A

Luego,

Aplicando logaritmos,

|Bn (XG )| ≤ (M n)k dk λnA = (M d)k nk λnA dividiendo por n y tomando límite cuando n → ∞,

log λA .

resulta

h (XG ) ≤ 

Con el resultado previo, ya estamos en condiciones de calcular la entropía de cualquier espacio shift sóco (posiblemente irreducible). Corolario 5.24. Sea X un shift sóco, y G = (G, L) una presentación resolvente a derecha para X . Entonces, h(X) = log λA , siendo A la matriz de adyacencia de G. Demostración. Por la proposición 5.6, sabemos que

X = XG ,

se concluye el resultado.

h (XG ) = h (XG ) = log λA .

Como



Capítulo 6

CÓDIGOS DE ESTADOS FINITOS A en X , y hacerlo de tal manera que exista algún modo de recuperar

Por diversos motivos, puede interesar codicar sucesiones arbitrarias sobre un alfabeto sucesiones de algún shift sóco

la sucesión original conociendo su imagen. Lo primero que interesa es saber si es posible tal ∞ operación. Por ejemplo, si A = {0, 1} y X = {0 } es evidente que no. En caso de ser posible, de los métodos disponibles investigaremos en este capítulo uno que se denomina

nitos,

código de estados

en el que los símbolos de la sucesión imagen se obtienen de a uno por vez, a medida

que se van leyendo uno por uno los símbolos de la sucesión original, los que son interpretados como una suerte de

instrucciones.

El método usa grafos rotulados con dos clases especiales de

rotulaciones, una resolvente a derecha que además cumple otras condiciones, y una un poco más débil que resolvente a derecha.

1.

Coloreo de rutas y presentaciones cerrantes a derecha

Recordemos que una rotulación

a derecha

L:Σ→A

para un grafo

G = (V, Σ, i, t)

se dice

resolvente L|ΣI es

si desde un mismo nodo no salen dos aristas con un mismo rótulo; es decir,

inyectiva para cada

I ∈ V.

Si imponemos la condición más fuerte de que cada

L|ΣI

sea una

biyección, tendremos un tipo especial de rotulaciones resolventes a derecha.

G un grafo con conjunto de aristas Σ. Un coloreo de rutas de G es L : Σ → A que, para cada I ∈ V , establece una biyección entre las aristas que las letras del alfabeto. G se dice coloreable si admite un coloreo de rutas.

Definición 6.1. Sea

una rotulación salen de

I

y

La gura 1 muestra un ejemplo de grafo coloreable con

A = {0, 1}, y un ejemplo de coloreo.

Figura 1. Ejemplo de coloreo de rutas

Vemos entonces que, en un coloreo de rutas, por cada vértice

I

de

G

y cada letra

a ∈ A,

I cuyo rótulo es a. Esto obliga a que desde cada vértice |A| aristas. Entonces, G es coloreable si, y sólo si, tiene grado de salida

sale exactamente una arista desde deban salir exactamente

constante

desde sus vértices, lo que, en términos de la matriz de adyacencia, signica que las

las suman todas lo mismo. Un grafo con r estados y n aristas saliendo desde cada vértice r admite (n!) posibles coloreos de rutas (pues para cada uno de los r vértices hay que elegir una forma de asignar a

n

aristas las

n

letras del alfabeto, que es como ordenar las letras del

alfabeto). Otra consecuencia de la denición es que si vértices, cada palabra sobre

A

L

tiene exactamente 61

es un coloreo de rutas para

r

G

que tiene

r

presentaciones, una empezando en cada

62

6. CÓDIGOS DE ESTADOS FINITOS

w w = a1 a2 . . . am ,

cuyo rótulo es Si

toma la símbolo

I ∈ V

w ∈ A∗ ,

hay un único camino comenzando en I Z (y, en consecuencia, un coloreo de rutas resulta una presentación para A ).

vértice. Es decir, para cada

y cada

I se toma la única arista e1 ∈ Σ saliente con rótulo a1 , desde t(e1 ) se única arista e2 ∈ Σ saliente con rótulo a2 , y así sucesivamente. En este sentido, cada de A se interpreta como una instrucción de cuál arista tomar si se está en un dado desde

vértice. Ahora veamos otro tipo de rotulaciones especiales para grafos, que satisfacen una condición más débil que la de ser resolventes a derecha.

cerrante a derecha con demora D si cualquier

Definición 6.2. Un grafo rotulado se dice

pareja de caminos de longitud

D+1

arrancando desde un mismo vértice y llevando el mismo

rótulo usan la misma primera arista. Un grafo rotulado se dice cerrante a derecha con alguna demora

cerrante a derecha

si es

D ≥ 0.

Informalmente hablando, un grafo rotulado puede no ser resolvente a derecha (lo cual creará ambigüedad sobre cuál arista rotulada tomar para salir desde algunos estados) pero es cerrante a derecha si esa ambigüedad queda salvada mirando anticipadamente una cierta cantidad

D

de símbolos adicionales que vendrán después. Para los grafos resolventes a derecha, no hay que mirar anticipadamente nada, correspondiendo al caso en que la demora es

D = 0.

Ejemplo 6.3. Consideremos los grados rotulados (a)(d) mostrados en la gura 2.

El grafo (a) tiene demora aristas rotuladas el bucle en

I

a

J

I

a

D = 1.

Para verlo, consideremos el estado

comenzando en

I,

I.

Ya que hay dos

el grafo no es resolvente a derecha. Sin embargo,

a, mientras que la arista de b o c. Luego, el rótulo de un camino

sólo puede ser seguido por una arista rotulada

sólo puede ser seguida por una arista rotulada

de longitud 2 empezando en

I

determina su arista inicial. Un análisis similar permite

concluir lo mismo para el estado

J,

y el estado

K

es más fácil, dado que las aristas que

salen de él llevan rótulos distintos. De manera análoga al inciso anterior, se puede vericar que el grafo rotulado (b) también es cerrante a derecha con demora 1. En el grafo rotulado (c), hay dos caminos con diferentes aristas iniciales rotulados

ab,

por lo que este grafo no tiene demora 1. Sin embargo, el siguiente símbolo determina cuál de los dos caminos debe tomarse, por lo que el grafo es cerrante a derecha con demora

D = 2.

En el grafo rotulado (d), para cualquier m, hay dos caminos comenzando en J que m presentan al bloque ab ; ya que estos caminos tienen distinta arista inicial, el grafo no



es cerrante a derecha.

Una manera equivalente, y a veces cómoda, de visualizar la propiedad de una rotuladora de ser cerrante a derecha con demora

D

es pensar que dos caminos de largo

D+1

arrancando en

un mismo vértice pero usando distinta primera arista no pueden llevar el mismo rótulo. Obviamente, así como el concepto de rotulación resolvente a derecha tiene su dual, que es el

resolvente a izquierda (todas las aristas que llegan a un mismo nodo tienen rótulos diferentes), se puede denir la noción dual de cerrante a derecha que es la de rotulación cerrante a izquierda: todos los caminos de largo D + 1 que terminan en un mismo nodo y llevan el mismo rótulo de

usan la misma última arista. Pero en el presente capítulo usaremos sólo la noción de cerrante a derecha. La propiedad de ser cerrante a derecha con demora caminos de largo

D + 1:

D

tiene una consecuencia sobre los

todos los caminos de esa longitud que arrancan en un mismo vértice

y llevan igual rótulo, tienen la misma primera arista. La gura 3 ilustra ese hecho. Esto puede generalizarse a caminos más largos diciendo que todos los caminos de largo mayor que

D

arrancando de un mismo nodo y teniendo el mismo rótulo usan las mismas aristas, excepto quizás las últimas

D

de largo mayor que

aristas. Es decir, dos caminos

D)

e0 e1 . . . ek

y

f0 f1 . . . fk

con

k≥D

(o sea,

que arrancan en el mismo vértice y llevan el mismo rótulo cumplen

1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA

(a)

63

(b)

(c)

(d) Figura 2. Ejemplos de rotulaciones con o sin cierre a derecha

Figura 3. Cierre por la arista inicial de caminos con igual rótulo

ej = fj para cada j ∈ {0, . . . , k − D}: aplicando la denición a los dos bloques iniciales e0 . . . eD y f0 . . . fD , obtenemos que e0 = f0 , con lo cual e1 . . . ek y f1 . . . fk arrancan en un mismo vértice, y, en caso de tener largo al menos D + 1, aplicamos el mismo razonamiento para ver que e1 = f1 , y así sucesivamente. Visto así, la propiedad de cierre a derecha actúa a que

la manera de un cierre de prenda de vestir, juntando todas las aristas de los caminos de largo mayor que

D

D

que arrancan desde un mismo vértice y llevan un mismo rótulo, salvo las últimas

aristas. Véase la gura 4.

Figura 4. Cierre de todas excepto las últimas

D

aristas de caminos con igual rótulo

64

6. CÓDIGOS DE ESTADOS FINITOS

Usando esta idea para caminos cada vez más largos, vemos que la ambigüedad se traslada cada vez más hacia la derecha; en un caso límite de caminos innitamente largos hacia la derecha, esa ambigüedad queda entonces

expulsada al innito (o sea, no subsiste la ambigüedad).

Es decir, veremos que, en un grafo rotulado cerrante a derecha, cualquier pareja de caminos innitos a derecha que empiezan en el mismo estado y llevan el mismo rótulo corresponden en realidad a un único camino en el grafo. Para formalizar esto, dado un espacio shift X cualquiera X + como el conjunto de todas las sucesiones innitas a derecha

denimos su

shift unilateral

que aparecen en

X.

Es decir,

X + = {x0 x1 x2 . . . : (xk )k∈Z ∈ X} En el caso del shift de aristas correspondiente al grafo

G = (V, Σ, i, t), X+ G

corresponde al

conjunto de caminos innitos a derecha que pueden ser recorridos en el grafo:

X+ G = {e0 e1 e2 . . . : ∀k ∈ N, ek ∈ Σ ∧ t(ek ) = i(ek+1 )} Si

I

es un estado de

G,

designamos por

X+ G,I

como el conjunto de caminos innitos a derecha

que pueden ser recorridos en el grafo empezando en

I:

+ X+ G,I = e0 e1 e2 . . . ∈ XG : i(e0 ) = I





G = (G, L) es un grafo rotulado, X+ G es la familia de los rótulos de todos los caminos innitos + derecha en G. Si para cada e0 e1 e2 . . . ∈ XG designamos

Si a

tendremos que

X+ G

L+ (e0 e1 e2 . . .) = L(e0 )L(e1 )L(e2 ) . . . ,  + + + = L+ (X+ L (x) : x ∈ X+ : X+ G) = G , resultando que L G → XG

es una

función sobreyectiva. Proposición 6.4. Un grafo rotulado (G, L) es cerrante a derecha si, y sólo si, para cada vértice I del grafo, L+ |X+ es inyectiva. G,I

Demostración. Supongamos primero que

es cerrante a derecha, digamos con de-

I un vértice cualquiera del grafo, y sean x = e0 e1 e2 . . . e y = f0 f1 f2 . . . caminos + + X+ G,I tales que L (x) = L (y). Entonces i(e0 ) = I = i(f0 ) y L(e0 )L(e1 ) . . . L(eD ) = L(e0 )L(e1 ) . . . L(eD ). Por ser el grafo rotulado cerrante a derecha con demora D, debe ser e0 = f0 y, en consecuencia, e1 y f1 comienzan en el mismo vértice t(e0 ). Como L(e1 )L(e2 ) . . . L(eD+1 ) = L(f1 )L(f2 ) . . . L(fD+1 ) y el grafo es cerrante a derecha, es e1 = f1 . Aplicando sucesivamente el mismo razonamiento, se cumple que para todo k ∈ N es ek = fk , es decir, x = y , y de este + + modo L es inyectiva si se la restringe a XG,I . Ahora probemos la vuelta por contrarreciprocidad. Supongamos entonces que (G, L) no es cerrante a derecha. Esto signica que para cada D ≥ 0, existe una pareja de caminos de largo D + 1, digamos π y τ , que comienzan en un mismo vértice, tienen distinta primera arista y 2 llevan ambos el mismo rótulo. Elijamos tales caminos para el caso en que D = |V | . Será

mora

D.

(G, L)

Sea

innitos en

π = e0 e1 . . . eD

τ = f0 f1 . . . fD

i(e0 ) = i(f0 ), e0 6= f0 y L(e0 )L(e1 ) . . . L(eD ) = L(f0 )L(f1 ) . . . L(fD ). Como D + 1 > |V |2 , debe haber índices i < j tales que la pareja ei , fi coincide con ej , fj , por lo que ei . . . ej y fi . . . fj son ambos ciclos en G comenzando en un mismo nodo; llamémosles β y γ respectivamente, 0 0 siendo |β| = |γ|. Hagamos α = e0 . . . ei−1 y α = f0 . . . fi−1 , siendo |α| = |α |. Notar que 0 L(α) = L(α ) por ser ambos subcaminos iniciales de π y τ con igual longitud; y, similarmente, L(β) = L(γ). Entonces αβ ∞ y α0 γ ∞ son dos caminos innitos a derecha arrancando en i(e0 ), + ambos distintos (pues e0 6= f0 ) y con rotulaciones iguales. Luego, L |X+ no es inyectiva.  con

G,i(e0 )

Una situación en la que podemos garantizar que un grafo rotulado es cerrante a derecha es aquella en la que la función rotuladora, como código de ventana deslizante que es, resulta ser una conjugación.

1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA

65

Sea G = (G, L) un grafo rotulado con L∞ : XG → XG conjugación cuya tiene anticipación n. Entonces el grafo rotulado es cerrante a derecha con demora

Proposición 6.5.

inversa n.

L−1 ∞

Demostración. Podemos suponer que

caminos comenzando en el mismo vértice

I

G

es esencial. Sean

e0 e1 . . . en

y

f0 f1 . . . fn

dos

y llevando el mismo rótulo. Debemos probar que

e0 = f0 . m a la memoria de L−1 ∞ y Φ a la respectiva función de bloques, elijamos un camino π en G de largo m que termine en I (tal elección es posible por ser G esencial). Entonces L(πe0 e1 . . . en ) = L(π)L(e0 e1 . . . en ) = L(π)L(f0 f1 . . . fn ) = L(πf0 f1 . . . fn ). Luego, Φ (L(πe0 e1 . . . en )) = Φ (L(πf0 f1 . . . fn )), siendo el primer miembro de esta igualdad precisa−1  mente e0 , y el segundo f0 (por ser Φ la función inductora de L∞ ). Es decir, e0 = f0 . Llamando

Recordemos que el desdoblamiento de salidas de un grafo rotulado corresponde a un desei con el mismo rótulo

doblamiento de salidas del grafo subyacente, rotulando todas las aristas que en el grafo original tiene la arista

e.

Recordemos también que esto produce una nueva

presentación del mismo shift sóco. Demostraremos ahora que si se desdobla un grafo rotulado resolvente a derecha con demora con demora

D, el grafo desdoblado es también resolvente a derecha, aunque

D + 1.

Proposición 6.6. Sea G cerrante a derecha con demora D . Cualquier grafo rotulado obtenido por desdoblamiento de salidas de G es cerrante a derecha con demora D + 1.

G = (G, L), y sea (H, L0 ) un grafo obtenido por desdoblamiento de i i i salidas de G . Recordar que H tiene estados I y aristas e , y que el código de amalgama e → e 0 0 i da una conjugación de XH a XG . Además, la rotuladora L en H está dada por L (e ) = L(e). 0 Veremos que (H, L ) es cerrante a derecha con demora D + 1. iD+1 jD+1 j0 j1 i0 i1 Sean e0 e1 . . . eD+1 y f0 f1 . . . fD+1 dos caminos de largo D +2 en H comenzando ambos en I i y teniendo el mismo rótulo (según L0 ). Aplicando el código amalgama, vemos que e0 e1 . . . eD+1 y f0 f1 . . . fD+1 son caminos de largo D + 2 en G comenzando en I y con el mismo rótulo (para L). Así que e0 e1 = f0 f1 . Ya que i0 está determinado por el elemento de la partición al que pertenece e1 , y similarmente j0 está determinado por el elemento de la partición al que j0 i0 0 pertenece f1 , concluimos que e0 = f0 , quedando establecido que L es cerrante a derecha con demora D + 1.  Demostración. Sea

Ejemplo 6.7. Consideremos el grafo rotulado (b) de la gura 2, que es cerrante a derecha 1 2 1 con demora 1. Hagamos un desdoblamiento elemental de salidas usando ΣI , ΣI y ΣJ , donde Σ1I consiste en el rulo en I rotulado a y la única arista de I a J rotulada b, Σ2I es el resto de 1 las aristas que salen de I , y ΣJ = ΣJ . El grafo rotulado desdoblado resultante se muestra en la 1 gura 5. En él, hay dos caminos comenzando en I rotulados aa que usan distinta arista inicial,

por lo que el grafo no tiene demora 1. Sin embargo, la proposición muestra que tiene demora 2, como efectivamente puede vericarse.

Figura 5. El desdoblamiento de grafos rotulados incrementa una unidad la demora



66

6. CÓDIGOS DE ESTADOS FINITOS

Recordemos que, en un grafo rotulado, la entropía del shift de aristas del grafo subyacente y la del sóco coinciden si la rotulación es resolvente a derecha. Lo mismo es cierto para las rotulaciones cerrantes a derecha. Proposición 6.8.

h (XG ).

Sea G = (G, L) un grafo rotulado cerrante a derecha. Entonces, h (XG ) =

h (XG ) ≤ h (XG ). Para probar la desigualdad en el otro sentido, supongamos que G es cerrante a derecha con demora D . Entonces, cada estado I de G y cada bloque de largo n + D en el lenguaje de XG determinan a lo sumo un camino de largo n en G, y todos los caminos en Bn (XG ) surgen de esta forma. Luego, |Bn (XG )| ≤ |V | × |Bn+D (XG )|. Aplicando logaritmos, dividiendo por n y tomando límite cuando n → ∞, resulta h (XG ) ≤ h (XG ).  Demostración. Ya que

XG

es factor de

2.

XG ,

tenemos que

Códigos de estados nitos

Introduciremos ahora una clase de dispositivos para transformar sucesiones arbitrarias (es decir, sin restricciones) sobre un alfabeto en sucesiones sujetas a determinadas restricciones (posiblemente sobre otro alfabeto). Analizaremos también desde el punto de vista teórico la factibilidad del método en lo que resta del capítulo.

código de estados nitos (CEF) grafo codicador, I es un coloreo de

Definición 6.9. Un

es una terna

(G, I, O),

donde

G

rotulación de entradas y O es una rotulación cerrante a derecha de G llamada rotulación de salidas.

es un grafo llamado

Si todos los vértices de

O∞ (XG ),

G

rutas de

G

llamado

n y si X es un espacio shift que (X, n)-código de estados nitos.

tienen grado de salida

decimos que la terna

(G, I, O)

es un

contiene a

Representaremos grácamente a los CEF mediante el dibujo del correspondiente grafo y una leyenda de la forma

a/b

en cada arista

e,

en donde

a

representa

I(e)

y

b

representa

O(e).

Ejemplo 6.10. El grafo rotulado (b) de la gura 2 tiene grado de salida constante 4, de

modo que proporciona una rotulación de salida para un CEF. La gura 6 muestra una posible elección de rotulación de entradas con alfabeto

{0, 1, 2, 3}.



Figura 6. Un ejemplo de CEF

(G, I, O)

(X, n)-CEF e I0 es un estado jo de G, podemos transformar cualquier + a0 a1 a2 . . . ∈ AZ en otra sucesión de salidas r0 r1 r2 . . . de X + del siguiente modo: identicamos la única arista e0 saliendo de I0 tal que I(e0 ) = a0 y denimos r0 = O(e0 ). Ahora desde el vértice terminal de e0 sale una única arista e1 tal que I(e1 ) = a1 y denimos r1 = O(e1 ). Continuando de esta manera, denimos rk para cualquier k ∈ N. Si

es un

sucesión arbitraria de entradas

Obviamente, queremos ser capaces de recuperar la sucesión original a partir de la sucesión así obtenida. Es precisamente para ello que hemos requerido que proposición 6.4 nos garantiza que

O

O

sea cerrante a derecha: la

es inyectiva cuando se restringe a los caminos innitos en G que arrancan en I0 , lo que signica que hay un único camino innito e0 e1 e2 . . . en X+ G,I0 tal que O(e0 e1 e2 . . .) = r0 r1 r2 . . .; por lo tanto, cada ak se recupera viendo I(ek ).

3. AUTOVECTORES APROXIMADOS

(G, O)

r0 r1 . . . rD determina e0 , así que a0 = I(e0 ). Luego, r1 r2 . . . rD+1 es un camino rotulado (por O) en G que comienza en t(e0 ), y por lo tanto determina e1 , de donde a1 = I(e1 ). Continuando de este modo, obtenemos todos los ak . Concretamente, si

tiene demora

D,

67

el bloque

En la práctica sólo podemos manejar sucesiones nitas de símbolos. En tal caso, a partir de una sucesión nita arbitraria

a0 a1 . . . ak

podemos generar, por el método arriba descripto,

a0 a1 . . . ak−D (pues O es D). Si bien esto parece alarmante, una solución posible es agregar D símbolos arbitrarios a la derecha de a0 a1 . . . ak y codicar mediante el CEF esta sucesión más grande; obtendremos así una r0 r1 . . . rk . . . rk+D que nos permitirá recuperar a0 a1 . . . ak r0 r1 . . . rk .

Pero el conocimiento de ésta sólo nos permite recuperar

cerrante a derecha con demora

completamente y sin ambigüedades. Ahora bien, dado un alfabeto de

n

símbolos para las sucesiones arbitrarias de entrada y un

X , resta ver bajo qué condiciones existe un (X, n)-CEF. El teorema principal de los X tenga suciente capacidad de almacenamiento de información, o complejidad, la que es medida por la entropía. shift sóco

códigos de estados nitos establece cuál es exactamente esa condición: que

Teorema 6.11.

(Teorema de los Códigos de Estados Finitos) Sean X un shift sóco

y n un entero positivo. Entonces, hay un (X, n)-código de estados nitos si, y sólo si, h(X) ≥ log n. La dirección fácil de la demostración es la directa: si

(G, I, O)

es un

(X, n)-CEF,

por

la proposición 6.8, que establece que las rotulaciones cerrantes a derecha preservan entropía, tenemos que shift de

n

h (I∞ (XG )) = h(XG ) = h (O∞ (XG )). Como (G, I) O∞ (XG ) ⊆ X , tenemos que

es una presentación del full

símbolos, y además

log n = h (I∞ (XG )) = h (O∞ (XG )) ≤ h(X) La demostración de la implicación recíproca es mucho más delicada, y requiere de nuevas ideas que desarrollaremos en las secciones posteriores del capítulo.

3. Supongamos que

n

Autovectores aproximados

es un entero positivo y que

una presentación resolvente a derecha

X

es un shift sóco. Sabemos que

X

admite

Si tenemos la suerte de que, en esa presentación,

(X, n)-CEF simplemente n aristas salientes desde cada estado (borrando las otras) y restringiendo L a esas aristas elegidas (llamemos O a esa restricción). Obtenemos así un subgrafo G coloreable, al que dotamos de cualquier coloreo de rutas I . Tenemos que (G, I, O) constituye un (X, n)CEF, pues I y O son ambas resolventes a derecha (y entonces O es cerrante a derecha con demora D = 0) y O∞ (XG ) = L∞ (XG ) ⊆ L∞ (XH ) = X . El problema sería que H no tuviese al menos n aristas saliendo desde cada estado. Veremos, sin embargo, que si X satisface la condición h(X) ≥ log n, una cadena de desdoblamientos de estados convenientemente elegidos, aplicados sucesivamente a partir de (H, L), producirá una presentación de X en la que hay al menos n aristas saliendo desde cada vértice. A ella le aplisalen al menos

n

(H, L).

aristas desde cada vértice, podemos diseñar un

eligiendo exactamente

caremos nuestras consideraciones previas, y de esta manera quedará completa la demostración del Teorema de los Códigos de Estados Finitos, que se hará en la sección posterior. Nos dedicaremos ahora a presentar la herramienta precisa que nos servirá de guía para elegir

(H, L), para autovector aproximado,

convenientemente la sucesión de desdoblamientos de estados a realizar, a partir de llegar a la presentación buscada. Esa herramienta recibe el nombre de

y, para motivar su nombre y su denición, notemos que si un grafo con matriz de adyacencia

A

tiene al menos

n

aristas saliendo desde cada vértice, cada la de

condición equivale a la desigualdad matricial dimensión igual al tamaño de columna

v 6= 0

A

A1 ≥ n1,

1

A

suma al menos

1

n.

Esa

es el vector columna de

y que tiene todos sus coecientes valiendo

que, reemplazado en cuenta de

recibirá un nombre especial.

en donde

1.

Cualquier vector

en esa desigualdad, la siga satisfaciendo,

68

6. CÓDIGOS DE ESTADOS FINITOS

Definición 6.12. Sea

A

una matriz a coecientes enteros no negativos, y

n

un entero

(A, n)-autovector aproximado ((A, n)-AA) es un vector v 6= 0 con coecientes Av ≥ nv.   1 3 Ejemplo 6.13. Sean A = y n = 5. De la denición de autovector aproximado, 6 1 resulta que cualquier (A, 5)-AA u = (u1 , u2 ) debe satisfacer  u1 + 3u2 ≥ 5u1 6u1 + u2 ≥ 5u2

positivo. Un

enteros no negativos que satisface

o, equivalentemente,



−4u1 + 3u2 ≥ 0 6u1 − 4u2 ≥ 0

Este sistema determina un cono en el primer cuadrante; los puntos de ese cono que tienen ambas coordenadas enteras son precisamente los

(A, 5)-autovectores

aproximados. Entre ellos,

tenemos



2 3

             3 4 5 6 6 7 , , , , , , ,... 4 6 7 8 9 10 

A de tamaño r y un n > 0, el conjunto de los (A, n)-AA es el conjunto de vectores (u1 , . . . , ur ) a coordenadas enteras no negativas que se encuentran en el cono poliédrico de dimensión r (o Pr menor) determinado por el sistema de inecuaciones { J=1 AIJ uJ ≥ nuI : 1 ≤ I ≤ r}. El ejemplo anterior es generalizable de manera directa al hecho de que dada una matriz

Observación 6.14. Podemos caracterizar de diversas maneras a los autovectores aproxi-

mados.

v un (A, n)-autovector aproximado. Siendo A ≥ 0, es A2 v = A(Av) ≥ A(nv) = n(Av) ≥ n(nv) = n2 v. Una sencilla inducción muestra que, más generalmente, para k k todo k ≥ 0 se cumple que A v ≥ n v toda vez que v es un (A, n)-AA. + Por lo tanto, dados n ∈ Z , A y v 6= 0 a coecientes enteros no negativos,

Sea

v Sea

A

es

(A, n)-AA ⇐⇒ ∀k ∈ N, Ak v ≥ nk v

la matriz de adyacencia de un grafo

G = (V, Σ, i, t),

y

v 6= 0

un vector a coe-

cientes enteros no negativos de dimensión igual al tamaño de A. Consideremos cualquier S J ∈ V . Como ΣJ es la unión disjunta L∈V ΣLJ , se tiene que

X

X

vt(e) =

e∈ΣJ

e∈

S

L∈V

vt(e) =

XX

vt(e) =

L∈V e∈ΣL J

ΣL J

XX

vL =

L∈V e∈ΣL J

X X ΣLJ vL = AJL vL L∈V

Por otra parte, de la denición de autovector aproximado, se tiene que si, y sólo si,

∀J ∈ V, v

P

es

L∈V

AJL vJ ≥ nvJ .

L∈V

v es un (A, n)-AA

Por lo dicho previamente, resulta que

(A, n)-AA ⇐⇒ ∀J ∈ V,

X

vt(e) ≥ nvJ

e∈ΣJ Cuando irreducible

A es la matriz de adyacencia de un grafo G y posee un (A, n)-AA, hay un subgrafo H de G cuya matriz de adyacencia B admite un (B, n)-autovector aproximado

estrictamente positivo. Lema 6.15. Sean G = (V, Σ, i, t) un grafo con matriz de adyacencia A. Existe un (A, n)-AA si, y sólo si, G posee un subgrafo irreducible H con matriz de adyacencia B tal que existe un (B, n)-AA estrictamente positivo.

3. AUTOVECTORES APROXIMADOS

69

Demostración.

⇒)

v un (A, n)-AA. Designemos por K al subgrafo de G que resulta de quitar todos los I (y, obviamente, sus aristas incidentes) para los cuales vI = 0. Sea H una componente conexa de K que sea un sumidero, es decir, que no contenga aristas que terminen en un estado que no esté en H . Tal H es un subgrafo de G. Llamando VH al conjunto de vértices de H y B a su matriz de adyacencia, sea w la restricción de v a VH . Por su denición, es w > 0. Sea

vértices

Además, podemos observar que:

J ∈ VH P, es wJ = vJ y AIJ = BIJ , por lo que BIJ wJ = AIJ vJ . De allí B w = IJ J J∈VH J∈VH AIJ vJ . Para cualquier J ∈ V − VH , puede ocurrir una de dos alternativas: 1. O bien J no es un vértice en el subgrafo K , lo que ocurre por ser vJ = 0. 2. O bien J es un vértice de K . En tal caso, todas las aristas de G incidentes con I y con J subsisten en K , y, por denición de H , no hay arista en K desde I hasta J , de donde se deduce que no hay arista en G desde I hasta J . Entonces, en este caso, AIJ = 0. Cualquiera sea esa alternativa, resulta entonces que AIJ vJ = 0. Siendo J arbitrario en P V − VH , tenemos que J∈V −VH AIJ vJ = 0. Para cualquier que

P

Entonces,

X

X

BIJ wJ =

X

AIJ vJ ≥ nvI = nwI

J∈V

(B, n)-AA estrictamente positivo. ⇐) Sea w un (B, n)-AA para el subgrafo H = (V 0 , Σ0 , i0 , t0 ), y sea v el vector denido por  wJ si J ∈ V 0 vJ = 0 si J ∈ V − V 0 P Sea I un vértice arbitrario de G. Si I ∈ / V 0 , siendo vI = 0, la desigualdad L∈V AIL vL ≥ nvI 0 se cumple trivialmente. Y para cualquier I ∈ V , resulta X X X X X AIL vL = AIL vL + AIL vL = AIL wL ≥ BIL wL ≥ nwI = nvI quedando así demostrado que

L∈V 0

L∈V Ya que

w

AIJ vJ =

J∈V −VH

J∈VH

J∈VH

X

AIJ vJ +

v 6= 0

pues

L∈V −V 0

w > 0,

Dada una matriz

A

es un

resulta que

v

L∈V 0

(A, n)-AA.

es un

n,

y un entro positivo

L∈V 0



¾cuándo existe un

(A, n)-AA?

Teorema 6.16. Sean A ≥ 0 una matriz a coecientes enteros, y n un entero positivo. Entonces, hay un (A, n)-AA si, y sólo si, λA ≥ n. Si además suponemos que A es irreducible, entonces hay un (A, n)-AA estrictamente positivo. Demostración. Llamemos

sea

r

al tamaño de

A.

Sea

G

un grafo cuya matriz de adyacencia

A.

A es irreducible y que admite un (A, n)-AA v > 0. Sean c = m´ ın{vI : 1 ≤ I ≤ r} y d = m´ax{vI : 1 ≤ I ≤ r}, k k teniéndose que d ≥ c > 0. Para cualquier k ∈ N, es A v ≥ n v (observación 6.14), lo que  k implica que para cualquier I ∈ {1, . . . , r} es A v ≥ nk vI , y entonces I Para la implicación directa, por el lema 6.15, podemos suponer que

d

r X r X

k

A



I=1 J=1

Pr

Pr

IJ



r X r X I=1 J=1

 k

k

A

 IJ

vJ ≥

r X I=1

k

k

n vI = n

r X

vI ≥ nk rc

I=1

A IJ ≥ nk rc/d. Pero además, por la proposición 5.8 y el Teorema de J=1 P  Pr r k k Perron-Frobenius, es I=1 J=1 A IJ ≤ d0 λA para alguna constante d0 > 0. Juntando todo rc 1/k esto, y llamando t = , resulta que, para cualquier k ∈ N, es λA ≥ t n. Haciendo tender k dd0 a innito, y considerando que t > 0, resulta que λA ≥ n. Es decir,

I=1

70

6. CÓDIGOS DE ESTADOS FINITOS

λA ≥ n. Usando una componente irreducible de G de entropía maximal, podemos suponer que A es irreducible. Su autovector de Perron vA es positivo, y satisface AvA = λA vA ≥ nvA . Si vA tuviese todos sus coecientes racionales, haciendo v = M vA (donde M es el producto de los denominadores de los coecientes de vA ) obtendríamos que Av = AM vA = M (AvA ) ≥ M nvA = nv, mostrando que v sería el (A, n)-AA que buscamos. Pero no tenemos garantía de que vA vaya a tener todos Para la implicación recíproca, supongamos que se cumple la condición

sus coecientes racionales, así que debemos trabajar un poco más para asegurar que hay un

(A, n)-AA. Distinguiremos dos casos: 1. λA = n. En este caso, resolvemos

Av = nv

la ecuación vectorial

por eliminación gaus-

siana (siendo el sistema consistente ya que admite al menos la solución

A

v

tiene todos sus coecientes enteros, la solución

λA

racionales. Por el teorema de Perron-Frobenius, que

v

es múltiplo de

vA .

Multiplicando a

v

vA ),

y, ya que

debe tener todos sus coecientes

es geométricamente simple, por lo

por el producto de los denominadores de v0 > 0 que cumple

sus coecientes (y eventualmente por −1), obtenemos un vector Av0 ≥ nv0 . Entonces, v0 es un (A, n)-AA.

λA > n,

2. Si

de modo que

AvA > nvA ,

elijamos

v

con coordenadas racionales sucien-

temente cercanas a las respectivas coordenadas de siga cumpliéndose. Apliquemos a tal

vA

tal que la desigualdad

Av > nv

v

el proceso de multiplicar por el producto de 0 los denominadores (y eventualmente por −1) para obtener un vector v que satisfará 0 0 0 Av ≥ nv . Entonces, v es un (A, n)-AA.

 Veremos más adelante que, a la hora de construir necesario obtener explícitamente un vinculada al shift sóco

λA ≥ n,

condición

X)

existe un

(A, n)-AA,

y el entero positivo

(A, n)-AA;

(X, n)-códigos

de estados nitos, es

conociendo cierta matriz

n.

A

(estrechamente

El teorema anterior asegura que, bajo la

sin embargo, no proporciona una manera explícita de

encontrar uno. Afortunadamente, existe un algoritmo que permite hacerlo. Antes de presentarlo, 0 denimos una nueva notación: dados dos vectores v, v de igual tamaño r , designamos por m´ın(v, v0 ) al vector minimal componente a componente, es decir, (m´ın(v, v0 ))I = m´ın{vI , vI0 } para cada I ∈ {1, . . . , r}. Además, designamos por bvc al vector que se obtiene de tomar las partes enteras de las componentes de Teorema 6.17.

v,

es decir,

bvcI = bvI c

para cada

I ∈ {1, . . . , r}.

(Algoritmo del autovector aproximado) Sean A ≥ 0 una matriz a

coecientes enteros, n un entero positivo y v 6= 0 un vector a coecientes enteros no negativos. Pongamos    1 0 Av v = m´ın v, n Si v0 = v, contestar v y nalizar. Si no, reemplazar v por v0 y repetir. Este proceso nalmente culmina, y su respuesta es o bien un (A, n)-autovector aproximado o bien el vector nulo.

Demostración. Los sucesivos vectores que se van produciendo tienen coecientes enteros

no negativos y monótonamente decrecientes componente a componente. Luego, el proceso debe terminar, pues el vector nulo

0

satisface la condición

   1 0 = m´ın 0, A0 n si es que ésta no se produce antes. Sea

v

la respuesta. Se tiene que

v

es un vector a coecientes enteros no negativos. Si

v = 0,

se cumple el enunciado. Si no, notemos que





1 v = m´ın v, Av n por lo que

Av ≥ nv

con

v 6= 0,

es decir,

v

es un

 ≤

1 Av n

(A, n)-AA.



4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS

71

Típicamente, el algoritmo anterior se emplea del siguiente modo: comenzar con

v

siendo el

vector cuyas componentes son todas 1 y aplicar el algoritmo; si la respuesta es un vector no nulo, ya tenemos el autovector aproximado que buscamos. En caso contrario, tomar

v

siendo

el vector cuyas componentes son todas 2, y así sucesivamente. El teorema 6.17 asegura que en algún momento terminaremos con este procedimiento, pues existe un

p = m´axI vI ,

(A, n)-AA v.

Si hacemos

aplicando el algoritmo comenzando con el vector cuyas componentes son todas

p,

se obtendrá como respuesta un vector no nulo (ejercicio).

 Ejemplo 6.18. Apliquemos el algoritmo anterior a la matriz

 ejemplo 6.13. Comenzando con

v=

  Comenzando con

v=  

Comenzando con

v=

2 2

del

, obtenemos sucesivamente

 →



1 2



 →

0 1



 →

0 0





0 0





0 0





1 1



 →

0 1

 →

 →

0 0



 , obtenemos sucesivamente



3 3



y hemos obtenido el más pequeño de los

4.

n=5

, obtenemos sucesivamente



3 3

y el



1 1





 

2 2

1 1

A=

1 3 6 1

 →

2 3



 →

2 3



(A, 5)-autovectores

aproximados.

Construcción de códigos de estados nitos

En esta sección completaremos la demostración del Teorema de los Códigos de Estados Finitos. Lo haremos de manera constructiva, es decir, proporcionando también un método para construir el CEF, conocidos

n

y el shift sóco

X

con

h(X) ≥ log n. (G0 , L0 ) para X . Luego, G = (G00 , L) con h (XG ) =

El primer paso es obtener una presentación resolvente a derecha basados en el corolario 5.24, elegimos una componente irreducible

h (XG0 ) = h(X) ≥ log n. A partir de G , y siguiendo una adecuada secuencia de desdoblamientos de estados de grafos rotulados, construimos una presentación de X en la que desde cada vértice salen al menos n aristas, y en esa presentación eliminamos algunas aristas para obtener un grafo G en el que, desde cada vértice, queden saliendo exactamente n aristas. La función rotuladora restringida a esas aristas será nuestra rotuladora de salidas O , y como rotuladora de entradas I elegimos cualquier coloreo de rutas del grafo que resulta. Así obtenemos el CEF (G, I, O) que buscamos. Para ello, necesitamos demostrar una proposición que constituye el corazón de la demostración de que efectivamente existe aquella secuencia de desdoblamientos de estados de grafos rotulados de la que hablamos más arriba. Y dicha proposición usa un sencillo hecho de teoría de números que enunciamos a continuación.

n Sea {mP i }i=1 una sucesión de n enteros positivos. Entonces, existe S ⊆ {1, . . . , n} tal que n es factor de i∈S mi . P  N Demostración. Para cada N ∈ {1, . . . , n}, sea pN = m mod n. i i=1 ∗ Si los pN son todos distintos, debe haber algún N tal que pN ∗ = 0 (pues los posibles restos PN ∗ de una división por n son 0, 1, . . . , n − 1) y, en ese caso n es factor de i=1 mi ; luego, basta ∗ tomar S = {1, . . . , N } para ver que el enunciado es cierto. Lema 6.19.

72

6. CÓDIGOS DE ESTADOS FINITOS

N1 < N2 tales que pN1 = pN2 . Eso signica que PN2 P 2 mi mod n, es decir, i=N1 +1 mi = 0 mod n. De aquí que N i=1 mi = i=N1 +1 mi es múltiplo de n; luego, basta tomar S = {N1 + 1, . . . , N2 } para ver que el enunciado es cierto.  Si no son todos distintos, debe haber

P

PN1

N2 i=1



Sean n un entero positivo, G = (V, Σ, i, t) un grafo irreducible con matriz de adyacencia A, y v > 0 un (A, n)-autovector aproximado. Supongamos que algún estado K ∗ ∈ V tiene menos de n aristas saliendo de él. Entonces, existe I ∈ V y una partición de ΣI en subconjuntos no vacíos Σ1I y Σ2I tal que el grafo G0 que resulta de desdoblar I en I 1 , I 2 usando esa partición posee matriz de adyacencia A0 que admite un (A0 , n)-autovector aproximado v0 > 0 con vI0 1 + vI0 2 = vI y vJ0 = vJ para todo J ∈ V − {I 1 , I 2 }. Proposición 6.20.

p = m´axJ∈V vJ . Notar que debe haber algún P estado K tal que P vK < p, pues, de lo contrario, tendríamos que ∀K ∈ V, vK = p y entonces L AK ∗ L vL = p L AK ∗ L = p |ΣK ∗ |; como v es (A, n)-AA, tendríamos que p |ΣK ∗ | ≥ nvK ∗ = np, es decir, |ΣK ∗ | ≥ n, ∗ contradiciendo la hipótesis de que desde K salen menos de n aristas. 0 Elijamos entonces I , K ∈ V tales que vK < p y vI 0 = p. Como G es irreducible, hay camino 0 en G desde I hasta K . Sea I el último estado en el recorrido de ese camino tal que vI = p, y ∗ e la arista de ese camino que sale del estado I . Observar que vt(e∗ ) < p. P ≥ nvI = np (observación 6.14). Designemos m = |ΣI |. Como v es (A, n)-AA, es e∈ΣI vt(e) P ∗ Además, ∀e ∈ ΣI , vt(e) ≤ p y ∃e ∈ ΣI : vt(e∗ ) < p. Luego, e∈ΣI vt(e) < p |ΣI | = pm. De lo anterior, tenemos que m > n, es decir, hay más de n aristas saliendo de I . Enumeremos ∗ las aristas de G que salen de I como e1 , . . . , en , . . . , em con e1 = e . Aplicando el lema 6.19 a  P la sucesión vt(e1 ) , . . . , vt(en ) , vemos que existe S ⊆ {1, . . . , n} tal que i∈S vt(ei ) = qn para 1 1 2 + 1 6 Σ2I algún q ∈ Z . Designemos ΣI = {ei : i ∈ S} y ΣI = ΣI − ΣI . Tendremos que ΣI 6= ∅ = 0 0 0 0 0 1 (pues |ΣI | > |ΣI |). Sea G = (V , Σ , i , t ) el grafo que resulta de hacer un desdoblamiento 1 2 0 elemental de G por el estado I usando la partición ΣI = {ΣI , ΣI }, y llamemos A a su matriz 0 de adyacencia. Denamos v mediante:  q si J = I 1  0 vI − q si J = I 2 vJ =  vJ si J ∈ V − {I 1 , I 2 } Demostración. Sea

0 2 0 Veamos que v así denido es positivo. Para J 6= I , vJ > 0 pues q > 0 y vJ > 0. Y para Pn P 0 ver que vI 2 > 0, notemos que nq = i=1 vt(ei ) < np, pues vt(e1 ) = vt(e∗ ) < p y e∈Σ1I vt(e) ≤ P n vt(ei ) ≤ p para i ∈ {2, . . . , n} (así que i=1 vt(ei ) < np); de allí que q < p y, en consecuencia, vI0 2 = vI − q = p − q > 0. 0 Tengamos presente que cada arista e de G que no termina en I es también arista en G y 0 cumple que vt0 (e) = vt(e) ; en tanto, cada arista e de G que termina en I (incluidos los rulos en I ) aparece desdoblada en G0 como e1 y e2 , siendo vt0 0 (e1 ) + vt0 0 (e2 ) = vI0 1 + vI0 2 = vI = vt(e) . 0 0 Resta ver que v es (A , n)-AA. Lo haremos por la segunda caracterización dada en la observación 6.14.

1 1 2 1 2 Designemos ∆ a los rulos en I , ∆ a las aristas que van de I a I y ∆ a 1 1 2 1 0 las que salen de I y no terminan ni en I ni en I (siendo ∆ ⊂ ΣI ). Se tiene que ΣI 1 1 2 1 es la unión disjunta ∆ ∪ ∆ ∪ ∆ , y además ΣI es la unión disjunta de ∆ con los rulos 1 1 1 en I que están en ΣI . Por lo dicho más arriba, por cada arista e ∈ ∆ hay una arista e2 ∈ ∆2 y viceversa; y cada pareja e1 , e2 proviene de un rulo e ∈ ΣII ∩ Σ1I . Entonces, Si

X

J = I 1:

vt0 0 (e) =

X

=

X

e∈Σ0 1

vt0 0 (e) +

e∈∆

vt0 0 (e) +

e∈∆1

e∈∆

I

X

vt(e) +

X e∈ΣII ∩Σ1I

X

vt0 0 (e) =

e∈∆2

vt(e) =

X e∈Σ1I

X e∈∆

X

vt(e) +

e∈ΣII ∩Σ1I

vt(e) = nq = nvI0 1

vt0 0 (e) + vt0 0 (e)



4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS

J = I 2:

Si

P

Por análisis similar al realizado en el caso anterior, resulta

vt(e) ,

e∈Σ2I

73

y, como

Σ2I = ΣI − Σ1I ,

P

e∈Σ0 2 I

vt0 0 (e) =

se tiene que

! X

X

0 vt(e) =

e∈Σ0 2

X

vt(e) =

e∈ΣI −Σ1I

I

vt(e)

− nq ≥ nvI − nq = n(vI − q) = nvI0 2

e∈ΣI

J ∈ / {I 1 , I 2 }: Designemos ∆1 a las aristas que van de J a I 1 , ∆2 a las que van de J a I 2 y ∆ a las que van de J hasta un vértice distinto de I 1 y de I 2 . Se tiene que Σ0J es la unión disjunta ∆ ∪ ∆1 ∪ ∆2 . Como antes, por cada arista e1 ∈ ∆1 hay una 2 2 1 2 arista e ∈ ∆ y viceversa; y cada pareja e , e proviene de una arista e en G desde J P 0 hasta I . Procediendo de manera análoga a lo anterior, se llega a ver que e∈Σ0J vt0 (e) = P 0 e∈ΣJ vt(e) ≥ nvJ = nvJ . Si

0 Es decir, para todos los vértices de G se cumple la desigualdad requerida en la observación 0 0 0 0 6.14 en cuanto a v , A y n, resultando entonces que v es un (A , n)-AA. 

Sean n ∈ Z+ y G un grafo irreducible con matriz de adyacencia A. Si λA ≥ n, entonces existe una sucesión de grafos G0 , G1 , . . . , Gm tales que G0 = G, Gm tiene al menos n aristas saliendo desde cada vértice, y para cada i ∈ {1, . . . , m}, Gi resulta de un desdoblamiento elemental de Gi−1 . Teorema 6.21.

v > 0 un (A, n)-AA, cuya existencia está garantizada por el teorema G0 = G. Si desde cada estado de G salen al menos de n aristas, tomamos m = 0 y el enunciado se cumple. En caso contrario, sea G1 el grafo que resulta de aplicar a G0 la (1) proposición 6.20, cuya matriz de adyacencia tendrá un autovector aproximado v > 0 cuya dimensión es una unidad mayor que la de v pero cuya suma de componentes es igual a la suma de las componentes de v. Si G1 tampoco tiene al menos n aristas saliendo desde cada vértice, le aplicamos nuevamente la proposición 6.20 para obtener un grafo G2 cuya matriz de (2) adyacencia tiene autovector aproximado v > 0 con dimensión una unidad mayor que la de (1) v y suma de coecientes igual a la suma de los coecientes de v(1) , y así sucesivamente. El (i) proceso debe terminar, pues cada v que se obtiene en cada paso es estrictamente positivo y (i−1) tiene una coordenada más que v , pero sus respectivas sumas de coecientes son iguales. Entonces, el último Gm obtenido es el buscado.  Demostración. Sea

6.16. Hagamos

Ahora podemos completar la demostración del Teorema de los Códigos de Estados Finitos, cuya vuelta nos estaba faltando. Demostración.

(X, n)-CEF.)

(Suciencia de la condición de entropía para existencia de un

Supongamos que

X

es un shift sóco con

sentación resolvente a derecha para

X.

Sea

G0

h(X) ≥ log n,

y sea

(H, L) una H tal

una componente irreducible de

preque

h (XG0 ) = h (XG ), y sea A la matriz de adyacencia de G0 . Designemos L0 a la restricción de L a las aristas de G0 . Como h(X) = log λA ≥ log n, es λA ≥ n. Aplicando entonces a G0 el teorema 6.21, obtenemos la sucesión de grafos rotulados G0 = (G0 , L0 ), . . . , Gm = (Gm , Lm ) donde G1 , . . . , Gm son los que resultan del teorema, y cada grafo rotulado Gi es el correspondiente desdoblamiento (como grafo rotulado) de Gi−1 . Sabemos que X ⊇ XG0 = XGm , y, por proposición 6.6, Gm es cerrante a derecha con demora m. Como Gm tiene al menos n aristas saliendo desde cada vértice, elegimos exactamente n aristas saliendo desde cada vértice (eliminando las otras) para obtener así un subgrafo G coloreable al que dotamos de un coloreo de rutas I . Designando por O a la restricción de Lm a las aristas de G, resulta que la terna (G, I, O) es un (X, n)-CEF, pues O∞ (XG ) = (Lm )∞ (XG ) ⊆ (Lm )∞ (XGm ) = XGm ⊆ X .  X el shift sóco mostrado en la (X, 3)-CEF, y, en caso armativo, veremos

Ejemplo 6.22. Sea

construir un

gura 7. Analizaremos si es posible la aplicación del procedimiento que

está implícito en las demostraciones anteriores para obtener tal código de estados nitos.

74

6. CÓDIGOS DE ESTADOS FINITOS

Figura 7. Shift sóco

X

para construir un

(X, 3)-CEF

El grafo subyacente es irreducible y su matriz de adyacencia es



 2 1 1 A= 0 1 1  2 1 0 Su autovalor de Perron es

h(X) = log λA ≥ log 3. (X, 3)-CEF.

λA = 3, 1149 . . .,

y como la presentación es resolvente a derecha, es

Entonces, de acuerdo al Teorema de los Códigos de Estados Finitos,

existe un

Como el grafo subyacente ya es irreducible y la presentación es resolvente a derecha, el grafo rotulado de la gura 7 será nuestro

G0

de arranque. Como hay estados con menos de tres aristas

salientes, deberemos seguir el procedimiento dado en la demostración de la proposición 6.20. Por aplicación del algoritmo de búsqueda de autovector aproximado, llegamos a que

[3, 1, 2] es un (A, 3)-AA. De acuerdo a e∗ que arranque en un estado I

v=

la demostración de la proposición 6.20, buscamos una

vI maximal, y termine en un estado J con vJ no ∗ maximal. Hay varias opciones; elegiremos I = 1 y e la arista de 1 a 3 que tiene rótulo a. 1 ∗ De acuerdo a la demostración, elegimos ΣI conteniendo e y la arista de 1 a 2 con rótulo d, 2 y ΣI son todas las otras aristas que salen de I (los dos rulos en 1, en este caso). Notar que P e∈Σ1I vt(e) = 3, así que el q de la demostración vale, en esta etapa, 1. Luego, el autovector aproximado correspondiente al grafo desdoblado G1 tendrá coecientes 1 y 2, respectivamente, para los dos estados en que se desdoblará I ; los otros estados conservarán el valor que tienen asociado en G0 . arista

con

En la gura 8, mostramos la sucesión de desdoblamientos de grafos rotulados que se produce. En cada paso, mostramos dentro de un hexágono al lado de cada estado el valor del coeciente del autovector aproximado que le corresponde en esa etapa, e indicamos con I el estado por el ∗ cual se produce el desdoblamiento, con (∗) la arista e , y con línea discontinua las aristas de 1 ΣI . El proceso para en G3 , pues hemos llegado a una presentación en la que desde cada vértice salen al menos tres aristas. Elegimos entonces exactamente tres aristas saliendo de cada vértice, eliminando las otras, y coloreamos el grafo rotulado resultante con el alfabeto de entradas gura 8 muestra, en la parte inferior, uno de los posibles Usando el hecho de que de tamaño

N sin solape),

h X

 N

= N h(X)

(donde

A = {0, 1, 2}.

(X, 3)-CEF.

XN

es la presentación de

La misma

 X

en bloques

en los ejercicios se verá cómo se puede adaptar el Teorema de los

Códigos de Estados Finitos para construir códigos aún sin cumplirse de manera directa la condición

h(X) ≥ log n.

4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS

G0

G1

G2

G3

Figura 8. Cadena de desdoblamientos y un

(X, 3)-CEF

resultante

75

Get in touch

Social

© Copyright 2013 - 2025 MYDOKUMENT.COM - All rights reserved.