Story Transcript
Teoría de Juegos M. En C. Eduardo Bustos Farías 1
¿Qué es un juego?
• Un juego es un problema de toma de decisiones en el que participan dos o más individuos (≡ decisores, jugadores, agentes, controladores). • Es una herramienta matemática que analiza las interrelaciones entre dos o mas individuos, y busca un modelo de actuación óptimo. Con un individuo el problema es un problema de control. Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
2
¿Qué tipos de juegos hay? • Juegos estáticos o de una tirada (one-shot games). • Juegos repetidos. • Juegos dinámicos. Juego diferencial Juego diferencial estocástico Juegos de saltos (tipo cadenas de Markov), juegos híbridos, …
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
3
Juegos cooperativos: • los jugadores deciden cooperar entre ellos para alcanzar un resultado que sea “benéfico” para ellos. Problema: encontrar equilibrios cooperativos conocidos también como equilibrios de Pareto. Juegos de Stackelberg: • uno de los jugadores es el líder (tira primero) y • el resto de los jugadores son seguidores…
… etc, etc, etc,… Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
4
Generalmente, en un juego hay un
conflicto de intereses −
los objetivos de los jugadores pueden oponerse unos contra otros. Por lo tanto, los jugadores tienen que
negociar, es decir, ponerse de acuerdo cómo “jugar el juego”. Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
5
¿Como se juega un juego?
Juegos no cooperativos: • los jugadores no cooperan entre ellos; • actúan independientemente, • cada uno tratando de satisfacer su propio objetivo.
Problema: encontrar equilibrios no-cooperativos también conocidos como Equilibrios de Nash. Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
Elementos del juego
Jugadores No jugadores (“naturaleza”) Acciones Información Estrategias Resultados Equilibrio
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
7
Supuestos Los participantes en la relación: • • • • •
Son conscientes de ésta Buscan el máximo provecho Actúan racionalmente Existe un costo de la relación y se obtiene un beneficio de ella. Se supone que el jugador escogerá la elección óptima
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
8
Juegos
Un juego es una situación competitiva entre n personas o grupos, denominados jugadores Se realiza bajo un conjunto de reglas previamente establecidas con consecuencias conocidas Las reglas definen las actividades elementales o movimientos del juego. Pueden permitirse diferentes movimientos para los distintos jugadores , pero cada jugador conoce los movimientos de que dispone cada jugador Si un jugador gana lo que otro jugador pierde el juego se le denomina de suma cero
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
9
Un juego de 2 personas es un juego que tiene solo dos jugadores Cada jugador tiene un número finito de elecciones o infinito llamadas estrategias. Los resultados o pagos de un juego se resumen como funciones de las diferentes estrategias para cada jugador Un juego con 2 jugadores, donde la ganancia de un jugador es igual a la perdida de otro se conoce como un juego de 2 persona y de suma cero En tal juego es suficiente expresar los resultados en términos del pago a un jugador. Se emplea una matriz para resumir los pagos al jugador cuyas estrategias est án dadas por los Investigació 10 Investigación de Operaciones M. En C. Eduardo Bustos Farí Farías renglones de la matriz
Una estrategia pura es un plan previamente determinado, que establece la secuencia de movimientos y contra movimientos que un jugador realiza durante un juego completo. La matriz de consecuencias o pagos proporciona una caracterización completa del juego al que corresponde.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
11
Juegos en Forma Normal
Un Juego en Forma Normal consiste en: • Jugadores • Estrategias de acciones factibles. • Matriz de Pagos (“Payoffs”)
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
12
Juegos de suma cero
Se dice que un juego es de “suma cero” cuando lo que gana un jugador lo pierde el otro, como en ajedrez, poquer, etc. Todos los ejemplos que hemos visto de juegos son de suma cero, por eso en las celdas de la matriz del juego un mismo número es la ganancia para el jugador de los renglones y la pérdida para el de las columnas.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
13
Ejemplo 1
Construya la matriz de pagos para el siguiente juego. Considere un juego de “igualar” monedas en el cual cada uno de 2 jugadores A y B elige sol (S) ó águila (A). Si son iguales los 2 resultados (S y S) ó (A y A) el jugador A gana 1 peso al jugador B, de otra manera A pierde un peso que paga a B
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
14
Solución 1.- Son dos jugadores 2.- Lo que uno gana el otro lo pierde 3.- Cada jugador tiene 2 estrategias puras 4.- La matriz de juegos es de 2x2 expresado en términos del pago al jugador Jugador A Jugador B Investigació Investigación de Operaciones
A S
A 1 -1
M. En C. Eduardo Bustos Farí Farías
S -1 1
15
Ejemplo 2
Construya la matriz de juegos para el siguiente juego Considere un juego en el cual 2 jugadores muestran simultáneamente 1, 2 ó 3 dedos uno al otro. Si la suma de dedos mostrados, es par, el jugador II paga al jugador I esta suma en pesos. Si la suma es non, el jugador I paga esa cantidad al jugador II.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
16
Solución
Son dos jugadores Lo que gana 1 el otro lo pierde por lo que es de suma cero Cada jugador tiene 3 estrategias puras, mostrar 1, 2, 3 dedos La matriz de juegos es de 3x3 expresada en términos del pago del jugador I Jugador II Jugador I
Investigació Investigación de Operaciones
1 2 3
1 2 -3 4
2 -3 4 -5
M. En C. Eduardo Bustos Farí Farías
3 4 -5 6 17
A
10 kms
20 kms
B
15 kms
C
Ejemplo 3
Construya una matriz de consecuencias para el siguiente juego. Dos cadenas de supermercados se proponen construir, cada una, una tienda en una región rural en donde se encuentran 3 pueblos. 45% de la población vive cerca del pueblo A 35% de la población vive cerca del pueblo B 20% de la población vive cerca del pueblo C Debido a que la cadena I es más grande que la cadena II, la cadena I controlará la mayoría de los negocios, siempre que sus ubicaciones sean comparativas. Ambas cadenas conocen los intereses de la otra en la región y ambas han terminado estudios de Investigació ón de Operaciones 18 mercado que danM.proyecciones idénticas. Investigaci En C. Eduardo Bustos Farí Farías
Si ambas cadenas se sitúan en el mismo pueblo o los equidistantes de un pueblo, la cadena I controlará el 65% de los negocios en ese pueblo. Si la cadena I está más cercana a un pueblo que la cadena II, la cadena I controlará 90% de los negocios en este pueblo. Si la cadena I está más alejada de un pueblo que la cadena II, atraerá a 40% de los negocios de este pueblo. El resto de las operaciones, bajo cualquier circunstancia, irán a la cadena II. Además ambas cadenas saben que la política de la cadena I es no ubicarse en pueblos que sean demasiado pequeños, y el pueblo C cae dentro de esta categoría. M. En C. Eduardo Bustos Faríías Investigació 19 Investigación de Operaciones Far
Solución
Hay 2 jugadores. El jugador I tiene 2 estrategias puras y el II tiene 3 estrategias puras.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
20
I
A
B
C
I
II
Si I se ubica en A y II en B entonces I tendrá (0.9)(0.45) + (0.4)(0.35) + (0.4)(0.2) = 0.625 O sea el 62.5% de los negocios de la región.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
21
A
B
I
C
II
Si I se ubica en B y II en C, entonces I tendrá (0.9)(0.45) + (0.9)(0.35) + (0.4)(0.2) = 0.8 O sea el 80% de los negocios de la región.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
22
II
A
B
I
C
Si I se ubica en B y II en A entonces I tendrá (0.9)(0.35) + (0.4)(0.45) + (0.9)(0.2) = 0.575 O sea un 57%
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
23
I
A
B II
II
I
C
Si ambas cadenas se ubican en el mismo pueblo I recibirá 65% de los negocios de toda la región.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
24
Tabla de pagos o consecuencias
Jugador I
Investigació Investigación de Operaciones
A B
A 65 67.5
M. En C. Eduardo Bustos Farí Farías
Jugador II B 62.5 65
C 80 80
25
DOMINANCIA
26
Estrategia dominante
Se dice que una estrategia es “dominante” cuando es la mejor opción del jugador para todas las posibles opciones del contrincante (similarmente para varios contrincantes).
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
27
Dominancia
Algunas veces una fila o columna de la matriz de pagos carece de efectividad para influir sobre las estrategias óptimas y el valor del juego Una estrategia pura P es dominada por una estrategia pura Q si, para cada estrategia pura del oponente, el pago asociado con P no es mejor que el pago asociado con Q. Ya que una estrategia pura dominada no puede ser nunca parte de una estrategia óptima, el renglón o columna correspondiente en la matriz del juego debe ser eliminada
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
28
Ejemplo 1. Dominancia II I
1 2 3
1 4 3 2
2 -8 -9 6
3 7 2 8
4 -2 -3 2
Observe que entre las filas 1 y 2, la 2 no desempeña ningún papel de importancia en la estrategia del jugador I. 4>3 -8 > -9 7>2 -2 > -3 Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
29
Por lo tanto la probabilidad asociada a ella será cero. La solución del juego anterior sería la misma si la matriz de pago fuera:
II I
Investigació Investigación de Operaciones
1 3
1 4 2
2 -8 6
M. En C. Eduardo Bustos Farí Farías
3 7 8
4 -2 2
30
Estrategia débilmente dominante
Decimos que una estrategia es “débilmente dominante” cuando no es peor que ninguna otra estrategia. Es lo mismo que decir que es la mejor o al menos igual a otra. Ojo: Una estrategia dominante es también débilmente dominante; lo contrario no es cierto.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
31
Estrategia dominante, ejemplo (cont) Análisis de casos para ver si B tiene estrategia dominante Si A elige 1 (renglón sup.), la mejor opción de B es 2 (u=-2). Si A elige 2 (renglón cen.), la mejor opción de B es 2 (u=0). Si A elige 3 (renglón inf.), las mejores opciones de B son 1 y 2 (u=-5).
a1 a2 a3
b1 0 2 -5
b2 -2 0 -5
b3 4 10 0
B tiene una estrategia débilmente dominante
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
32
Ejemplo 2. Dominancia
Determine si alguna de las estrategias puras del problema de la ubicación de los supermercados en los pueblos A, B y C pueden descartarse por dominación. La matriz del juego era: II I
Investigació Investigación de Operaciones
A B
A 65 67.5 M. En C. Eduardo Bustos Farí Farías
B 62.5 65
C 80 80 33
Solución El jugador I puede descartar ubicarse en A, ya que las consecuencias de esta estrategia siempre son menores o iguales a las consecuencias de B 67.5 > 65 65 > 62.5 80 = 80
II I Investigació Investigación de Operaciones
A B
A 65 67.5 Farías M. En C. Eduardo Bustos Farí
B 62.5 65
C 80 80
34
El jugador II puede descartar A y C, ya que son inferiores a B. La matriz es: II I
A 65 67.5
A B
B 62.5 65
C 80 80
I II
A 35 37.5 20
A B C
B 32.5 35 20 I
II
A B C
A 35 37.5 20
B 32.5 35 20
La matriz de consecuencias se reduce al valor en que coinciden ambas tablas B. Lo que indica que el supermercado I debe ubicarse en el pueblo B y controlar Investigación de Operaciones M. En C. Eduardo Bustos Farí ías elInvestigació 65% de los negocios y la cadena II ubicarseFar en el mismo pueblo y manejar 35 el 35% de los negocios restantes
VALOR DEL JUEGO
EL PAGO QUE SE OBTIENE PARA EL JUGADOR 1 CUANDO AMBOS JUEGAN DE MANERA OPTIMA. JUEGO JUSTO: EL VALOR DEL JUEGO ES 0.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
36
CRITERIO MINIMAX JUGADOR 2 ESTRATEGIA
JUGADOR 1
1
2
3
1
-3
-2
6
2
2
0
2
3
5
-2
-4
¿QUE OPCION ESCOGE CADA JUGADOR DE MANERA QUE LA MAYOR PERDIDA POSIBLE SEA MINIMIZADA? Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
37
CRITERIO MINIMAX JUGADOR 2 ESTRATEGIA
1 2 3
MÍNIMO
1 -3 -2 6 2 2 0 2 3 5 -2 -4
JUGADOR 1
MÁXIMO
-3 0 -4
5 0 6
VALOR MAXIMIN
PUNTO SILLA
VALOR MINIMAX SE SELECCIONA LA OPCION 2 VALOR DEL JUEGO= 0 (JUEGO JUSTO). Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
38
PUNTO SILLA
MINIMAX= MAXIMIN PUNTO SILLA ->NINGUN JUGADOR PUEDE APROVECHAR LA ESTRATEGIA CONOCIDA DE SU OPONENTE -> SOLUCION ESTABLE
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
39
SOLUCIONES SIN PUNTO SILLA JUGADOR 2 ESTRATEGIA
1 0 -2 2 2 5 4 -3 3 2 3 -4
JUGADOR 1
MÁXIMO
Investigació Investigación de Operaciones
1 2 3
MÍNIMO
-2 -3 -4
maximin
5 4 2
M. En C. Eduardo Bustos Farí Farías
minimax
40
Solución Óptima de juegos de 2 personas y suma cero - Juegos estables (Valor de juego, estrategias minimax y maximin). Puntos silla - Juegos Inestables (estrategias mixtas)
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
41
Juegos inestables o estrategias mixtas
El objetivo en la teoría de juegos es determinar una estrategia “mejor” para un jugador dado, bajo la consideración de que el oponente es racional y realizará movimientos inteligentes en contra. En consecuencia si un jugador siempre selecciona la misma estrategia pura o selecciona estrategias puras en un orden fijo, su oponente reconocerá a tiempo el patrón y tratará de vencerlo, si es posible. Por esto, la estrategia más efectiva es una estrategia mixta, definida por una distribución probabilística sobre un conjunto de estrategias puras.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
42
Ejemplo 1: Estrategias mixtas.
En el juego de mostrar 1,2 ó 3 dados se puede construir una estrategia mixta X=[1/6, 1/3, ½], que significa que el jugador uno, planea mostrar el dedo 1 1/6 de veces, 2 dedos 1/3 de veces, 3 dedos ½ de las veces.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
43
Ejemplo 2: Estrategias Mixtas.
Sea la siguiente matriz de pagos para un juego de 2 jugadores de suma cero Este juego no tiene punto de silla, ni se puede calcular el valor de juego. Se dice que es un juego inestable.
Jugador A
Investigació Investigación de Operaciones
1 2 3 4
1 5 6
Jugador B 2 3 -10 9 7 8
8 7 15 3 4 -1 M. En C. Eduardo Bustos Farí Farías
4 0 1 2 4
44
Solución del problema de estrategias mixtas
Se basa en el criterio mínimax. La única diferencia es que A (ó jugador I) elije Xi, la cual maximiza el pago esperado más pequeño en una columna, en tanto que B (ó jugador II) selecciona Yj, la cual minimiza el pago esperado en un renglón. Igual que en estrategias puras se verifica la relación:
pago esperado minimo < pago esperado maximin Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
45
Cuando Xi y Yj corresponden a la solución óptima, se cumple la igualdad y los valores resultantes llegan a ser iguales al valor esperado (óptimo) del juego. Si Xi* y Yj* son las soluciones óptimas para ambos jugadores, cada elemento de pago Aij estará asociado a la probabilidad (Xi*, Yj*). Por consiguiente, el valor esperado óptimo del juego es: En otras palabras cualquier juego matricial tiene un valor
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
46
Métodos para resolver juegos Métodos para resolver juegos (2xn) ó (mx2)
Gráfico De programación lineal
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
47
Solución gráfica de juegos de (2xN) y (Mx2)
Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo menos uno de los jugadores, tiene solamente 2 estrategias.
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
48
Solución gráfica de juegos (mx2)
49
Ejemplo 1
Considere el siguiente juego: B
A
1
2
1
2
4
2
2
3
3
3
2
4
-M.2En C. Eduardo Bustos 6 Farí Farías
Investigació Investigación de Operaciones
50
SOLUCIÓN
51
El juego no tiene un punto silla. Sean y1 y y2 (=1- y1) dos estrategias mixtas de B. Estrategia pura de A 1
Pagos esperados para B -2y1 + 4
2
-y1 + 3
3
y1 + 2
4
Investigació Investigación de Operaciones
-8y1 + 6
M. En C. Eduardo Bustos Farí Farías
52
El juego no tiene punto silla. Sean Y1 y Y2 (Y2 = 1-Y1) dos estrategias mixtas de B Estrategias puras Pagos esperados de A de B 1 -2Y1 + 4 2 -Y1 + 3 3 Y1 + 2 4 -8Y1 + 6
Investigació Investigación de Operaciones
Y1 = 0
Y1 = 1
4 3 2 6
2 2 3 -2
M. En C. Eduardo Bustos Farí Farías
53
El punto minimax se determina como el punto mas bajo de la envolvente superior El valor de Y1* se obtiene como el punto de intersección de las líneas 1 y 3 -2Y1 + 4 = Y1 + 2 -3Y = -2 Y = 2/3 (Esta es la estrategia óptima para A)
Sustituyendo en 1 y en 3 V* = -2(2/3) + 4 = 8/3 2/3 + 2 = 8/3 El valor del juego es 8/3 Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
54
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
55
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
56
POR WINQSB
ESTRATEGIA ÓPTIMA PARA EL JUGADOR A ESTRATEGIA ÓPTIMA PARA EL JUGADOR B
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
57
Ejemplo2: Considere el siguiente juego (2x4) 1. 2. 3.
Encuentre el punto máximo Calcule la estrategia optima de A Calcule el valor del juego
A
Investigació Investigación de Operaciones
1 2
1 2 4
B 2 2 3
M. En C. Eduardo Bustos Farí Farías
3 3 2
4 -1 6
58
Solución
El juego no es estable ya que las estrategias puras maximin = 2 es diferente a la mínimax = 3 Por lo que los pagos esperados de A corresponden a las estrategias puras de B son:
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
59
Estrategias puras Pagos esperados de B de A 1 -2X1 + 4 -X1 + 3 2 3 X1 +2 4 -7X1 + 6
X1 = 0
X1 = 1
4 3 2 6
2 2 3 -1
Resolviendo 2 y 3 -X1 + 3 = X1 +2 -2X1 = -1 X1 = ½ (maximin)
A
La estrategia óptima es (½ , ½) V* = - ½ +3 = 5/2 Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
1 2
1 2 4
B 2 2 3
3 3 2
4 -1 6
60
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
61
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
62
Ejemplo 3: Considere el juego (2x4)
Encuentre el punto maximin Calcule la estrategia óptima Calcule el valor de juego
P1
Investigació Investigación de Operaciones
1 2
1 19 0
P2 2 15 20
M. En C. Eduardo Bustos Farí Farías
3 17 15
4 16 5 63
Solución
El juego no es estable ya que las estrategias puras maximin = 15 es diferente a mínimax = 16
Estrategias puras Pagos esperados de P2 de P1 1 (19-0)X1 + 0 = 19X1 2 (15-20)X1 + 20 = -5X1 + 20 3 (17-15)X1 + 15 = 2X1 +15 4 (16-5)X1 + 5 = 11X1 + 5 Investigació Investigación de Operaciones
X1 = 0
X1 = 1
0
19
20
15
15
17
5
16
M. En C. Eduardo Bustos Farí Farías
64
Resuélvalo por winqsb
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
65
Método simplex
66
Solución de juegos (mxn) por programación lineal
Se trata de Maximizar el valor del juego (representado por las estrategias de un jugador). Sujeto a la combinación lineal por renglón de la matriz de juego. Si el valor maximin es positivo se procede de este modo, si es negativo se agrega a la matriz de juego una constante k
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
67
Ejemplo 1.
Sea la matriz de consecuencias para el juego (2x2):
Jugador 1
Investigació Investigación de Operaciones
A1 A2
Jugador 2 B1 B2 0 ½ 1 0
M. En C. Eduardo Bustos Farí Farías
68
Solución por programación lineal Como el valor maximin = 0, se procede a resolver: MAX Z = Y1 + Y2 S.A. Jugador 1 A1 A2 0Y1 + 0.5Y2 = 0 Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
Jugador 2 B1 B2 0 ½ 1 0
69
Solución por Winqsb: planteamiento Jugador 1
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
A1 A2
Jugador 2 B1 B2 0 ½ 1 0
70
Datos importantes
Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
71
Estrategias óptimas Estrategias óptimas del jugador 2 V* = 1/3 Y1* = 1/3 Y2* = 2/3 (.3, .6) Estrategias para uno de los jugadores Para obtener las estrategias óptimas del jugador 1 resolvemos por simplex dual y se tiene: X1* = 2/3 X2* = 1/3 (0.66, 0.33), véase que suman 1. Investigació Investigación de Operaciones
M. En C. Eduardo Bustos Farí Farías
72
EJERCICIOS DE REPASO DEL TEMA DE TEORÍA DE JUEGOS. INVESTIGACIÓN DE OPERACIONES M. EN C. EDUARDO BUSTOS FARÍAS
6
1