Story Transcript
TEORÍA DE JUEGOS ¿Cómo Có jjugar?? ¿Estrategias puras o mixtas? Parte I
J g de Juegos d suma cero Bart y Lisa aplican p maximin:
L1 = 0 L2 = 1 L3 = 2 B1 = 0 B2 = 1 B3 = 2
−5 2 3
2 3 3
−5 −5 2
B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2 i ⎝ j ⎠ L * = min max (π ij ) = min (3,3, 2 ) = 2 j
(
i
)
J g de Juegos d suma cero Bart y Lisa aplican p maximin:
Solución estrategias puras: B*=B3, L*=L3, Л=2 Punto de Silla :
(
max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij ) j i ⎝ j i ⎠
)
J g de Juegos d suma constante t t y Punto de silla: condición necesaria y suficiente
para encontrar equilibrio en estrategias puras
⎧⎪π io , j ≥ π io , jo ∀j = 1K m ∃io , jo / ⎨ ⎪⎩π i , jo ≤ π io , jo ∀i = 1K n
Punto de silla
¿Y si no hay un punto de silla? Lisa
Papel
Tijeras
Piedra
Papel
0,0
-1,1 1,1
1,-1 1, 1
Tijeras
1,-1 1, 1
0,0
-1,1 1,1
Piedra
-1,1 1,1
1,-1 1, 1
0,0
Bart
Definiciones y y y
Estrategia mixta: jugada con una probabilidad p E t t i pura: Estrategia jugada con una probabilidad p=1 Distribución de probabilidad subjetiva: un jugador cree que el otro elegirá la estrategia k con probabilidad лk,
¿Y si no hay un punto de silla? Estrategia mixta: y Distribución de p probabilidad asociada con el conjunto j de estrategias puras de un jugador. P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1; i
pi es la probabilidad de jugar la estrategia Ai
Estrategias mixtas y Juego bipersonal y B jjuega g Bi con p probabilidad pi ((P)) y L juega Lj con probabilidad qj (Q)
Def. Valor esperado del juego:
(
)
E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j j
i
i
j
p, q son probabilidades subjetivas
Piedra, papel Piedra, papel,, tijeras tijeras:: deja que adivine… adivine… Pb(rock)=1
"Good ol' rock. Nuthin' beats that!"
TEORÍA DE JUEGOS ¿Cómo Có jjugar?? Parte II
Ejemplo: cara / cruz Fila y Columna escriben cara o cruz en un papel y Si escriben ib llo mismo, i Columna C l lle paga 1 a Fila Fil y Si escriben algo diferente, Fila le paga 1 a Columna y
Ejemplo: cara / cruz Estrategia mixta: y Fila juega cara con probabilidad 2/3 y Columna juega cruz cru ¿Cuál es el valor esperado d ddell juego dde Fila?
Columna Cara
Cruz
Cara
1,-1
-1,1
Cruz
-1,1
1,-1
Fil Fila
Teorema Minimax (I) y En un juego bipersonal de suma constante, el valor
p del juego j g tiene siempre, p , al menos un esperado punto de silla:
(
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠
Todo juego bipersonal de suma constante tiene solución
Equilibrio en estrategias mixtas Teorema: y En un juego bipersonal de suma constante, El valor esperado del juego tiene siempre, al menos un punto de silla:
(
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*) Q P ⎝ Q P ⎠ Todo juego bipersonal de suma constante tiene solución
Juegos y Cooperativos: y Coalición y Negociación de las reglas del juego y Coordinación y Amenazas y promesas confiables y No cooperativos: y N personas actúan independientemente y No hay coaliciones posibles y Acciones racionales
Solución ó juegos no cooperativos y Minimax y Todo juego bipersonal de suma cero tiene una estrategia mixta
óptima p para p cada jugador j g y Espera lo mejor, prepárate para lo peor y Equilibrio de Nash y Solución a una clase más amplia de juegos no cooperativos y Muestra que puede haber más de una solución y La extiende a un número finito de jugadores
¿Cómo jugar? jugar? ¿Cuál es la solución del juego? juego? y Minimax y Equilibrio de Nash y Equilibrio en estrategias dominantes y Eliminación de estrategias dominadas y Inducción hacia atrás
¿Qué é es un equilibrio? Columna Cara
Cruz
Cara
2,1
0,0
Cruz
0,0
1,2
Fila
Juego bipersonal, bipersonal, no cooperativo Definiciones: F: conjunto de estrategias mixtas de Fila pf = probabilidad de jugar la estrategia f Є F C: conjunto de estrategias mixtas de Columna pc = probabilidad de jugar la estrategia c Є C Objetivo: Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye un equilibrio
S l ió Solución
pf
pc
y Función F ió pagos Fil Fila: uf(f,c) (f )
y Лc , Лf,f son las probabilidades subjetivas
que f y c tienen sobre las decisiones del otro y pf,pc: estrategias t t i mixtas i t y pfЛc: probabilidad –desde desde el punto de vista de f- de que se juegue la estrategia (f,c)
S l ió Solución y Fila escoge la distribución de probabilidad (pf)
que maximiza el valor esperado de sus pagos:
E[pagosf] = ∑f∑cpfЛcuf(f,c) (f c) y Columna busca maximizar: E[pagosc] = ∑f∑cpcЛfuc(f,c)
Equilibrio de Nash Equilibrio de Nash: El equilibrio de Nash consiste en las conjeturas sobre la probabilidad de ocurrencia de las estrategias (Лc ,Л Лf, ) y la probabilidad de que dichas estrategias sean elegidas (pf, pc), tal que: 1 1. L conjeturas Las j t son correctas: t pf = Лf, pc = Лc; y 2. Cada jugador escoge (pf) y (pc) de forma que maximiza su utilidad esperada, dadas sus conjeturas.
E ilib i d Equilibrio de N Nash h Estrategias puras Un equilibrio de Nash en estrategias puras es un par (f*, (f , cc*)) tal que
uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y uc(f*, (f* c*) *) ≥ uc(f*,c) (f* ) para cada d estrategia t t i c dde C C.
¿Cuál es el equilibrio de Nash en estrategias puras? Columna Cara
Cruz
Cara
20,80
70,30
Cruz
90,10
30,70
Fila
Teorema Existencia (Nash) y Suponga que un juego tiene un número finito de estrategias
para cada jugador. Entonces existe al menos un equilibrio de Nash as en e estrategias est ateg as mixtas tas
¿Cuál es la estrategia mixta de equilibrio? Columna Cara
Cruz
Cara
20,80
70,30
Cruz
90,10
30,70
Fila
Equilibrio en estrategias mixtas Columna c
s
c
20,80
70,30
s
90,10
30,70
Fila
Estrategias E i Fila: Cara, pc; Sello, ps Columna: Cara, Лc; Sello Лs
E[ pagos fila ] = ∑∑ prπ c u (r , c) r
c
E[ pagos fila fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30) E[ pagoscol ] = ∑∑ prπ c u (r , c) r
c
E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)
Planteamiento del problema fila : max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30) s.t pc + p s = 1 pc , p s ≥ 0 columna : max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70) s.t
πc +πs =1 π c ,π s ≥ 0
Planteamiento del problema (II) fila : fil max [ pc (π c * 20 + π s * 70)
columna : max [π c ( pc * 80 + ps *10)
+ ps (π c * 90 + π s * 30)]
+ π s ( pc * 30 + ps * 70)]
s.t p s = 1 − pc
π s = 1− π c
[ pc (π c * 20 + π s * 70)} + (1 − pc )(π c * 90 + π s * 30)] ∂u ∂π ≤ 0, =0 ∂pc ∂pc − 70π c + 40π s ≤ 0
s.t max [π c ( pc * 80 + ps *10) + (1 − π c )( pc * 30 + ps * 70)] ∂u ∂p ≤ 0, =0 ∂π c ∂π c 50 pc − 60 ps ≤ 0
Función de reacción (Mejor respuesta) Лs Mejor respuesta de fila a cualquier l i estrategia t t i d de columna -70Л c+40Л s=0
fila : − 70π c + 40π s = 0
πc,π s ≥ 0 πc + πs = 1
7/11
4/11
Лc Л c+ Л s=1
Equilibrio en estrategias mixtas ps Mejor respuesta de columna l a cualquier l i estrategia de fila
50p c-60p s=0
columna : 50 pc − 60 ps = 0
5/11
pc + p s = 1 pc , p s ≥ 0
6/11
pc p c+ p s=1
Equilibrio de Nash Columna
Л c=4/11
cara
cruz
cara
20,80
70,30
cruz
90,10
30,70
p c=6/11
Fila
Batalla de los sexos: sexos: ¿Cuántos equilibrios de Nash hay? Ananías misa
fútbol
misa
4,1
0,0
fútbol
00 0,0
14 1,4
Tola
El dilema del prisionero II y Wally y Dilbert son compañeros de trabajo y Cada uno debe evaluar el desempeño del otro y La calificación determinará un aumento de sueldo y El aumento será mayor si el propio desempeño es superior al del otro
Dilbert
Wally
El dilema del prisionero II Dilbert Wally
“Rat out” (denigrar)
Alabar
“Rat out” (denigrar)
0,0
5,-1
Alabar
-1,5
1,1
Solución ó por dominación ó y Definiciones: y Estrategia dominante y Estrategia débilmente dominante y Estrategia dominada
y Eliminación iterada de estrategias dominadas
Dominación ó y ss’i domina estrictamente a si si y solo sí:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i z
s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ) ∀ s− i ∈ S −i y u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i
Dominación ó estricta y s’i es una estrategia estrictamente dominante
ppara el jjugador g i si:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i
s’i es superior a todas las otras estrategias de i
E t t gi estrictamente Estrategia ti t t dominante d i t Dilbert W ll Wally
“Rat out” (denigrar)
Alabar
“Rat Rat out” out (denigrar)
0,0
5,-1
Alabar
-1,5
1,1
Solución: {Rat-out, Rat-out}
Equilibrio y estrategias dominantes y Dilema del prisionero II: y Rat-Out estrictamente dominante para Wally y Dilbert y {Rat-out, Rat-out} es el equilibrio y El equilibrio q en estrategias g dominantes es el equilibrio q de Nash
El dilema del prisionero II
Dominación ó débil é y s’i es una estrategia débilmente dominante para el jugador i si
s’i domina débilmente a todas las otras estrategias de i
z
s*i domina débilmente a si si y solo sí: u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i y u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i
Ejemplo: estrategia débilmente dominante 2 1
Arriba
Izquierda
Derecha
7,3
5,3
Solución: {Arriba, Izquierda} Abajo
7,0
3,-1
Estrategias dominantes y Las estrategias dominantes definen la solución del juego y Racionalidad: y Los jugadores prefieren las estrategias dominantes, dominantes si existen
M h jjuegos no ti Muchos tienen estrategias t t i dominantes
Dominación ó Et t i d Estrategia dominada: i d s**i es dominada d i d por s’i si: i
ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ), ) ∀si ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ) ∃sˆ−i Estrategia no dominada s*i es no dominada si no existe s’i tal que:
ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i
Solución ó por dominación ó y Estrategias no dominadas preferibles a las dominadas y Un jugador racional no juega estrategias dominadas y Un U jugador j d racional i l no espera que los l otros t jjuegen
estrategias dominadas
Elimine estrategias indeseables
Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna
Izquierda
Derecha
Arriba
11 1,1
01 0,1
Medio
0,2
1,0
Abajo
0,-1
0,0
Fila
Problemas de la eliminación iterativa de estrategias dominadas y Capas de racionalidad y Una estrategia se vuelve dominada en la ronda de eliminación
# #15? y El orden de eliminación importa y Estrategias débilmente dominantes
y Múltiples resultados y Estrategias débilmente dominantes
y No existencia de estrategias dominadas
Ejemplo: eliminación iterativa de estrategias dominadas Columna
Izquierda
Centro
Derecha
Arriba
4,5
1,6
5,6
Medio
3,5
2,5
5,4
Abajo j
2,5 ,
2,0 ,
7,0 ,
Fil Fila
Ejemplo: eliminación iterativa de Ejemplo: estrategias dominadas Columna
Izquierda
Centro
Mala
Arriba
1,-1
-1,1
0,-2
Medio
-1,1
1,-1
0,-2
Mala
-2,0 ,
-2,0 ,
-2,-2 ,
Fil Fila
¿Cuál es la estrategia dominante? dominante? Columna C Cara
S ll Sello
Cara
1,-1
-1,1
Sello
-1,1
1,-1
Fila
¿Porqué podemos determinar las estrategias dominadas usando únicamente los pagos?
Competencia a la Bertrand y Dos firmas en un mercado pueden cargar precios alto, alto
medio, bajo y Si cargan el mismo precio precio, comparten el mercado equitativamente y Quien cargue el menor precio, precio gana todo el mercado
Competencia a la Bertrand Firma 2
Alto
Medio
Bajo
Alto o
6,6
0,10 0, 0
0,8
Medio
10,0
5,5
0,8
Bajo
8,0
8,0
4,4
Firma 1