viernes, 3 de junio de 2011

TEORIA DE JUEGOS


John von Neumann


John von Neumann (su nombre en húngaro es Margittai Neumann János Lajos) es un matemático húngaro considerado por muchos como la mente más genial del siglo XX, comparable solo a la de Albert Einstein.


Nació en Budapest, Hungría, hijo de un rico banquero judío. Tuvo una educación esmerada. Se doctoró en matemáticas por la Universidad de Budapest y en químicas por la Universidad de Zurich. En 1927 empezó a trabajar en la Universidad de Berlín. En 1932 se traslada a los Estados Unidos donde trabajará en el Instituto de Estudios Avanzados de Princeton.
Sus aportaciones a la ciencia económica se centran en dos campos:

Es el creador del campo de la Teoria de juegos. En 1928 publica el primer artículo sobre este tema. En 1944, en colaboración con Oskar Morgenstern, publica la Theory of Games and Economic Behavior.  La teoría de juegos es un campo en el que trabajan actualmente miles de economistas y se publican a diario cientos de páginas. Pero además, las formulaciones matemáticas descritas en este libro han influido en muchos otros campos de la economía. Por ejemplo, Kenneth Arrow y Gerald Debreu se basaron en su axiomatización de la teoría de la utilidad para resolver problemas del Equilibrio General.

Oskar Morgenstern


Nacido en Gorlitz, Silesia, estudia en las universidades de Viena, Harvard y New York. Miembro de la Escuela Austriaca y avezado matemático, participa en los famosos  "Coloquios de Viena" organizados por Karl Menger (hijo de Carl Menger) que pusieron en contacto científicos de diversas disciplinas, de cuya sinergia se sabe que surgieron multitud de nuevas ideas e incluso nuevos campos científicos.
Emigra a Estados Unidos durante la segunda guerra mundial ejerciendo la docencia en Princeton. Publica en 1944, conjuntamente con John von Neuman, la "Theory of Games and Economic Behavior

TEORÍA DE JUEGOS


Los psicólogos destacan la importancia del juego en la infancia como medio de formar la personalidad y de aprender de forma experimental a relacionarse en sociedad, a resolver problemas y situaciones conflictivas.Todos los juegos, de niños y de adultos, juegos de mesa o juegos deportivos, son modelos de situaciones conflictivas y cooperativas en las que podemos reconocer situaciones y pautas que se repiten con frecuencia en el mundo real. 
El estudio de los juegos ha inspirado a científicos de todos los tiempos para el desarrollo de teorías y modelos matemáticos. La estadística es una rama de las matemáticas que surgió precisamente de los cálculos para diseñar estrategias vencedoras en juegos de azar. Conceptos tales como probabilidad, media ponderada y distribución o desviación estándar, son términos acuñados por la estadística matemática y que tienen aplicación en el análisis de juegos de azar o en las frecuentes situaciones sociales y económicas en las que hay que adoptar decisiones y asumir riesgos ante componentes aleatorios.



Conceptos básicos

Matriz de pago 

En teoría de juegos, la matriz de pagos (a veces también llamada matriz de recompensas) es una matriz que resume la información dada por las funciones de pago en un juego rectangular o en un juego extensivo en su forma normal.


Matriz de pagos par juegos bipersonales de suma cero

Sea (N,Dj,φj) un juego rectangular, bipersonal y de suma cero (es decir, aquel en que la ganancia de un jugador es igual la perdida del otro). Si n y m denotan la cantidad de estrategias del jugador 1 y 2 respectivamente, entonces la matriz de pagos del juego, de tamaño nxm se define entrada a entrada como:

Esto es, la entrada i,j representará el pago que resulta para el jugador 1 cuando éste siguió su estrategia i y el jugador 2 por su parte usó la estrategia j. Para éste tipo de juegos conocer los pagos del jugador 1 es suficiente para conocer los pagos del jugador 2, de modo que la matriz resume toda la información necesaria para calcular dichos pagos.

Ejemplo.

Consideremos el juego piedra, papel o tijera, donde el perdedor debe pagar una unidad monetaria al ganador y en caso de empate no hay pago para ninguno. La siguiente tabla puede considerarse una matriz de pagos para el juego:
Piedra
Papel
Tijera
Piedra
0
-1
+1
Papel
+1
0
-1
Tijera
-1
+1
0
Si numeramos las estrategias piedra, papel y tijera como 1, 2 y 3 respectivamente, la matriz de pagos será por definición:


Matriz de pagos para juegos bipersonales
En general no es posible saber cual es el pago para el jugador 2 conociendo solamente los pagos del jugador 1. Cuando el juego no es de suma cero una matriz con entradas unidimensionales no puede mostrar toda la información sobre los pagos; para lograrlo es necesario introducir un vector bidimensional (que representará el pago para el jugador 1 y 2 respectivamente) en cada entrada de la matriz. En fórmulas, esto quiere decir que la matriz de pagos para un juego bipersonal en general está dada por:

Esto es, la entrada i,j será el vector (a,b), donde a es el pago para el jugador 1 y b es el pago para el jugador 2 cuando el jugador 1 elige la estrategia i y el jugador 2 por su parte elige la estrategia j.

 

Ejemplo.

En el juego de piedra papel o tijera se pueden cambiar los pagos para hacerlo un juego de suma distinta de cero. Supongamos que una persona externa al juego paga una unidad monetaria al ganador, mientras que el perdedor no paga nada. En caso de empate, ninguno de los dos gana nada. Si volvemos a numerar las estrategias piedra, papel y tijera con 1, 2 y 3 respectivamente entonces la matriz de pagos del juego esta dada por:
Desde luego, la matriz de pagos de cualquier juego de suma cero puede expresarse del mismo modo, pero en esos casos habrá información duplicada. En el primer ejemplo la matriz de pago general para juegos bipersonales resultaría:
 Notese que al ser de suma cero la segunda entrada de cada vector es justamente el inverso aditivo de la primera entrada. De ahi que para juegos de suma cero sea suficiente conocer una sola de las componentes y que se elimine la otra.
Punto silla

Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja los máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja. 
Al paraboloide hiperbólico también se lo denomina silla de montar por su gráfica. Tiene la peculiaridad de contener rectas en su superficie.

Juegos no estrictamente determinado.
Esta clase de juegos tiene más de una alternativa de juego por la que los jugadores podrian ganar, por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla por que el número menor de todos los máximos de las columnas no es igual al número mayor de los menores de los renglones, dando como resultado un juego no estrictamente determinado.
ESTRATEGIA ALEATORIA:


Es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución de probabilidad. Por ejemplo, el jugador renglón podría la siguiente distribución de probabilidad:

RESULTADO
PROBABILIDAD
Renglón1
2/3
Renglón 2
1/3



Si el jugador renglón utiliza esta distribución de forma predecible, como cuando selecciona repetidamente el renglón 1 dos veces y luego el renglón 2 una vez, el jugador columna podría descubrir la estrategia de responder con el fin de reducir al mínimo su eficacia. Por lo tanto, el jugador renglón debe emplear algún dispositivo aleatorio, como la rueda giratoria que se mostro anteriormente (ruleta de pueblo), con el cual elegiría 1  dos terceras partes del tiempo.
Los juegos de punta de silla están estrictamente determinados; es decir, los jugadores adoptan estrategias pura, y el curso del juego se determina por adelantado (suponiendo que los jugadores son agresivos y capaces). Los juegos sin punto de silla no están estrictamente determinados; si un jugador emplea una estrategia aleatoria, el curso del juego estará sujeto al azar, y todo puede suceder. No hay valor fijo para el juego; solo hay un valor muy probable o esperado.


Estrategias aleatorias y puras

Si un jugador renglón adopta una estrategia aleatoria, el jugador columna puede responder con una estrategia pura o con una aleatorizada.
Una estrategia pura es un término empleado para designar un tipo de estrategias en teoría de juegos. Cada jugador tiene a su disposición un conjunto de estrategias. Si un jugador elige una acción con probabilidad 1 entonces está jugando una estrategia pura. Esto la diferencia de la estrategia mezclada, donde jugadores individuales eligen una distribución de probabilidad sobre muchas acciones.

Criterio Minimax

Sucede cuando el jugador escoge una estrategia aquella, que entre las estrategias posibles, minimiza el costo de la mejor contra-estrategia del otro jugador. 

Criterio Maximin


Sucede cuando el jugador escoge una estrategia que, entre las estrategias posibles, maximiza el ingreso de las estrategias mas débiles del jugador oponente. En otras palabras, el criterio maximin  selecciona del mayor de los valores mínimos  que pueden resultar cada estrategia.


Estrategias
En teoría de juegos, la estrategia de un jugador es un plan de acción completo para cualquier situación que pueda acaecer; determina completamente la conducta del jugador. La estrategia de un jugador determinará la acción que tomará el jugador en cualquier momento del juego, para cualquier secuencia de acontecimientos hasta ese punto. Un perfil de estrategia es un conjunto de estrategias para cada jugador que especifica completamente todas las acciones en un juego. Un perfil de estrategia debe incluir solamente una estrategia para cada jugador.



Ejemplo para encontrar el valor del juego utilizando los criterios anteriormente explicados




ESTRATEGIA DOMINANTE Y REDUCCIÓN DEL JUEGO


En la primera tabla eliminamos la estrategia C del jugador renglon, ya que la estrategia A del jugador renglon domina dicha estrategia


En la segunda tabla eliminamos la estrategia C del jugador columna, ya que la estrategia B del jugador columna domina dicha estrategia C-
En la siguiente tabla eliminamos la estrategia E del jugador columna, ya que ya estrategia B del jugador columna, domina dicha estrategia E
En la tabla anterior eliminamos la estrategia D del jugador columna, ya que la estrategia B del jugador columna domina dicha estrategia.


En la siguiente tabla eliminamos la estrategia F del jugador columna, ya que la estrategia B del jugador columna domina dicha estrategia.


En la tabla anterior eliminamos la estrategia B del jugador renglón, ya que es dominada por la estrategia A del jugador renglon.


La matriz resultante es
Mostramos los valores maximin y minimax


Como vemos  todas las estrategias en este punto son admisibles.
Se redujo el juego de una matriz 4x6 a un juego 2x2.

EJERCICIO 2
La matriz de pagos de un juego con dos alternativas es la siguiente

Jugador Columna
I
II
Jugador renglón
I  (3/4)
3
-2
II (1/4)
-1
5

La probabilidad de que el jugador renglón juegue con la estrategia I es de ¾ y la probabilidad de que utilice la estrategia II entonces es de ¼

Valor esperado para el jugador Renglon si el jugador columna mantiene la estrategia I


Valor esperado para el jugador Renglon si el jugador columna mantiene la estrategia II


Podemos deducir que el valor esperado a ganar si el jugardor columna juega con la estrategia I es 2, y cuando juega con la estrategia II es de 1/4


La importancia de la Teoría de Juegos esta en jugar de tal manera que el valor esperado obtenido sea el máximo.


Buscamos las probabilidades con las que debe jugar el jugador Renglon para obtener su máximo valor esperado 
De las ecuaciones anteriores, resulta un sistema de ecuaciones lineales asi.


P1+P2 =1

(3)*( P1)+(-1)P2= Vesperado (jugador renglon-estrategia I)

(-2)*(P1)+(5)*(P2) =Vesperado( jugador renglo -estrategia II)

Como P2 = (1-P1), Reemplazamos en la segunda ecuación y tercera ecuación tenemos:

(3)*(P1) + (-1)*(1-P1) = Vesperado (jugador renglón-estrategia I)

(-2)*(P1) + (5)*(1-P1) =Vesperado ( jugador renglo -estrategia II)


Para obtener  probabilidades que me maximicen el valor esperado , utilizaremos el método grafico, para gráficar las funciones le damos valores de P1(0) y  P1(1).

Vesperado(jugador renglon-estrategia I)  

Si P1(0)                                    (3)*(0) + (-1)*(1-0) = -1
Si P1(1)                                    (3)*(1) + (-1)*(1-1)  =3    

Vesperado ( jugador renglo -estrategia II)
Si P1(0)                                    (-2)*(0) + (5)*(1-0) = 5
Si P1(1)                                    (-2)*(1) + (5)*(1-1) = -2

Debemos calcular el valor del punto de intersección entre las resctas ya que en ese punto se encuentra el valor esperado maximo

(3)*(P1) + (-1)*(1-P1)  = (3*P1) -1+ P1   =  4*P1-1
(-2)*(P1) + (5)*(1-P1)  = (-2*P1) +5-(5*P1) = -7*P1+5

Con las dos ultimas ecuaciones hallamos el valor de P1 

(4*P1)-1= (-7*P1)+5
(7*P1)+(4*P1)=5+1

11*P1=6
P1 =6/11
entonces si P1  es 6/11, P2= 5/11

Entonces el valor del juego es de 

(-2)*(6/11)+(5)*(5/11) = 13/11

EUMED.NET, Enciclopedia virtual, Grandes economistas<http://www.eumed.net/cursecon/economistas/neumann.htm>
INVESTIGACION DE OPERACIONES II, Conceptos <http://modelosdeproduccion2.crearblog.com/?p=20>

No hay comentarios:

Publicar un comentario