martes, 27 de marzo de 2018

EL DILEMA DEL PRISIONERO


Keawe [1] está desesperado y a primera vista no se entiende por qué. Es poseedor de una botella mágica que le proporciona todo tipo de riquezas y ventajas. La adquirió por 2 céntimos y le sirvió para curar a su mujer, gravemente enferma, y para vivir en un palacio repleto de lujos. El problema es que la botella es del diablo: la puso en circulación en su momento por un precio elevado con dos condiciones: a) sólo puede cambiar de titularidad si alguien la adquiere, por billetes o monedas enteras, a un precio inferior al que pagó el último comprador; b) el poseedor que muera sin haberse desembarazado de ella por esta vía irá directamente al infierno. Dado que Keawe pagó dos céntimos tiene que venderla por uno, y aquel que la adquiera ya no podrá desprenderse de ella al no haber ninguna moneda inferior. ¿Quién la adquiriría en estas condiciones, sabiendo que es un pasaporte seguro hacia el infierno? Keawe debería haber sabido que nunca se desprendería de ella, y si la compró fue exclusivamente para salvar a su mujer. Pero ¿y el anterior propietario? ¿Cómo se atrevió a comprarla sabiendo que aquél a quien a vendiera ya no podría librarse de ella? ¿Y el anterior? Es evidente que cuando la botella tenía un precio elevado –digamos 10.000 $- era fácil de vender por un precio de 9.999 $. Pero ¿en qué momento misterioso la botella se convirtió en algo intransmisible?

El economista Martin Shubik diseño un juego similar llamado “la subasta del dólar”, aunque yo sugiero que imaginen un billete de 50€. El juego es el siguiente: los jugadores pueden pujar para llevarse el billete. Se trata en parte de una puja ordinaria, en la que cada uno tiene que superar la puja precedente y el mejor postor se llevará el billete; pero existe una condición adicional: aquel que haga la segunda mejor puja debe pagar esa cantidad sin llevarse nada a cambio. Es tentador y parece seguro - tentación y seguridad parecen ser los parámetros clave del juego- realizar las primeras pujas: 1 céntimo por un billete de 50€. Y así las siguientes. Pero al igual que con la botella del diablo, hay un momento en que la cosa se tuerce. ¿Hasta dónde llegarán las pujas? Cabría pensar que hasta 50€, pero no es así: en ese momento el asunto ha adquirido una dinámica propia. El licitador que acabe pujando 50€ por el billete de 50€ -anulando así todo beneficio- tiene detrás al penúltimo licitador que deberá pagar la cantidad ofertada previamente –digamos 49€-. Éste estará entonces tentado a ofrecer 51€ por el dichoso billete disminuyendo su pérdida de 49€ a 1€. Obsérvese que el juego, que ha empezado como una posibilidad de ganancia, se ha convertido sin transición aparente en un intento desesperado de evitar pérdidas. Pero si se produce la puja por 51€ el anterior licitador tiene ante sí un nuevo dilema: la pérdida cierta de 50€ o la probabilidad de limitar la pérdida a 2€. Y así en adelante.


Hay juegos que tienen una solución racional. Este es el caso del reparto de una tarta entre dos personas cuando se asigna a una de ellas la tarea de cortarla y a la otra la de elegir el trozo que prefiera. Si asumimos que ambos jugadores pretenden llevarse el máximo de tarta, es obvio que el segundo jugador escogerá el trozo más grande de los que el primero haya producido, y éste, por tanto, se llevará el menor. De este modo la estrategia del cortador debe estar dirigida a maximizar el mínimo que sabe que inevitablemente se va a llevar, y eso lo consigue cortando la tarta en dos partes iguales. Esto se conoce como “teorema minimax”, que establece que en los juegos bipersonales de suma cero, donde cada jugador conoce de antemano la estrategia de su oponente y sus consecuencias, existe una estrategia que permite a ambos jugadores minimizar la pérdida máxima esperada. Fue enunciado por el matemático John Von Neumann en 1928 en un documento titulado “Teoría de juegos de salón”. Años más tarde, en 1944, Von Neumann y el economista de Princeton Oskar Morgenstern, publicarían “Teoría de juegos y comportamiento económico”.

¿Hay entonces una vía racional de acción ante cada dilema? Desgraciadamente no. En 1949 la URSS detonó su primera bomba atómica, mucho antes de lo previsto por occidente, iniciando así la carrera nuclear; era una situación única en la historia, en la que un país podía alcanzar la fuerza suficiente para borrar por completo a sus enemigos del mapa. En 1950 surgieron muchas voces en Estados Unidos pidiendo a Truman que lanzase un ataque devastador contra la URSS. La que tuvo más difusión fue la del Secretario de Estado de Marina Francis P. Matthews, que urgió a los americanos a convertirse en “agresores por la paz”; a continuación el presidente recibió cientos de cartas cuya lectura resulta bastante descorazonadora. Un pastor presbiteriano escribió a Truman: «Estamos un 110% a favor de su idea de bombardear a Stalin. Cuando en la granja queremos librarnos de las mofetas que matan nuestros pollos, vamos a sus guaridas y las volamos; con Stalin igual que con las mofetas, vuélelo y dele lo que se merece». Otros fueron aún más lejos y sugirieron bombardear también China. Por lo general tampoco los que se manifestaban horrorizados ante la idea de volatilizar fríamente cientos de miles de vidas conseguían racionalizarlo con claridad. Algunos llegaron a atribuirlo a una conjura del Vaticano –Matthews era un ferviente católico- destinada a que las superpotencias se destruyeran entre sí para gobernar sobre las ruinas resultantes. Otros compararon al Secretario de Estado con Hitler, el propio Stalin, e incluso la Inquisición española. Es curioso comprobar que la mayoría de ellos, estuvieran a favor o en contra del bombardeo, parecían convencidos de que todo el mundo compartía su respectiva opinión.


Pero no sólo eran anónimos ciudadanos –y Matthews- los que se manifestaban a favor del “ataque preventivo”. Bertrand Russell abogó decididamente por un ultimátum a la URSS seguido por un inmediato ataque en caso de que ésta no aceptase renunciar a su soberanía a favor de un gobierno mundial de los Estados Unidos [2]. El propio Von Neumann fue más directo: «Si me preguntan por qué no bombardearlos mañana contestaré ¿por qué no hoy? Si me dicen “hoy a las cinco” contestaré ¿por qué no a la una?». La carrera armamentística nuclear puede ser vista como un clásico ejemplo del “dilema del prisionero”. Fue formulado por primera vez en 1950 por Merril Flood y Melvin Dresher [3] de la RAND Corporation, un think tank dedicado, ente otras cosas, a estudiar estrategias para la nueva era nuclear. Imaginemos a dos delincuentes que han asaltado un banco y son detenidos por la policía, que no tiene pruebas concluyentes contra ellos. Los encierran en distintas celdas, y a cada uno de ellos por separado les proponen simultáneamente un mismo trato: tenemos suficientes pruebas para meteros un año en la cárcel por un cargo menor, pero si delatas a tu compañero quedarás libre y a él lo condenaremos cuatro años; no obstante, si ambos os delatáis recíprocamente os condenaremos a ambos a tres años de cárcel. El dilema se puede representar de la siguiente forma:

“Traicionar” equivale a delatar al compinche, y “cooperar” a renunciar a hacerlo. En cada celda está el resultado entre paréntesis medido en años de prisión, correspondiendo el primer término al jugador 1. Por ejemplo, en la celda superior derecha el resultado (-4, 0) refleja que si el delincuente/jugador 1 coopera, y el delincuente/jugador 2 traiciona, el primero es condenado a cuatro años y el segundo queda libre -el signo negativo hace referencia a que el resultado es desfavorable-.

Es evidente que el mejor resultado en conjunto es el representado en la celda superior izquierda: ambos cooperan y reciben un año de condena cada uno. Sin embargo obsérvese desde este punto de vista: para cada jugador, independientemente de lo que haga el otro, lo más “racional” –el resultado esperado es superior- es traicionar. Obsérvese desde la perspectiva del jugador 2. Si el jugador 1 ha cooperado, el 2 queda libre si ha traicionado y es condenado a un año si ha cooperado a su vez; si el 1 ha traicionado, el 2 es condenado a 3 años si ha traicionado a su vez, y a cuatro años si le ha ocurrido cooperar. En este último caso además, se le ha quedado cara de tonto, cosa que no es relevante a efectos de teoría de juegos pero sí en el mundo real. Pero, si desde la perspectiva de cualquiera de los jugadores, es más rentable traicionar, es inmediato que se den cuenta de que el otro se encuentra en una posición simétrica. De modo que la solución “racional” al que los jugadores del dilema del prisionero se ven impulsados es la celda inferior derecha (-3, -3): ambos traicionan y reciben tres años de condena. Lo perturbador del dilema es que parece conducir a una solución distinta a lo requerido por el bien común: casilla superior izquierda (-1, -1).


En Doctor Strangelove Kubrick presentaba el precario equilibrio nuclear entre los bloques americano y soviético como una pesadilla, un momento de locura protagonizado por unos políticos chiflados dominados por la testosterona [4]. Ojalá hubiera sido así: querría decir que en realidad había existido una solución racional al problema. Pero obsérvese la decisión de Estados Unidos y la URSS de aumentar su arsenal nuclear y compárese con el dilema del prisionero: ambos países habrían estado mejor si ninguno la hubiera emprendido, pero el dilema los empujaba a una desdichada espiral armamentística. Desgraciadamente en política el dilema del prisionero no es infrecuente.

Hay un motivo para la esperanza. En el mundo real la mayoría de los dilemas del prisionero son iterados -se van repitiendo-. Y ante un dilema del prisionero iterado la cooperación sí es la mejor estrategia. Consiste en comenzar cooperando y efectuar el siguiente movimiento en función de lo que haya hecho el oponente: si a su vez cooperó se continúa cooperando, y si traicionó es traicionado en la siguiente jugada. Es lo que en inglés se conoce como tit for tat, es una estrategia evolutivamente estable –la teoría de juegos también se aplica en psicología evolutiva- y parece explicar que nuestra tendencia natural a la equidad –o, si lo prefieren, nuestra tendencia a penalizar a los aprovechados- es uno de nuestros módulos morales más sólidos. Más sobre esto otro día.




Notas:
[1] El diablo de la botella, Robert Louis Stevenson.
[2] Obsérvense los niveles de inhumanidad a los que conduce una aplicación “racional” del utilitarismo.
[3] Aunque el nombre, y esquema más conocido, se debe a Albert Tucker, también de la RAND Corporation.
[4] El sexo es omnipresente en la película, que comienza con misiles alzándose en amenazadoras erecciones y bombarderos copulando con aviones nodriza, y culmina con orgásmicas explosiones nucleares. Recordemos además que el general Ripper –fíjense en los nombres de todos los protagonistas- desencadena el conflicto por una impotencia sobrevenida que atribuye a una conspiración soviética.

¿Desean saber más? Lean El dilema del prisionero, de William Poundstone. También pueden aproximarse a los fundamentos matemáticos de la teoría de juegos a través del curso impartido por la Universidad de Stanford a través de Coursera.

6 comentarios:

Anónimo dijo...

Qué bueno, mi admirado don NAVARTH

Urbi et Orbi

Bruno dijo...

Menos mal que no ha incluido un supuesto, en la realidad muy frecuente, de que no es obligatorio jugar. Una opción a veces muy racional y a veces muy irracional. Entonces cruzamos en la matriz tres variables: No juega, juega A y juega B.
El teorema de la telaraña, que se suele explicar por las curvas de demanda y oferta, también se puede aplicar a la probabilidad de que el otro haga algo. En sencillo, si este año las patatas son caras, ¿sembramos patatas para el siguiente?
También puede considerar que la curva de demanda de la botella, conforme va cambiando de dueño, es muy inelásticamente decreciente, llegando a valores negativos. A cada transacción va a ser mucho más difícil la venta. Y con todo eso llegamos al mercado de futuros. No es de extrañar que la teoría de juegos sea una parte de la Investigación Operativa muy ligada a la economía y a la gestión de decisiones.
En política los tesoreros de los partidos tienen la solución: pondrán la botella condenada a nombre de un muerto. El anterior tesorero.

Thomson/Thompson dijo...

Magnifico artículo, Fernando. Lo guardo para leerlo nuevamente antes de la esperada continuación. Un abrazo

viejecita dijo...

¡ Qué genial , Don Navarth !
Voy a releerlo tres o cuatro veces para asegurarme de haberlo entendido a fondo, y poderlo contar a mi vez.
Muchas Gracias

nonpossumus dijo...

Gran entrada. Es una gozada leerle, querido Navarth. Quedamos a la espera de su continuación.

yapoco dijo...

Muy muy interesante.
Y, con permiso, el problema de la botella está en la misma línea del condenado a muerte en un plazo de 7 días, pero con la condición, para ajusticiarlo, de que el día de la ejecución le pillaría por sorpresa.
Como el último día no podría ser, pues no habría sorpresa, razonó que tampoco el penúltimo, pues ya sabría que el último no sería, y así sucesivamente. Llegó el martes y lo apiolaron.
Gracias por el blog.