Dos delincuentes son detenidos y encerrados en celdas de aislamiento de tal forma que no pueden comunicarse entre ellos. La policía tiene la certeza de que han participado en el robo a mano armada de un banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.
Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.
Que el prisionero X o Y elija “callar” o “delatar” dependerá de las expectativas que tengan acerca de lo que va a hacer el otro actor. Por esta razón, se puede decir que sigue una estrategia de actuación: se toma una decisión en función de lo que prevea que va a hacer su compañero, no solamente lo que desee individualmente.
Dilema del prisionero
Matriz de Pagos
(años de cárcel)
Preso Y | |||
Lealtad | Traición | ||
Prisionero X | Lealtad | 2 / 2 | 10 / 1 |
Traición | 1 / 10 | 5 / 5 |
Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.
En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.
Dilema del prisionero
Matriz de Pagos
(orden de preferencias)
  | Preso Y | ||
Lealtad | Traición | ||
Prisionero X | Lealtad | 2 / 2 | * 4 / 1 |
Traición | * 1 / 4 | 3 / 3 |
La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco.
El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratégico y simétrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.
No hay comentarios:
Publicar un comentario