martes, 21 de octubre de 2008

Dilema del prisionero

El Dilema del Prisionero es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teoría de Juegos, que ha sido utilizado como crítica hacia el enfoque de la elección racional (preconiza que todo acto humano, norma o institución debía ser juzgado según la "utilidad", esto es, según el placer o el sufrimiento que producen en las personas, no de acuerdo a criterios morales o normativos ajenos a las mismas).

Dos delincuentes son detenidos y encerrados en celdas de aislamiento de tal forma que no pueden comunicarse entre ellos. La policía tiene la certeza de que han participado en el robo a mano armada de un banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.

prisioneros

Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.

Que el prisionero X o Y elija “callar” o “delatar” dependerá de las expectativas que tengan acerca de lo que va a hacer el otro actor. Por esta razón, se puede decir que sigue una estrategia de actuación: se toma una decisión en función de lo que prevea que va a hacer su compañero, no solamente lo que desee individualmente.

Dilema del prisionero
Matriz de Pagos
(años de cárcel)

Preso Y
Lealtad Traición
Prisionero X Lealtad 2 / 2 10 / 1
Traición 1 / 10 5 / 5


Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.

En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.

Dilema del prisionero
Matriz de Pagos
(orden de preferencias)

  Preso Y
Lealtad Traición
Prisionero X Lealtad 2 / 2 * 4 / 1
Traición * 1 / 4 3 / 3


La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco.


El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratégico y simétrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.

No hay comentarios: