El dilema del prisionero

El dilema de los prisioneros se refiere a un tipo de juego económico en el que el equilibrio de Nash es tal que ambos jugadores están peor aunque ambos seleccionen sus estrategias óptimas.

El dilema de los prisioneros es un ejemplo clásico de un juego que involucra a dos sospechosos, digamos P y Q, arrestados por la policía y quienes deben decidir si confesar o no. Si uno confiesa pero el otro no, el preso que confiesa recibe una pena de prisión más leve, digamos 1 año, pero el preso que no confiesa recibe una pena muy dura, digamos 8 años. Si ninguno confiesa, ambos reciben penas más leves, digamos 2 años cada uno; pero si ambos confiesan, ambos obtienen un término estricto, digamos 4 años cada uno.

El juego se puede visualizar utilizando la siguiente matriz de pagos:

La estrategia óptima combinada para ambos prisioneros es no confesar. Es porque hacerlo resultaría en la pena de prisión mínima combinada para ellos. Pero como no pueden comunicarse ni cooperar, al intentar hacer lo mejor que pueden individualmente, eligen estrategias que los condenan a ambos.

Miremos el juego desde la perspectiva del Prisionero P. Si el Prisionero Q confiesa, es mejor que el Prisionero P confiese también porque de lo contrario recibiría una pena de 8 años en lugar de 4 años. De manera similar, si el recluso Q no confiesa, al recluso P le interesa confesar porque, al confesar, obtendría una pena de 1 año en lugar de 2 años. Por lo tanto, no importa lo que haga el Prisionero Q, confesar en la estrategia dominante del Prisionero P.

Ahora, consideremos el punto de vista del Prisionero Q. Él sabe que confesar es la estrategia dominante del Prisionero Q. No quiere no confesar y obtener una condena de 8 años y confiesa. Pero cuando lo hace, ambos reciben penas de prisión de 4 años cada uno. En última instancia, ambos están peor porque reciben 4 años cada uno en lugar de solo 2 años cada uno. Pero no pueden escapar de este desafortunado resultado porque no pueden cooperar, y cualquier otra estrategia sería peor para cada prisionero individualmente.

Equilibrio de Nash en el dilema del prisionero

El resultado del dilema del prisionero es un equilibrio de Nash. Un equilibrio de Nash es una combinación de estrategias tal que la empresa jugadora tiene algún incentivo para cambiar unilateralmente su estrategia. Cuando ambos jugadores de un juego tienen estrategias dominantes, el resultado que es la intersección de las estrategias dominantes es un equilibrio de Nash.

En el dilema de los prisioneros, dado que confesar es la estrategia dominante para cada prisionero, el equilibrio de Nash ocurre cuando ambos confiesan. Es el equilibrio de Nash porque ningún prisionero está mejor si cambia unilateralmente su estrategia. Por ejemplo, si el recluso P decide no confesar mientras que el recluso Q confiesa, el recluso P recibiría 8 años en lugar de 4 años. Por lo tanto, el prisionero P está peor si se aleja del equilibrio de Nash. No elegiría otra estrategia que la dictada por el equilibrio de Nash. Esto muestra cómo un equilibrio de Nash se refuerza a sí mismo y es estable.

Ejemplos

Aunque el dilema del prisionero discutido anteriormente es un concepto abstracto, muchas situaciones de la vida real se parecen mucho a él. Por ejemplo:

  • Las empresas saben que si no hacen publicidad, pueden mantener su cuota de mercado existente y embolsarse el presupuesto de publicidad ahorrado como ganancia adicional, pero hacen publicidad de todos modos porque cada empresa teme que si no hace publicidad y la otra empresa sí lo hace, perder cuota de mercado. Debido a que ambas empresas tienen el mismo temor, ambas se anuncian, ambas tienen ganancias más bajas (debido al mayor gasto en publicidad) y ninguna gana participación de mercado.
  • Las firmas que decidan si contratar a un abogado para que las represente en el arbitraje estarían colectivamente mejor si decidieran no contratar a un abogado. Pero cada firma contrata a un abogado por temor a que si la otra firma contrata a un abogado y ellos no lo hacen, la probabilidad de que la otra firma gane en el arbitraje aumentaría significativamente.
  • Las empresas en oligopolio estarían mejor si pudieran restringir su producción y cobrar un precio de monopolio. Pero dado que la colusión es ilegal, ambos producen una mayor producción que reduce la rentabilidad de cada empresa. El modelo de Cournot es una ilustración de este dilema de los prisioneros.

Temas relacionados

  • Equilibrio de Nash
  • Matriz de pagos
  • Estrategia Dominante
  • Estrategia dominada
  • Modelo de Cournot
  • oligopolio