囚人のジレンマ：協力のゲーム理論的パラドックス

ゲーム理論の基本的な問題で、合理的な行動者が相互協力のほうが集団として望ましい結果をもたらす場合でも協力しない理由を示す。経済学、生物学、政治学で重要。

概要

囚人のジレンマは、個人の合理性と集団の利益が衝突することを示す、ゲーム理論の標準的な例である。最も単純な形では、2人のプレーヤーが互いの選択を知らないまま、それぞれ協力するか裏切るかを選ぶ。自己利益に基づく合理的な推論をすると、両者とも裏切ることになり、その結果は、両方が協力した場合よりも各自にとって悪いものになる。

形式的な構造

数学的には、このジレンマは利得行列で表される。各プレーヤーは、相手が何をしてもより高い利得をもたらす優越戦略としての「裏切り」を持つ。その結果、両者が裏切るナッシュ均衡が成立するが、相互協力の利得は双方にとってそれより高い。この均衡と社会的最適との緊張関係こそが、核心的なパラドックスである。

反復ゲームと戦略

ゲームが繰り返される場合、つまり反復囚人のジレンマでは、さまざまな戦略が成功しうる。大会や研究で示された古典的な知見によれば、tit-for-tat（最初は協力し、その後は相手の直前の行動をまねる）のような単純な相互的戦略は、持続的な協力を促しやすい。反復、評判、そして将来の帰結の可能性はインセンティブを変え、協力的な行動を生みやすくする。

応用と例

経済学：価格競争に直面する企業や公共財の提供。
国際関係：軍拡競争と軍縮交渉。
生物学：生物や社会性のある種における協力の進化。
社会的ジレンマ：気候変動の緩和、共有資源の管理。

歴史、変種、注目点

この概念は20世紀半ばのゲーム理論研究から現れ、初期の解説で現在のよく知られた名称が与えられた。多くの変種では、利得を変えたり、プレーヤーの数を増やしたり、コミュニケーションを認めたりする。研究者は現在も、情報、コミュニケーション、強制、ネットワーク構造が結果をどう変えるかを探究している。基本的なパラドックスについては背景資料、またはゲーム理論の入門的概説を参照するとよい。

区別：囚人のジレンマは調整ゲームとは異なる。ここでは、個人のインセンティブが、双方にとって最良の結果からプレーヤーを遠ざける。単純であるため協力研究の有用なモデルになるが、現実の状況には、制度、反復的相互作用、拘束力のある合意など、ジレンマを和らげる追加の仕組みが含まれることが多い。