概要
囚人のジレンマは、個人の合理性と集団の利益が衝突することを示す、ゲーム理論の標準的な例である。最も単純な形では、2人のプレーヤーが互いの選択を知らないまま、それぞれ協力するか裏切るかを選ぶ。自己利益に基づく合理的な推論をすると、両者とも裏切ることになり、その結果は、両方が協力した場合よりも各自にとって悪いものになる。
形式的な構造
数学的には、このジレンマは利得行列で表される。各プレーヤーは、相手が何をしてもより高い利得をもたらす優越戦略としての「裏切り」を持つ。その結果、両者が裏切るナッシュ均衡が成立するが、相互協力の利得は双方にとってそれより高い。この均衡と社会的最適との緊張関係こそが、核心的なパラドックスである。
反復ゲームと戦略
ゲームが繰り返される場合、つまり反復囚人のジレンマでは、さまざまな戦略が成功しうる。大会や研究で示された古典的な知見によれば、tit-for-tat(最初は協力し、その後は相手の直前の行動をまねる)のような単純な相互的戦略は、持続的な協力を促しやすい。反復、評判、そして将来の帰結の可能性はインセンティブを変え、協力的な行動を生みやすくする。
応用と例
- 経済学:価格競争に直面する企業や公共財の提供。
- 国際関係:軍拡競争と軍縮交渉。
- 生物学:生物や社会性のある種における協力の進化。
- 社会的ジレンマ:気候変動の緩和、共有資源の管理。
歴史、変種、注目点
この概念は20世紀半ばのゲーム理論研究から現れ、初期の解説で現在のよく知られた名称が与えられた。多くの変種では、利得を変えたり、プレーヤーの数を増やしたり、コミュニケーションを認めたりする。研究者は現在も、情報、コミュニケーション、強制、ネットワーク構造が結果をどう変えるかを探究している。基本的なパラドックスについては背景資料、またはゲーム理論の入門的概説を参照するとよい。
区別:囚人のジレンマは調整ゲームとは異なる。ここでは、個人のインセンティブが、双方にとって最良の結果からプレーヤーを遠ざける。単純であるため協力研究の有用なモデルになるが、現実の状況には、制度、反復的相互作用、拘束力のある合意など、ジレンマを和らげる追加の仕組みが含まれることが多い。