【第100回】なぜ「パラドックス」が「最強に面白い」のか?
「囚人のジレンマ」
2人の銀行強盗が警察に捕まったとする。検察官は2人に罪を認めさせたいが、2人の囚人は、もちろん刑期を短くしたいと願っている。そこで検察官は、2人を別々の独房に入れて、各々に次のように言った。「お前も相棒も黙秘を続けたら、銀行強盗は証拠不十分で立件できない。せいぜい武器不法所持の罪で2人とも1年の刑期というところだろう。逆に2人とも銀行強盗を自白したら、刑期はそろって5年になる。しかし、今、お前が正直に2人で銀行強盗をやったと自白すれば、捜査協力の返礼としてお前を無罪放免にしてやろう。ただし、相棒は10年の刑期になるがね。どうだ?」
囚人は、相棒に協調して黙秘を続けるべきか、相棒を裏切って自白すべきか、考え込むだろう。さらに検察官は、次のように催促する。「実は、お前の相棒にもまったく同じことを話してあるんだ! もし相棒が先に自白してお前が黙秘を続けたら、相棒は無罪放免だが、お前は10年も牢獄行きだぞ! さあ、どうする? 急いで自白しなくていいのか?」
この状況で、2人の囚人は深刻なジレンマに陥る。もしお互いに黙秘を続ければ、1年の刑期で2人とも出所できるため、それが2人にとって最もよい結果であることは明白である。しかし、もし相棒が裏切ったらどうなるか? 相棒はすぐに出所して自由になるが、自分は10年間も牢獄に閉じ込められてしまう。そこで、結果的に、2人の囚人はそろって自白して、どちらも5年の刑になってしまう。そして2人は刑務所で考え込むわけである。お互いが黙秘していればたった1年で済んだはずなのに、もっとうまくやる方法はなかったのか。もっと「理性的」な選択はなかったのかと……。
プリンストン大学の数学者ジョン・ナッシュは、この種の社会的ジレンマを数学的に解析して現代ゲーム理論の基礎を築き、一九九四年にノーベル経済学賞を受賞した。ナッシュは、囚人のジレンマのような状況で、一方のプレーヤーが最適な戦略を採ったとき、他方のプレーヤーもそれに対応する戦略を最適にするような「ナッシュ均衡」が存在することを証明したのである。
「均衡」あるいは「安定」という概念は、多くの科学分野に登場する。たとえば、紅茶に砂糖を入れ続けると、ある時点で化学的に「均衡」な状態になり、砂糖は溶けなくなって沈殿し、紅茶もそれ以上は甘くならなくなる。ナッシュは、囚人のジレンマにおいても各自が最善を尽くす均衡状態があることを示したが、それは2人の囚人がどちらも「自白する」選択なのである。この選択では、どちらの囚人も5年の刑になる以上、それが2人にとって最適とはいえないように映るが、黙秘して相手に裏切られて10年の刑になるよりはマシだということである。つまり最悪を回避するのが均衡なのである。
ところが、トロント大学の心理学者アナトール・ラパポートは、ナッシュ均衡が必ずしも「理性的な選択」を意味するわけではないと主張する。彼は、「理性的」な人間であれば、あくまで相互に「意識して」協調して黙秘を貫くはずだという。なぜなら、2人が疑心暗鬼を振りきって取り調べに耐え抜くことさえできれば、2人とも1年の刑期で出所できるわけで、それが2人にとっての最大の利得だからだ。つまり最大利得を得るのが理性なのである。
もし「囚人のジレンマ」に陥ったらどうすればよいのか、誰もが納得する解はない。本書では、この種の解決不能で多種多彩なパラドックスを「論理・数学・宇宙・物理学」の4分野から紹介した。「最強に面白い」はずである!