ナッシュ均衡

更新 2021/08/05

どのプレイヤーも「戦略を変更しないでいることが最も合理的である」ような均衡状態をナッシュ均衡（Nash equilibrium）という。

ナッシュ均衡とは，ゲーム理論における概念です。その定義と具体例，パレート効率性との関係，ナッシュ均衡の存在に関するナッシュの定理を紹介します。

定義

まず，用語のざっくりとした意味を説明します。
ゲームとは，各プレイヤーがとる戦略を決めたときに，誰がどれくらい利益を得るかが定まるようなものです。
非協力ゲームとは，プレイヤー間の（ルールに基づいた）連携がないようなゲームのことです。例えばレースゲームのチーム戦はルール上の連携なので協力ゲームですが，個人戦は（一時的な協力があったとしてもルール上のものではないので）非協力ゲームです。
（これらはゲーム理論という分野で使われる用語です。）
次に，ナッシュ均衡の定義です。
定義（ナッシュ均衡）
非協力ゲームのプレイヤーを 1,2,…N1, 2, \dots N1,2,…N とし，プレイヤー iii のとる戦略が sis_isi​ であるという状況を (s1,s2…sN)(s_1, s_2 \dots s_N)(s1​,s2​…sN​) とする。
この戦略の組 (s1,s2…sN)(s_1, s_2 \dots s_N)(s1​,s2​…sN​) がナッシュ均衡であるとは，次の条件を満たすことである。
すべての iii について，「プレイヤー iii 以外の戦略を現状に固定したときに，プレイヤー iii が最も得をする戦略は sis_isi​」を満たす。
つまり，自分だけが戦略を変えても得をしない状況がナッシュ均衡です。ナッシュ均衡は，ゲームの「解」，つまり現実にそのゲームをプレイしたときにプレイヤーがどういう行動をとるかの予測を与える方法のひとつです。
ちなみに「ナッシュ均衡」という名前は（以下のナッシュ均衡の存在定理を証明した）数学者のジョン・ナッシュに由来します。

具体例

ナッシュ均衡を理解するためによく使われるのは，囚人のジレンマです。

例：囚人のジレンマ

2人の囚人が犯罪の容疑者として捕らえられ，それぞれ黙秘するか自白するかによって懲役の年数が以下のようになっているとします。

囚人のジレンマ

例えば，囚人1が黙秘し囚人2が自白した場合，右上のマスになり，懲役はそれぞれ10年と0年になります。

この中で，自分だけが戦略を変えても得をしない状況は（自白，自白）の戦略の組で，懲役は（5年，5年）となります。よってこれが唯一のナッシュ均衡です。

（例えば（黙秘，黙秘）であれば，相手の戦略を黙秘で固定した場合自分は自白するのが最も得をする選択です。つまり自分の戦略を変えた方が得をします。）

ナッシュ均衡は複数あったり，1つもなかったりします。

例：エスカレーター

エスカレーターで左右どちらに並ぶか，という駅でよくある状況を考えます。囚人のジレンマと同様の図を描いてみると，次のようになります。

エスカレーターの並び方

周りの人が左に並んでいる中で，自分だけ右に並ぶと邪魔になって迷惑なので，不利益であると考えられます。

この場合は

全員で左に並ぶ
全員で右に並ぶ

という2つがナッシュ均衡です。東京と大阪でそれぞれのナッシュ均衡が実現されています。

例：じゃんけん

2人でじゃんけんをする状況を考えます。

じゃんけん

相手の手を固定したときには，それに勝つ手を選ぶ（後出しじゃんけんをする）ことで必ず勝利できるので，自分だけが戦略を変えても得をしない状況＝ナッシュ均衡は存在しません。

パレート効率的

囚人のジレンマでは一見（黙秘，黙秘）がいいように思えますが，ナッシュ均衡という観点では（自白，自白）のみが解になります。一方，この（黙秘，黙秘）のような状況は，経済学の分野でパレート効率的（Pareto efficient）と呼ばれます。

定義（パレート効率的）

パレート効率的な状態とは，

そこから誰かの利益を増やすためには，他の誰かが損をしなければいけない

という状態のこと。

ナッシュ均衡は各プレイヤーにとっては合理的な選択かもしれませんが，必ずしもパレート効率的にはなりません。囚人のジレンマにおける（自白，自白）では，（黙秘，黙秘）に変えることで誰も損をせずに利益を得ることができるので，パレート効率的ではありません。

このように，各個人が合理的な選択をしても必ずしも全体の利益を最大化するわけではない，と言えます。

ナッシュ均衡の存在定理

ここまで見てきたように，ナッシュ均衡とは合理的な選択のもと実現する均衡状態のようなものですが，存在しない場合もあります（具体例のじゃんけんなど）。

しかし，適切な仮定の元では必ず存在することが知られています。

ナッシュの定理

混合戦略を許した（有限）非協力ゲームには，必ずナッシュ均衡が存在する。

混合戦略とは，複数の戦略を確率的に混ぜ合わせたような戦略のことです。例えばじゃんけんでは，「グー，チョキ，パーをそれぞれ確率 $1/3$ で出す」というような戦略が混合戦略です。また有限ゲームとは，プレイヤーと戦略の数が有限であるようなゲームのことです。

この定理の証明には不動点定理（適切な条件を満たす関数・写像には必ず不動点が存在する，というタイプの定理）を使います。「各プレイヤーの戦略をより得をする方向へ更新する」写像に対して不動点定理を適用することで，得られた不動点がナッシュ均衡になっているという流れです。

ナッシュの定理の証明はおもしろいので，いつか紹介したいです。