- ベストアンサー
ゲーム理論とは?
- N人の参加者が1000円を保持するか募金するかを選択するゲームを考える
- N≥3の場合、ナッシュ均衡となる戦略の組を明らかにする
- 実験結果がナッシュ均衡と一致しない場合、その理由は何か考えられるか
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
プレイヤーiの戦略をx(i)と書くと、x(i)∈{R,C}, i =1,2,3.となりますね。プレイヤ―の数が2人の場合は利得表を作ると便利ですが、3人以上の場合はあまりうまくいかない。プレイヤーの利得関数は、プレイヤー1の利得(pay-off)をP(i)と書くと P(1) = 2[x(1) + x(2) + x(3)]/3 - x(1) = [2x(2) + 2x(3) )- x(1)]/3 と書けるが(なぜ?)、プレイヤー2,3の利得も同様に P(2) = [2x(3) + 2 x(1) - x(2)]/3 P(3) = [2x(1) + 2x(2) - x(3)]/3 となる。ただし、利得を計算するとき、R=0、C =1000と計算する。この利得関数をながめるとすぐわかるように、各プレイヤーiにとって、ほかのプレイヤーの戦略が何であっても、それらの戦略を所与とするとき、x(i)=Rを選択すれば、利得は最大化される(なぜ?)したがって、このゲームには各プレイヤーに支配戦略が存在し、x(i)=Rである。支配戦略があるとき、誰もが支配戦略を選択するので、ナッシュ均衡は支配戦略の組 (x(1),x(2),x(3) = (R,R,R) となり、各プレイヤーの利得はゼロである。つまり、全員が「保持」を選ぶ結果、自分の取り分は配分された1000円以上には増えないことになる。(皆が協力してCを選択するなら、すなわち、x(1)=x(2)=x(3)=Cなら、各プレイヤーの利得はP(1)=P(2) =P(3)=2000/3、配分された1000円にこれだけの金額を余計に得られるのに利己的に行動する結果、最適でない結果におちいってまう(囚人のジレンマ)。プレイヤーの数をN≧3の場合も同じように分析できる。
その他の回答 (3)
- statecollege
- ベストアンサー率70% (494/701)
以下の回答2に対する補足質問に答えましょう。 > 1/2| R | C ---|--------------|--------- R |(1000,1000) |(2000,1000) | | ---|--------------|----------- C |(1000,2000) |(2000,2000) という利得表になると思います。 いいえ、N=2のときは以下のような利得表になるはずです。 R C R 0, 0 1000, 0 C 0, 1000 1000, 1000 (注。表がうまく書けません。一番上の欄はRとCが並び、そのRの下には(0,0)、(0,1000)と縦にならび、Cの下には(1000,0)と(1000,1000)と縦にならびます。原稿の段階ではこのように書かれているのですが、「確認する」のボタンを押すと、乱れてしまいます!!) 回答2で書いたように、利得関数はこの場合 P(1) = 2[x(1) + x(2)]/2 - x(1) = x(2) P(2) = 2[x(2) + x(1)]/2 - x(2) = x(1) となるからです。したがって、私の表のようになるのです(N=2のときは右辺の分母が2に変わることをお忘れなく!) この場合は、ナッシュ均衡は(R,R), (R,C), (C,R), (C,C)の4つあります。つまり、どの組もナッシュ均衡です。だから、問題でプレイヤーの数はN≧3と設定してあるのです。Nが3以上の場合はナッシュ均衡は一意に定まります。回答2を見てください。
お礼
やはり全部ナッシュ均衡なのですね… 実は質問した問題の前にプレイヤーが2人のときのナッシュ均衡をもとめよ、という問題がありまして、そこでもすべてナッシュ均衡なのでは、と思ったもののうまく説明できていませんでした。 わかりやすい説明で、非常に助かりました。また質問することがあるかと思いますので、よろしくお願い致します
- statecollege
- ベストアンサー率70% (494/701)
>1.は3人以上のプレイヤーのナッシュ均衡の考え方、表記の仕方がわからず苦戦しています。 戦略の組は、各プレイヤーの戦略が互いにほかのプレイヤーの戦略の最適反応となっているとき、ナッシュ均衡といいます。 あるいは同じことですが、戦略の組は、各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えないとき、ナッシュ均衡です。この定義はプレイヤーの数が2人であっても、3人であっても、N(≧3)人であっても変わりません。ナッシュ均衡の表記は戦略の組で表わします。たとえば、回答2で書いたように、x(i)がプレイヤーiの戦略とするなら、(x(1),x(2),・・・,x(N))で表わします。したがって、戦略の組(x(1),x(2),・・・,x(N))=(R,R,・・・,R)は、すべてのプレイヤーが戦略Rをとることを意味しています。 >2.は支配戦略=相手がどの戦略できても最適である戦略、という言葉を1.を踏まえた上でどう使えばいいのかわからずにまた苦戦中 あるゲームで、あるプレイヤーに支配戦略があるなら、ほかのプレイヤーがどんな戦略を選択しても、当該プレイヤーの最適反応は支配戦略だから、支配戦略をかならずとることになります。
お礼
表がおかしくなっていますが、仕切りの線は無視していただけるとわかりやすいかと思います。すみません……
補足
>戦略の組は、各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えないとき、ナッシュ均衡です。この定義はプレイヤーの数が2人であっても、3人であっても、N(≧3)人であっても変わりません。 このゲームのプレイヤーが二人であるときを考えた時 1/2| R | C ---|--------------|--------- R |(1000,1000) |(2000,1000) | | ---|--------------|----------- C |(1000,2000) |(2000,2000) という利得表になると思います。 この場合、「各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えない」という意味ではナッシュ均衡はどう考えればいいのでしょうか。各プレイヤーはどの組み合わせにおいても相手の戦略に依存してしており、その意味では全部が「各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えない」ように見えるのですが……
- statecollege
- ベストアンサー率70% (494/701)
#1を解くためには、(1)各プレイヤーの戦略は何か?(2)各プレイヤーの戦略集合は?そして、(3)各プレイヤーの利得は自分の戦略とほかのプレイヤーの戦略を用いてどういう風に表わせるか(つまり、各プレイヤーの利得関数はどうなるか)?がわからないと、このゲームのナッシュ均衡は求められない!まず、この3つの問についてプレイヤーの数が3人のとき―3人のプレイヤーをプレイヤー1、プレイヤー2、プレイヤー3とするとき―答えてみてください。(これができればN(≧3)人以上のプレイヤーに拡張するのは簡単です。)
補足
なるほど…利得関数を求めるのですね… しかし2人より多い利得関数の求め方がわからないのですが… Pi={R,C}、Pii={R,C}、Piii={R,C}で表をかいてみたんですが、全部で2×2×2=8パターンあり、そのぶんの各プレイヤーの利得をまとめてみました。 その後はどうしたらいいですか?
補足
2*(全員分の戦略で支払われた金額の合計)/人数の合計-プレイヤー1がその戦略で支払った金額=二倍された後の資金が一人一人に配分されるときの金額-プレイヤー1の支払った金額=収入-費用=利得 ということですね。 そして全員が出資すれば多くの利益を得られるのにも関わらず、Rをとれば絶対に損はしないわけだから(もしほかのプレイヤーが出資すれば自分が得するし、全員が保持Rを選択しても損はしない)のでナッシュ均衡は (x(1),x(2),x(3) = (R,R,R) になるという解釈でしょうか。