ベストアンサー

混合戦略の求め方を教えて下さい！（非ゼロ和ゲーム）

2003/07/27 23:43

Ａ，Ｂの２人がいる非ゼロ和ゲームにおいて（Ａ，Ｂ）（ドラマ、ドラマ）＝（７，３）（ドラマ、バラエティ）＝（４，６）（バラエティ、ドラマ）＝（５，５）（バラエティ、バラエティ）＝（６，４）という利得行列があります。これについて、混合戦略を求めたいのですが、Ａがドラマを選択する確率をｐ、バラエティを１－ｐＢがドラマを選択する確率をｑ、バラエティを１－ｑとすると、Ｅ（Ａ）＝７ｐｑ＋５（１－ｐ）ｑ＋４ｐ（１－ｑ）＋６（１－ｐ）（１－ｑ）＝７ｐｑ＋５ｑ－５ｐｑ＋４ｐ－４ｐｑ＋６－６ｑ－６ｐ＋６ｐｑ＝４ｐｑ－ｑ－２ｐ＋６＝（４ｐ－１）ｑ－２（ｐ－３） ∴０≦ｐ≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。ｑの範囲も出した方がいいのでしょうか？そして、このｐの範囲は、何の意味があるのでしょうか？どなたか、教えて下さい！！

ERIeriERI
お礼率64% (488/758)

数学・算数
回答数5
ありがとう数6

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

noname#108554

2003/07/29 18:28 回答No.5

大きな間違いをしてしまいました。すみません。 playerAが動かせる変数はpなので、E(A)をpでまとめます。すなわち、Ｅ（Ａ）＝(4q-2)p-q+6 で、あとはこれを最大にすることを考えるので 4q-2>0でp=1 4q-2<0でp=0 4q-2=0でp=なんでもいい。∴q=1/2 ということで、 >ｐもｑも１／２になりましたが・・・あってそうですね。

質問者

お礼 2003/07/29 20:12

ありがとうございましたテストは無事おわりました。

ログインすると、全ての回答が全文表示されます。

その他の回答 (4)

fushigichan
ベストアンサー率40% (4040/9937)

2003/07/29 00:13 回答No.4

ERIeriERIさん、こんばんは。ゲーム理論については、全く知らないのですが、下記の参考URLは参考にならないでしょうか。これによると、 P0={(p1,p2)|0≦p1≦1,0≦p2≦1,p1+p2=1} Q0={(q1,q2)|0≦q1≦1,0≦q2≦1,q1+q2=1} を、各プレーヤーの戦略をとりうる確率の集合とすると、ここでは、P=(p,1-p)ですが、これがP0の中から選択されたときにＢは、これに対抗して、E(A)が最小となるQ=(q,1-q)をQ0の中で選ぶということになるそうです。それを、 min{E(P,Q)|Q∈Q0} この最小を minE(P,Q) Q とかくと、Ａはこれに対抗して、利益を最大になるように戦略を選ぶので max minE(P,Q) P 　 Q 一般に、 max minE(P,Q)≦min maxE(P,Q) P 　 Q 　　　　　 Q 　 P が成り立つようです。また、フォン・ノイマンのミニマックス定理より max minE(P,Q)=min maxE(P,Q) P 　 Q 　　　　　 Q 　 P となる解が存在し、これを最適戦略というようです。少しでも参考になればと思ったのですが、ここまでしか分かりません。「非ゼロ和ゲーム」「ゲーム理論」「利得行列」などで検索してみますと、参考になりそうなページがいくつかありますので見てみてください。試験のほう、頑張ってください。あまりお役に立てずにすみません。

参考URL：: http://ysserve.cs.shinshu-u.ac.jp/Lecture/Optimization1/node8.html

質問者

お礼 2003/07/29 20:08

回答ありがとうございます。テストは無事終わりました。

ログインすると、全ての回答が全文表示されます。

noname#6201

2003/07/28 03:47 回答No.3

ANo.#1の方のご指摘どおりですが、もう少し説明を加えるとAが戦略を立てる場合に、Bがどう出るかを考慮するのが混合戦略なので、Aの期待利得E(A)をBがどう出るかに関する確率qの方程式と考え、方程式の最大化問題と捉えます。この問題設定はそのまま「ゲーム理論入門」日経文庫―経済学入門シリーズ・武藤滋夫 (著) にあるのでそちらを参照するのが良いでしょう。＃試験に間に合うのであれば、ですが。

質問者

お礼 2003/07/29 20:10

ありがとうございました、テストは無事終わりました

ログインすると、全ての回答が全文表示されます。

noname#108554

2003/07/28 02:27 回答No.2

どうでもいいつけたしで間違えました。 ×ゼロサムですがコンスタントサムなので本質はゼロサムですね。 ○非ゼロサムですがコンスタントサムなので本質はゼロサムですね。

質問者

補足 2003/07/28 18:52

＃３の方の本を借りに行ったのですが、図書館は休館日、本屋にはなかったので、、、去年違う授業で習った方法でやってみました。ｐもｑも１／２になりましたが・・・これで合ってるのでしょうか・・

ログインすると、全ての回答が全文表示されます。

noname#108554

2003/07/28 02:26 回答No.1

ゼロサムですがコンスタントサムなので本質はゼロサムですね。ま、本筋には関係ないのでどうでもいいですが。それと、なぜいきなり ∴０≦ｐ≦1/4 という結論が出てくるのか分かりませんが、Ｅ（Ａ）＝（４ｐ－１）ｑ－２（ｐ－３）がどこで最大になるか考えてみると、４ｐ－１が正ならq=1 ４ｐ－１が負ならq=0 ４ｐ－１が0ならqはどの値でも最適戦略ということで、横軸p、縦軸qとしてどこの点で最良戦略が取られているかを図示すればよいでしょう。

質問者

補足 2003/07/28 15:14

回答ありがとうございます。混合戦略をあまりよく理解できていないのですが、明日テストのため、何かパターンがあれば・・・と思っています。Ａの最適戦略を求めるときは、ｑの最大値を求めればいいということでしょうか？逆にＢのときはｐの最大値を求めることになりますか？確かにこの問題の最後に図示して解答するように　と書いてありますので、図示する方が考えやすいということなのでしょうか。本質を理解していない上で質問しているので、何言ってるんだ？とお思いになるかと思いますが。。。よろしくお願いします。

ログインすると、全ての回答が全文表示されます。