• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:2人ゲームのゲーム値と最適戦略)

ゲーム値と最適戦略の求め方とは?

このQ&Aのポイント
  • 行列ゲームの2人ゲーム問題を解く際に、ゲーム値と最適戦略を求める方法を紹介します。
  • シンプレックス法を用いてゲーム値と最適戦略を計算する手順を解説します。
  • ゲーム理論の本を読んでも理解できなかった部分について、具体的な例を用いて解説します。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

まず、前回の回答の訂正をします。 x1 = 6/13 , x2 = 3/13 , x3 = 4/13 , y1 = 6/13 , y2 = 4/13 , y3 = 3/13 が正しい値です。 そして、この値のとき、均衡状態になります。 もしAさんもBさんもこの値の通りの確率で選択肢を選べば、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 ≒ -0.0769 となりますので、Aさんは、ゲーム1回当り、平均で 0.0769 点 程度、損をすることになります。 逆にいえば、Bさんは、ゲーム1回当り、平均で 0.0769 点 程度、得をすることになります。 さて、x1,x2,x3,y1,y2,y3 にいろいろな値を入れてみました。 (ご自分でも試してみて下さい。ただし、x1 + x2 + x3 = 1 , y1 + y2 + y3 = 1 にして下さい。) その結果として、少なくともこの問題に限っては、次のことがわかりました。 ・Bさんが上記の戦略を採用すれば、Aさんがどんな戦略をとったとしても、   Bさんは平均で 0.0769 点 程度、得をする → Bさんにとってはこの戦略が最適 ・Aさんが上記の戦略を採用すれば、Bさんがどんな戦略をとったとしても、   Aさんは平均で 0.0769 点 程度、損をする → Aさんがこの戦略をとるメリットはあまりない ということは、Bさんは、相手の戦略を知らなくても得をすることができます。 (もちろん、相手の戦略を知っていればもっと得ができるでしょう。) しかし、Aさんは、Bさんが正しい戦略をとる限り、勝ち目はありません。 しかも、Bさんが正しい戦略をとらないとしても、 Bさんの戦略をAさんが読めなければ、Aさんは勘で勝負するしかありません。 私がこの問題を最初に見たとき、AさんとBさんの勝率は5分5分だろうと思っていました。 でも、実はこのゲームはBさんが有利なんですね。 yatukoさんのおかげで、私も少し賢くなれました。ありがとうございます。

yatuko
質問者

お礼

分かりやすく書かれていたので、この計算の考え方が理解できたと思います! 自分で頑張って計算してみました。 長々と本当にありがとうございました!!

その他の回答 (3)

回答No.3

>> x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 > のところは、逆数にしてからかけるということでいいのでしょうか? はい、その通りです。x1 + x2 + x3 = 1 になるように、そうします。 > この値がゲーム値ということになるのですか? ではありません。 はっきりはわかりませんが、シンプレックス表にゲーム値は書いていないのかもしれません。 では、リクエストがありましたので、続きを書くことにします。 Aさんは選択肢1,2,3のどれかしか選べませんから、x1 + x2 + x3 = 1 、 同様にBさんについて、 y1 + y2 + y3 = 1 です。 1回ゲームをするときAさんが得られる得点の期待値は、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 です。 均衡状態では、x1 + x2 + x3 = 1 を保った状態で x1 を少しだけ増やして x2 を少し減らしても f の値は変わりません。 これを数式で表すと、 ∂f/∂x1 - ∂f/∂x2 = 0 となります。(これは偏微分というものです。) 同様にすると4つの式が得られ、 ∂f/∂x1 - ∂f/∂x2 = 0 ∂f/∂x2 - ∂f/∂x3 = 0 ∂f/∂y1 - ∂f/∂y2 = 0 ∂f/∂y2 - ∂f/∂y3 = 0 が成り立ちます。 計算すると、 ∂f/∂x1 = y1 - y2 - y3 ∂f/∂x2 = - y1 - y2 + 3y3 ∂f/∂x3 = - y1 + 2y2 - y3 ∂f/∂y1 = x1 - x2 - x3 ∂f/∂y2 = - x1 - x2 + 2x3 ∂f/∂y3 = - x1 + 3x2 - x3 となり、これを4つの式に代入すると、 2y1 - 4y3 = 0 -3y2 + 4y3 = 0 2x1 - 3x3 = 0 -4x2 + 3x3 = 0 となります。 これに x1 + x2 + x3 = 1 と y1 + y2 + y3 = 1 を加え、 6変数で6つの式の一次連立方程式を解きます。 その結果、 x1 = 4/13 , x2 = 2/13 , x3 = 3/13 , y1 = 4/13 , y2 = 3/13 , y3 = 2/13 が得られます。 (申し訳ありませんが字数制限上、補足をお願いします。)

yatuko
質問者

補足

長々とありがとうございます。 ここまでの計算の流れはわかりました。 また続きをお願いします!

回答No.2

なぜ+αすると計算がうまくいくのか、 なぜ補足の線形計画問題を解けばよいのかについては、 私にはわかりません。 質問者さんの本を読めばたぶんわかると思うのですが、 そういうわけにもいきませんし… 満足な答えができなくてすいません。 でも、解いた結果のシンプレックス表は、 1x1 + 0x2 + 0x3 = 1/2 0x1 + 0x2 + 1x3 = 1/4 0x1 + 1x2 + 0x3 = 1/3 を表しています。 つまり、x1 = 1/2 , x2 = 1/3 , x3 = 1/4 です。 x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 x1 ' = 6/13 ≒ 0.461 x2 ' = 4/13 ≒ 0.308 x3 ' = 3/13 ≒ 0.231 とすると、x1 ' + x2 ' + x3 ' = 1 となります。 どうもこの解は、 Aさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Aさんは 3/13 の確率で選択肢2(-1,-1,3)を選び、 Aさんは 4/13 の確率で選択肢3(-1,2,-1)を選べばよい Bさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Bさんは 4/13 の確率で選択肢2(-1,-1,2)を選び、 Bさんは 3/13 の確率で選択肢3(-1,3,-1)を選べばよい ことを表しているようです。 実は、私は別の方法でこの問題を解いて、上記のことがわかりました。 もしBさんが等確率で選択肢1,2,3を選ぶとすれば、 Aさんは選択肢2を選び続けるのが最適です。 でも、Bさんはそのことがわかっていますから、 選択肢3を避け、選択肢1,2のどちらかを選ぶでしょう。 では、AさんとBさんは、どの確率でどの選択肢を選べばいいのでしょうか。 Aさんが選択肢1,2,3を選ぶ確率をそれぞれ x1 , x2 , x3 とします。 Bさんが選択肢1,2,3を選ぶ確率をそれぞれ y1 , y2 , y3 とします。 すると、… この辺で字数制限に引っかかります。 分割投稿は禁止ですが、もし続きをお知りになりたいなら、 コメントして頂ければ回答できると思います。

yatuko
質問者

補足

ありがとうございます! 表の意味が分かりました。 それから少し疑問に思ったのですが、 >x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 のところは、逆数にしてからかけるということでいいのでしょうか? この値がゲーム値ということになるのですか? 続きが気になるので、 よろしければぜひ解説をお願いします。

回答No.1

得点行列とは何でしょうか。 AさんとBさんが対戦して、Aさんが2番目の選択肢、 Bさんが3番目の選択肢を選択したら、 Aさんが+3点、Bさんが-3点になる、という意味で間違いないでしょうか。 それから、シンプレックス法は、制約条件と目的関数があり、 それを解いた結果が質問内容の表になっていると思います。 最初に立てた制約条件と目的関数を、式の形で書いて頂けないでしょうか。

yatuko
質問者

補足

AさんとBさんの得点のその意味で合ってます。 この行列のゲーム値と、AとBの最適戦略を求めたいのです。 まぎらわしく書いてしまい、すみませんでした。 まず問題の行列の成分をすべて+1しました。 解説によると行列の中を0以上なるように+αすると計算がうまくいくと書かれていたので。 それを線形計画問題化したのが下です↓ 2 0 0 0 0 4 0 3 0 2x1<=1 4x3<=1 3x2<=1 x1,x2,x3>=0の下で z=x1+x2+x3  を最大にする ちなみに縦の列ごとにx1,x2,x3と表しています。 そもそもこの考え方とやり方が合っているのかが不安ですが・・・ よろしくお願いいたします。