- ベストアンサー
おみくじの母比率の推定方法
おみくじを何回か引いて出てきた結果である大吉、吉、凶、大凶等の各々の数からおみくじの各種の比率がどのぐらいの区間で存在するかを推定したいと考えています。 この場合どのような方法を行えば推定を行うことができるのかご教授お願いいたします。 またA神社では1回X円のおみくじをn回引いたところ大吉がa回出た時と、B神社で1回Y円のおみくじをm回引いたところ大吉がb回出た時、互いのおみくじに差があるかどうか、またある場合はどちらのほうがどのぐらい得か損かを定量的に判断する方法もご教授頂けると幸いです
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
企業で統計を推進する立場にある者です。 このような観測データからの母確率質量の点推定,区間推定は、 手法としては、ノンパラメトリックベイズを用います。 有名なビショップのPRML本(上巻)の第2章あたりに解説してあったと思います。 この例は、各事象の確率の総和が1の多項分布です。 そこで、事前分布としてディリクレ分布を使います。 まともに積分を行っていくと大変なので、マルコフ連鎖モンテカルロ法(MCMC)を使います。 ご質問の事例は、ちょうど次の問題と同じです。 『イカサマ・サイコロの10回の出目が次のように観測された。 「2」「3」「5」「4」「5」「3」「1」「5」「1」「5」 母確率質量を求めよ』 この10回の観測では、「6」の目の出現は0回ですが、当然、「6」の目の出現確率も推定可能です。 私は、フリーのMCMCソフトである、OpenBUGSを使っています。 スクリプトは次のようになります。 #unfair dice model { phi[1:V] ~ ddirich(theta[]) for (n in 1:N) { w[n] ~ dcat(phi[]) } for (v in 1:V) { theta[v] <- 1/6 #全ての目が同等 } } list(V=6,N=10) list(w=c(2,3,5,4,5,3,1,5,1,5)) 結果(各目確率の平均と標準偏差)は、 1 0.1991 0.1162 2 0.1054 0.0881 3 0.1971 0.1152 4 0.1061 0.0887 5 0.3766 0.1403 6 0.0156 0.0360 となります。 おみくじでは、サイコロの6項から必要な項数に変更して頂き、 観測結果を数字にしてlistを書き直すだけで、計算ができます。 次にどちらが得か、という問題ですが、期待値の計算を行えば良いです。 (期待値)=∫(スコア関数)・(確率密度・質量関数)dx です。OpenBUGSで得られた確率質量にスコアを掛けたものを、積算すれば良いです。 これも、積分は面倒なので、モンテカルロ計算でしょうね。 フリーの統計ソフトであるRを使って、十分行えると思います。 ただし、私はOpenBUGSから確率質量を取り出す方法を知らないので、確約はできません。 ご質問の例は、 ネットショップで、ある顧客が過去何回か、数ある商品群のなかから、例えば大吉2と小吉3と凶1を購入した。 この顧客の購買比率を推定せよ。 この顧客の購入額の期待値を計算せよ。 これを全顧客について計算すれば、仕入最適化や売り上げ予想が、区間で推定できるという、企業で扱う具体的な問題となります。 長文、失礼しました。
お礼
迅速な回答ありがとうございます。 図書館にて本が見つかったので自分にとってかなり難しい内容ですが頑張って読んでみようと思います。 長文で詳しく説明してくださりありがとうございます。