ベストアンサー ベイズ統計に興味があり、ベイズフィルタを作ってみた 2011/07/29 11:10 ベイズ統計に興味があり、ベイズフィルタを作ってみたいと思ったのですが、サイトを調べてみてもよくわかりません。 誰か初心者でもわかるように説明してもらえないでしょうか? みんなの回答 (1) 専門家の回答 質問者が選んだベストアンサー ベストアンサー tac351115 ベストアンサー率66% (109/164) 2011/08/05 21:34 回答No.1 わかりやすい解説です。 http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html http://gihyo.jp/dev/serial/01/machine-learning/0003 通報する ありがとう 0 カテゴリ 学問・教育数学・算数 関連するQ&A ベイズ統計学につきまして。 ベイズ統計学による、主観的確率に基づく推計で、100%間違いない結論を出せるのは、どんな場合でしょうか。 ベイズフィルターを全て自分の手で実装したいと思うの ベイズフィルターを全て自分の手で実装したいと思うのですが、プログラミングなどの知識が全くありません。果たして全て自分の手でオリジナルのものを作ることができるのでしょうか? あと初心者からでも始められて、最終的にベイズフィルターを作ることができる言語を教えてください。 ベイズ統計学(ベイズ決定理論)を学びたい 高卒社会人です。 統計的推論手法を身につけたいと思うに至りました。 書店で色々入門書を漁ったのですが、自分に数学的素養が 足りないためかチンプンカンプンです。 ベイズ統計学を独学で学ぶためにはどのような前提知識が 必要となるのでしょうか? お勧めの自習書、学習pathなど、併せてご紹介頂け るとうれしいです。 よろしくお願いいたします。 日本史の転換点?:赤穂浪士、池田屋事件、禁門の変に見る武士の忠義と正義 OKWAVE コラム ベイズ統計学の利用法について 頻度論的な統計手法では,確率分布の推定誤差を母数の区間推定という方法で表現します. この場合,標本数が大きくなるとその区間は狭まり,無限になれば区間は限りなく狭くなります. しかし,現実の標本数は有限ですから,区間の上限と下限があります. 実務上は,上限値あるいは下限値を母数の推定値にして,安全側の判断をします. さて,ベイズ統計手法の場合,予測した確率分布の推定誤差はどのように表現するべきなのでしょうか? 実務上でベイズ統計学を利用したいのですが,この部分で悩んでおります. どなたか,よいアドバイスをお願いいたします. ベイズ統計入門書の例題の尤度について ベイズ統計の入門書を読んでいるのですが、いろんな適用方法があるのだとは思いますが、簡単に言うと以下のように見えます。 あのベイズの式があり、尤度が既知で、事前分布を与えると、データに依存して事後確率が変化するということをやっている、ということです。で、その事後確率を次の事前確率として次のデータでさらに次の事後確率を求めるという流れです。漸化式の計算と同じです 確率が事前から事後に流れることが時間発展のような形式となり、データに依存したシミュレーション的なアルゴリズムができそうです。 ここでやや疑問に思えるのが尤度です。尤度とは発展方程式の定数係数のような位置づけのように見てきます。尤度はこのベイズ統計で揺るぎのない確立した数値ということになるのでしょうか。尤度が時間的に変化することもありうるのでしょうか。そうなると未知数の積が出てくるので非線形という印象になるのですが。 ベイズ統計の初等的な事例で、異性が自分に好意を持つ、というようなものが紹介されています。好意を持っている異性の態度が”今日は、いい、普通、悪い”の3種であり、その確率(これが尤度表らしいですが)を既知として保持し、それとデータ(あしたの態度3種)に従って確率が変化するというような事例がありますが、尤度自体が簡単にはわからないものなのではないかと思うのですが。ただ単に興味を引く題材にした事例なのかもしれませんが。尤度についてどのように考えるのでしょうか。 異性の問題では結局、そこが難しいんじゃないか、と聞きたくなるわけですが。よろしくお願いします。 ベイズ統計の用語についてお尋ねします。 ベイズ統計において事前確率、事後確率というものが出てきます(有名なので、式は書きませんが)。私が読んでいる本では事前、事後、という言葉の語感と定義が一致していません。ただ、そのような名前で呼ばれるということのようです。 推測ですが、条件なしで単純に全データから発生事象の数を除したものが事前、条件付き確率が事後、すなわち、ベイズの式は単純な確率(事前)から条件付き確率(事後)を陽形式で表示できるということで、後で条件を付けたらどうなるかが分かるということなのでしょうか。 用語の語源を理解すると頭に入りやすいと思うのです。 よろしくお願いします。 ベイズ統計に関する尤度について ベイズ統計を展開していく際に尤度が分かっているということが前提となります。 その尤度について表のようなものを作成するわけですが、例えば、迷惑メール、非迷惑メールに”アイドル”と言う言葉が含まれるかどうかを考えます。迷惑メールの中で”アイドル”が含まれる確率A、非迷惑メールの中で”アイドル”が含まれる確率Bがそれぞれ分かっていると仮定するわけですが、一方でアイドルという単語を含むメールに関して迷惑メールである確率C、非迷惑メールである確率Dも定義可能ですね。 この場合、A+B≠1(これは当然), C+D=1(迷惑か非迷惑かしかないから)という違いがあります。実際にある練習問題ではA,Bの方を使っているのですが、C,Dのように確率が足して1になるという風にして尤度を考えることもできるように思うのです。尤度表の縦、横方向に足して1になるという風にして表を作る必要は必ずしもないのでしょうか。 尤度表を作るところこそがベイズ統計の肝というか個性が出るところだと思うのですが。よろしくお願いします。 ベイズ統計で、私に非が無かったと証明できますか? 従業員が30人の会社に勤めています。 物置にあった、段ボールが紛失してしまいました。 誰かが「私が捨てているのを見た気がする」と上司に言いました。 それで、私のせいにされてしまいました。 しかし、私は全く覚えがないのです。 私に非がない確率を、数学的に証明するにはどうすれば良いですか? ベイズ統計で証明できますか? 数学のベイズ統計についてお尋ねします。 ベイズ統計における数学表記についてお尋ねします。事象A, B, Cについてベイズ統計の表記として以下のものがあります(テキストに載っていた)。 P(A|B,C)=P(A,B,C)/P(B,C) P(A,B|C)=P(A,B,C)/P(C) 左辺に出てくる表記でA|B,CというようなものはA|(B,C)というものではないかと思いますが、どうでしょうか。それとも(A|B),Cでしょうか。 A|(B,C) だと事象B,Cが成り立つという条件の下でAが成り立つという意味であり、 (A|B),C だと事象Bが成り立つという条件の下でAが成り立ち、そして(かつ)Cが成り立つ ですね。 表記として解釈が2つ成り立つように思うのですが、どのように整理されるのでしょうか。 あるいはそのどちらでもない、としたらどういう処理になるでしょうか。 また、Pというものを関数と考えたとき、表記上、1,2,3変数どれにも対応しているというところが融通無碍という感じでそれでいいのだろうかという気持ちになります。関数と考えてはいけないのでしょうか。 ベイズ統計の理論は数学的表記に従って式が展開されるので式の表現によって時間を遡ることも許していると思います(逆確率とか)。そのため数式計算としての厳密性(四則演算とかの導入)が必要だと思うのですが。P(様々な事象)ということになるとこんな式の展開はアリか?という疑問も出てきます。どのように整理するのでしょうか。 例えば”|の左右はカッコでまとめることになっている”とかの規則があるとかですが。 よろしくお願いします。 ベイズ統計について教えてください 「目の前にツボが1つあり、AのツボかBのツボのどちらかである。Aのツボには9個の白球と1個の黒球が、Bのツボには2個の白球と8個の黒球が入っている。目の前のツボから1個取り出し色を確認してからツボに戻し、再び1個取り出し色を確認するものとする。 20回球を観測した時、黒球が出た回数に対応して、ツボがBである事後確率について表にしたのである」(小島寛之著「ベイズ統計学入門」pp.157)の表中の数値の求め方が分かりません。 黒の回数 0 1 2 … 事後確率 8,62×(1/10)^14 3.10×(1/10)^12 1.12×(1/10)^10 … 生起確率 1.05×(1/10)^14 8.39×(1/10)^12 3.19×(1/10)^10 … 計算の仕方が分れば、黒の回数3以降は、類推できると思います。よろしくお願いします。 ベイズ更新とは・・・? ベイズ更新について、がんばって理解しようとしているのですが、 ベイズ更新とは、なにを目的としてするのか、という根本的なとこからわかりません。 詳しく分かりやすく説明してくださる方、いい文献などをご存知の方、 ぜひ教えて下さい!! ベイズ更新について ベイズ統計に詳しい人に教えてもらいたいのですが、念の為に確認させてください。 ------ | A _| B 確率 | 0.6 | 0.4 --------------------- 項目1 | 0.7 | 0.1 項目2 | 0.5 | 0.3 項目3 | 0.2 | 0.5 --------------------- 尤度 | 0.07 | 0.015 の場合、項目の掛け算が尤度で、Aの事後確率は、 0.875=( 0.07*0.6 ) / ( (0.07*0.6) + (0.015*0.4) ) で、良いですか? 違っていたら、訂正おねがいします。 もし、良いのなら、ベイズ更新で事前確率になるのが、0.875になるのですよね? ------ | A _| B 確率 | 0.875| 0.125 --------------------- 項目1 | 0.7 | 0.1 項目2 | 0.5 | 0.3 項目3 | 0.2 | 0.5 --------------------- 尤度 | 0.07 | 0.015 それを計算すると、 0.970=( 0.07*0.875 ) / ( (0.07*0.875) + (0.015*0.125) ) になり、何度か更新すると、1か0になる結果になります。 そうならないために、ベイズ更新というのは、どのタイミングですればよいのでしょうか? ベイズ統計の公式と積分について 涌井さんの「道具としてのベイズ統計」という本で、勉強をしているのですが、理解できない点があります。 下記のベイズの公式 π(θ|D) = k f(D|θ) × π(θ) ( k = 1/p(D) ) …(1) π(θ| D) ∝ f (D | θ) × π(θ)…(2) より、比例定数kの計算方法がわかりません。 本では、kは確率の総和が1、すなわちθのすべてについて和が1になる性質を利用する と記載されていますが、いまいちピンときません。 例えば、 表が出る確率がθのコインがあり、表・表・裏・裏の順に結果が出た、という問題があります。 そこで1回目の事後分布を求める際、 理由不十分の原則で事前分布はπ(θ)=1、尤度はf(表|θ)=θ よって、事後分布π(θ|D1) ∝ θ × 1 …(3) 0≦θ≦1で確率の総和が1という条件から比例定数が求められます。 よって、1回目の事後分布π(θ|D1) = 2θ …(4) ・・・・以下省略 ここの(3)から(4)を導き出す、計算がわかりません。 どなたか、やさしく教えていただけると大変助かります。 よろしくお願いいたします。 ベイズ統計の初期の式展開について 添付した画像にワードの数式入力でベイズ統計の式を記入したものを載せています。 あるテキスト(しかもそのかなり先頭部分)で一番最初の式を前提として、2行目の式2つがすぐに得らえると書いてあります。1つ目は問題ありませんが、2つ目が理解できません。ベイズの式で出てくるあの”縦棒|”の左右にカンマで区切られた変数が出るとどういうことを意味するかということです。 その教科書ではこの展開の途中で何かが差し挟まれるというものがなく、直列的に標記されており、この標記だけで理解しなくてはならないという図式になっています。2つ目の式は簡単に示せるのでしょうか。前述しましたが、まず式中に使われている表現の定義がされていない、という風に見えるのですが。著者は当然として先に話を進めていますが、当然のように感じられないのですが。よろしくお願いします。 自由意志、自由選択とベイズ統計について。 人の行動、自由意志、自由選択は、フィジカルに依存するが、本質的にはベイズ統計的なものですか? つまり、「自由選択ができたはずだ」というのは、事後確率からみた幻想であって、事後確率が出力される前の事前確率において、一番高い可能性が、選択されたにほかなりませんか? ベイズ統計の練習問題について ベイズ統計の練習問題のについてお尋ねします。 問題:1袋100g表示の袋が数多くあり、3つのサンプルを取り出して計測すると100,102,104gだったとします。 この袋の重さは分散1の正規分布であることが分かっている場合、袋の重さの事後分布を求めなさい。 ベイズの式は事後分布∝尤度×事前分布ということで、尤度と事前分布を求めて式を変形するようです。 回答によると 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 事前分布:値100に対する正規分布(平均=μ,分散1)の値(表示式) として進めていきます。 ここで質問ですが、正規分布(確率密度関数)の式の値に積極的な意味があるのかなという気がして、どういうことなのだろうと思います。 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 さらに回答を読むと、事前分布について分散1に限定かと思ったら事前分布は未知なので(←いつもそう言われますが)分散を3にして計算してみる、ということになっています。これはなぜでしょうか。 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。定期試験などで。3でないといけない理由が見出だせないのですが。 よろしくお願いします。 ベイズ統計の初歩的な質問 ベイズ統計を復習しているのですが、初歩的な質問があります。 例えば、全人口の約0.1%を占める人がかかる病気があります。個人が病気を持っている確率をP(disease)、もっていない確率をP(no disease)とすると P(disease) = 0.001 P(no disease) = 0.999 となります。この病気を持っているか否かを知るためのテストが開発され、臨床試験において以下のような結果が出ました。このテストを、実際に病気を持っている人に行うと、陽性(+)と陰性(-)が出る条件付き確率は P(+|disease) = 0.98 P(-|disease) = 0.02 となり、実際には病気にかかっていない人に行うと P(+|no disease) = 0.03 P(-|no disease) = 0.97 と出たとします。 目標は、テストで陽性が出た場合に、それが本当に病気にかかっていることを示す確率、すなわちP(disease|+)を計算する事です。式に当てはめると、以下のようになります。 P(+|disease)P(disease) P(disease|+) = ----------------------------------------------------- P(+|disease)P(disease) + P(+|no disease)P(no disease) 0.98 x 0.001 P(disease|+) = ---------------------------- 0.98 x 0.001 + 0.03 x 0.999 P(disease|+) = 0.032 (非常に見苦しい点お許しを)これは3.2%というかなり小さい確率となります。これは、P(disease)が0.001と非常に小さい事に起因し、母集団の中で病気にかかっている人が少なく、P(disease|+)自体がこの母集団に対して計算されている故と理解できます。 でも、一人の患者が知りたい情報は、テストが陽性だったときに限って、実際に病気にかかっている確率です。この計算をするときに、ベイズ的に事前分布を主観的に選べるとすると、P(disease)をどのように設定すべきなのでしょうか。これを0から1までの広範囲で変化させると、どのような結果も得られてしまいます。一番信頼できるのは、データが既にあるP(disease) = 0.001なので、これを使うべきことは理解出きるのですが、P(disease|+) = 0.032という数値はちょっと直感的に違うと思うのですが。ひとりの患者にとっては、P(+|disease) = 0.98を一番有用な情報とするのが無難なのでしょうか。 ベイズ統計の基本的な解釈で引っかかった点なので、ご教示のほどよろしくお願いいたします。 自分は高校生で統計学に興味を持っているのですが 自分は高校生で統計学に興味を持っているのですが 統計学が学べる大学を教えてくださいm(_ _)m あと、統計に関する仕事はなにがあるかも教えてほしいです! ベイズの定理の平均と分散 統計の課題で、「ベイズの定理の、平均と分散はどのような値(式)になるか」という課題が出たのですが、どう表せばよいのか分からず困っています。 平均は期待値を使って求めている問題があったので、それでよいのかと考えていますが、分散についてはまったく記述がないので、さっぱり分かりません。どなたか教えてください。 ベイズ統計論(推定?決定?)の教科書を探しています. ベイズ統計論(推定?決定?)の教科書を探しています. できれば洋書がよいですが,和書でもかまいません.(私の印象ですが,洋書のほうが基礎から丁寧に書き下ろしていあるものが多いように思います) 基礎から解説して,できれば,最近(?)関心がもたれているMCMCやランダムウォークといったことまで書かれている物がよいです(ここら辺のキーワードもよくわかっていません) また,私は工学系の人間なので,理論的な解説だけで終始している教科書よりも,実践的な内容がよいです.RやOctaveといった処理系上でのコード断片が載っていたりすると大変うれしいです. なんか,欲張りな内容かもしれませんが,よいものありませんでしょうか? 一冊ではなく,数冊の本を紹介してもらってもぜんぜんかまいません. よろしくお願いいたします. 注目のQ&A 「You」や「I」が入った曲といえば? Part2 今も頑なにEメールだけを使ってる人の理由 日本が世界に誇れるものは富士山だけ? 自分がゴミすぎる時の対処法 妻の浮気に対して アプローチしすぎ? 大事な物を忘れてしまう 円満に退職したい。強行突破しかないでしょうか? タイヤ交換 猛威を振るうインフルエンザ カテゴリ 学問・教育 人文・社会科学 語学 自然科学 数学・算数 応用科学(農工医) 学校 受験・進学 留学 その他(学問・教育) カテゴリ一覧を見る あなたにピッタリな商品が見つかる! OKWAVE セレクト コスメ化粧品 化粧水・クレンジングなど 健康食品・サプリ コンブチャなど バス用品 入浴剤・アミノ酸シャンプーなど スマホアプリ マッチングアプリなど ヘアケア 白髪染めヘアカラーなど インターネット回線 プロバイダ、光回線など