- ベストアンサー
確率計算の例題と答え方
- ある統計のレポートで確率計算の例題が出されましたが、問題文が理解できなかったため、正しい計算方法を知りたいです。
- 例題では、赤と白の玉が入った三つの壷から赤球を取り出す確率を求める問題です。
- 自分の考えでは、壷Cから赤を取り出す確率は三分の一×三分の一で九分の一だと思いましたが、正しい答えとは異なるようで困っています。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
>壷Cから赤球を取り出す確率はいくらか? 額面通り貴方が書いた通りの問題だとすると、 >三つの壷の内、壷Cに手を入れる確率が三分の一。さらに壷Cから赤を取り出す確率が三分の一。したがって三分の一×三分の一で答えは九分の一 ってのは「合ってます」よ。何も間違っちゃいない、と思います。その先生がやってる事が違いますね。 実際、 P(赤玉|壷C)×P(壷C) が計算式でしょうから、ね。 ただし、です。問題文って本当にその通り、でしたか? >壷Cから赤球を取り出す確率はいくらか? と >赤玉を取り出した。その赤玉が壷Cから取り出された確率はいくらか? とでは全然意味が違いますよ。前者は「まだ取り出されてません」が、後者は「既に赤玉自体は取り出されている」、つまり「"赤玉を取り出す"事象は既に確定している」と言う事です。この二つは意味が違うのです。 後者の場合は、逆確率、と言われるものを計算しないといけません。恐らく質問者さんが混乱してる可能性が高いのは「後者の形式の問題」なんじゃないのか、と思ってるんですが……。 問題文を「正確に」書き写してください。恐らく、後者の形式の問題なのでは、と思います。
その他の回答 (2)
- cametan_42
- ベストアンサー率62% (162/261)
>少し感覚的に雰囲気を掴むことができました。 うん、本当に「雰囲気だけ」ですが、「雰囲気だけ」掴めばO.K.です。 繰り返しますが、あとは「公式適用」、つまり、「条件付き確率の公式」に「当て嵌める」と。非常に「受験勉強的な」態度で最初は結構です。これ以上「理解しよう」とすると、ドツボに嵌まります。 問題のパターンに従って、「普通の確率の問題」なのか、「条件付き確率の公式」を当て嵌めるべきなのか、考えれば良いだけ、です。 >逆確率について少し調べてみたのですが難しくてさっぱりでした。 多分、「意味」がサッパリ、になるんですよね(笑)。追求するとわけが分からなくなります。もう一度言いますが、暫定的には「理解する」と言う事に関しては放棄した方が良い、です。「理解しよう」とすると十中八九躓く、んです。 そもそも、前書いた通り、逆確率とは、「既に起こっている事に付いての確率を求める」と言う、ちょっと「あり得ない」ように見える問題形式だ、ってのがネックと言えばネックなんです。つまり、事実上、「今、起きてる事象」か「今、起きてない事象」に付いての確率を問うているわけで、本来だったら100%か0%かどっちか、なんですよ。客観的な話をすると。でも何故か「その間の数値」が出てくる。これは怖い結論に繋がる、のです。 例えば、「クイズミリオネア」で次のようなシチュエーションがありますよね。 みの:「さあ、どうしますか?」 回答者:「すいません、ライフラインで。」 みの:「ライフライン。どれを使いますか?」 回答者:「フィフティ・フィフティで。」 みの:「フィフティ・フィフティで。さあ、これで選択肢が二つになった。どっちを選んでも1/2の確率です。」 とか。 さて、「どっちを選んでも1/2の確率」……。本当にそうか(笑)? 「悩んでいる回答者」にとっては1/2の確率でしょう。「分からない」から選択肢を減らした。 ところがですね~~。司会者のみのもんたさんは当然「解答を知ってる」わけですよ。みのさんにとっては残った選択肢のうちの一つは「100%で正解」、他方は「0%で正解」なんです。つまり、回答者とみのさんは「同じ確率を共有している」わけじゃない、んです。 これは視聴者にとっても同じでしょう。たまたまその問題に明るくない人が観てたら「回答者」と同じ気持ちになって、「1/2の確率だ~~!」ってドキドキするわけですが、たまたま「答えを知ってる」視聴者だったら、「確率1/2」と言う数値は「バカバカしい」です。 つまり、「観察者がどう言う情報を持ってるのか?」で「確率は変わる」って言う結論なんです。件の問題でも「目を瞑ってなければ」壷Cから選んだら「壷Cから選んだ」事を知ってるんで、これは確率を問うのがバカバカしくなるでしょう。 「観察者によって確率は変わる……」と言うのは、それこそ「感覚的には納得しやすい」んですが、よくよく考えてみると、そもそも「確率」なんてのを(少なくとも普通の教育過程で)導入した最大の理由は「客観的指標」が欲しかったから、ではないのか?「観察者によって確率が変わる」のを認めてしまうと「客観的指標を放棄する」と言う意味になり兼ねません。突き詰めていくと、「何の為に確率を計算するのか?」と言う根本的な問いになってしまって、従って「客観的指標を放棄した」確率なんてわざわざ計算する必要があるのか?と。そもそもの「確率を勉強/計算する動機」も疑わしくなってきちゃうのです(笑)。 「俺は一体何の為に何を計算してるんだ?」 と(笑)。 だから、「理解しよう」と追求しない方が良い、わけです(笑)。確率・統計の専門家にでもならない限り、このテの「哲学的な問い」には「一切関わらない方が良い」と(笑)。んで、実は、この「確率とは一体何だ?」と言うのは結論が出てないんで(笑)、専門家同士でも喧々囂々やり合っています(笑)。単に初学者的には「スルー」しておいて、ある種の「パターンの問題」に関しては、機械的に「条件付き確率の公式」を適用した方が、精神衛生上良い、わけです。 (この「放棄する」を徹底したのがコルモゴロフ、と言う人です。彼は「確率の意味」に関しては取り合えず「考えない」事にしました。) ちなみに、メールを「普通のメール」「迷惑メール」に自動に振り分けるソフトで「スパムフィルタ」と言うものがありますが、これがこの「逆確率」と言う考え方を用いています。 例えば、「メールが届いた」時点で、実際はそのメールが「普通のメール」なのか「迷惑メール」なのかは「確定」しています。人間が見れば一発、ですよね。恋人から送られてきたメールは「普通のメール」ですが、例えば楽天市場とか(笑)から送られてきたメールは迷惑メールだ、とか(笑)。まあ「すぐ分かる」わけですよ。 ところがコンピュータはそこまで「賢くない」んです。まさしく「目を瞑った被験者」ですね。つまり、送られてきたメールは実際は「普通のメール」なのか「迷惑メール」なのか確定しているわけですが、それを「逆確率」を用いて「迷惑メールである確率」を計算します。それで判定している仕組みのソフトが多い、です。 壷と赤玉の問題と対比してみれば面白い、とは思いますが、単純には、例えばsexと言う単語を含んだメールの「迷惑メール確率」と言うのを条件付き確率の公式を用いて計算したりします。 P(迷惑メール|sexと言う単語を含む)=P(sexと言う単語を含む|迷惑メール)*P(迷惑メール)/P(sexと言う単語を含む) ここで、P(sexと言う単語を含む|迷惑メール)、ってのが要するにデータベースから抽出した「データ」なんですが、これを利用して配信されたメールが「普通のメール」なのか「迷惑メール」なのか、条件付き確率の公式を用いて計算します。 実際は、「たった1単語を使って」計算する事はないわけですけど、大まかには、メールのテキストをスキャンして、各単語毎に基本的にはこの公式を用いて逆確率を演算して、判定、と言うような流れになっています。
お礼
すばらしいご説明ありがとうございます。当方、数学が大の苦手で参考書とうの解説を見ると数字と文字の嵐に目眩がするのですが、非常に具体的で頭にイメージがスッと入ってきます。 失礼な言葉遣いで言うと「一体何者だ!?」というくらい感動的な説明でした。数字が出てこないのに感動、例が身近で感動、そして読んだだけなのにいつの間にか漠然とわかったような気がして感動。いつもならテキストの解説を穴が開くほど繰り返し読んでも窒息しそうな気分にしかならないので・・・ 今回はお付き合いいただいて本当にありがとうございました。必要最低限の理解は与えていただけましたので回答のほうを締め切らせていただこうと思います。
- cametan_42
- ベストアンサー率62% (162/261)
>前者と後者で何が異なるのか理解できない私はやはりこの程度なのでしょう(泣) いや、そんなに悲観したものでもないですよ(笑)。 ハッキリ言っておきますが、「統計」習いたてで、この問題の意味が「完全に分かる」なんて人はそれこそ90%以上「いません」。「理解できる」とか言ってる人は殆ど「教科書鵜呑みで解法丸暗記出来る」タイプの人だけ、でしょう。 反面、「問題の意味を真面目に考える」タイプだとほぼドツボに嵌まります。「意味が分からない」し、数式展開上は「そうならざるを得ない」んですが、かと言って、「得られた数字の意味」を真剣に考えてみると、この計算はどこまで「客観的な指標」を与えてくれてんのか、あるいは何らかの客観的意味があるのか?全然分からなくなります(笑)。ある種「非常に危険な」問題なんです。 だから、通常は「数式的にはこうなる」程度で「流しておく」んです。深みに嵌まればドツボです。 こう言う「危ない」問題は、まずは「何も考えない」のが得策です。「確率の意味」なんて追求しない。意味を追求するのは専門家の方々に任せておけば良い、ってのが「取り合えずの」暫定的な処置、になるでしょう。 つまり、「問題のパターンを読んで解法を見る」ってのが良いでしょう。 >逆確率というのは初耳です。こんなことも知らずに投稿してしまって申し訳ないです・・・ 逆確率、なんてのは初学者向けの統計の本にそんなに詳しく書いてないです。何故なら、やっぱり「アブない話題」になり兼ねない、からですよね(笑)。別名、「原因の確率」とか呼びます。 問題の形式として覚えておいた方が良いのは、 1.今、「まだ起こってない」現象に付いての問題→普通の確率計算 2.「既に起こった/起こっている」現象に付いての問題→原因の確率(逆確率) と言うパターンがある、って事ですね。今回の問題だと2番目のパターンです。この「パターン」さえ分かれば、解法自体は特に難しくなく、「既に確立している」ので、「条件付き確率の公式」に当て嵌めて解けば良いだけ、です。この問題の場合は「赤玉自体は既に取り出されている」と言うトコがポイントです(と言う事は、実は「壷も既に(どれか分からないにせよ)選ばれている」と言う事でもあります)。 「既に起こった事」に対して「原因を推定する」のが逆確率(あるいはそのまま「原因の確率」)なのです。 上の書き方だとまだ抽象的でしょうから、あんま良い例じゃないかもしれませんが、次のようなシチュエーションを考えてみます。 1.明日の降水確率は何か? まあ、「降水確率の求め方」の技術的な話はさておき、パターン的にはこれは1番のパターンです。「明日雨が降るかどうか」なんて誰にも分からない。これは一般的には「普通の確率の問題」に分類して良いでしょう。 ところが、こう言う形式の問題が「あり得る」んです。 2.今、雨が降っています。今の降水確率は何%? まあ、十中八九「んなバカな!!!」とか思うでしょうね(笑)。「今、雨が降ってるんだったら降水確率は100%に決まってんだろ!!!」と。お怒りになるかもしれませんが、これが実は「逆確率」を使う問題のパターンなのです。「既に雨が降っている」と言う状況で、降水確率を尋ねるような問題ですね。 パターン的には「この通り」なのが「原因の確率」型の問題なんですが、ちょっとシチュエーションに凝ってみると、面白くなってきます。 例えば、 ・あるヒッキーUさんは、窓は雨戸で閉めきっていて、完全防音の部屋に住んでいる。テレビもラジオもネットもやらない。 と言うような感じにする。そうすると、ヒッキーUさんは「外で雨が降ってるかどうか」分からないわけですよ。 今、ビニールに包まれた新聞が玄関の戸に付いてるポストに投函された。そのビニールは「水滴が付いて」るわけです。 さて、「今の降水確率は?」となると、これは確かに2番のパターンなんですね。新聞のビニールに「水滴が付いてた」と言う情報を元に「水滴が付いた原因=外は雨なのか否か?」推定しないといけないとする。これが「逆確率(原因の確率)」の考え方、なんです。 つまり、ここでのポイントは、「雨が降ってる」あるいは「降ってない」って事象自体は「既に確定」してるんですね。どっちか、なんですが、単にヒッキーUさんが「知らない」だけで。 余題と比較してみれば良く分かると思います。被験者が「目をつむって」ただけで、実際は「壷は既に選ばれている」わけですし、「赤玉を既に引いちゃった」わけですよ。普通の「未来予測的な」確率じゃなくって、トピックは「既に起きた事」に関する推測になっている、んです。
お礼
度々ありがとうございます。前回いただいたご回答をきっかけに逆確率について少し調べてみたのですが難しくてさっぱりでした。 ですが降水確率の例で少し感覚的に雰囲気を掴むことができました。 下調べもせずに質問してしまいましたが、おかげで助かりました。この機会がなければ私は一生もやもやを抱えて生きていくところでした。 このたびは本当にありがとうございました。
お礼
ご回答ありがとうございます。実際の問題は確かにご指摘の通り、 >赤玉を取り出した。その赤玉が壷Cから取り出された確率はいくらか? というものだったと思います。別物だったとは考えもしませんでした。 逆確率というのは初耳です。こんなことも知らずに投稿してしまって申し訳ないです・・・ 前者と後者で何が異なるのか理解できない私はやはりこの程度なのでしょう(泣)