- ベストアンサー
確率はゼロだが可能性がないとはいえないこと
Xが連続的な確率分布、たとえば正規分布に従うとき、Xが特定の値aを取る確率はP(X=a)=0になりますが、X=aとなる可能性がないとはいえませんよね? 世間一般の感覚では、確率=0というと可能性が全くないと認識されていると思います。 そこで質問ですが、そのような可能性の有無を含めて表現できるようなある種の指標のようなものを考えることは可能でしょうか?その指標の値を知れば、少なくともその事象の可能性がまったくないかそうでないかが判断できるようなもので、しかも欲を言うと可能性の大小の評価がまるで確率の値を知るように与えられるようなもののことです。
- みんなの回答 (9)
- 専門家の回答
質問者が選んだベストアンサー
> Xが特定の値aを取る確率はP(X=a)=0になりますが、X=aとなる可能性がないとはいえませんよね? 「ある連続な分布φに従う確率変数Xが何らかの値cを取ったとする。Xが値cを取る確率はP(X=c)=0であるから、そんなことが起こる筈がない。だからXはどんな値も取りえない」 というパラドックスを提起なさっている。ゼノンのパラドックスの確率バージョンみたいで、実に面白いですね。すばらしい発想だと思います。 まさにこのパラドックスが示す通り、連続な確率変数Xがある特定の値aを取る確率P(X=a)を計算しようとしたらおかしなことになりますね。 実は、連続値の場合の「確率」ってのは確率密度φでしか与えられません。例えば、 P(a-Δx < X < a+Δx ) = 2Δxφ(a) のように、確率密度φに幅2Δxをかけ算して初めて確率になるんです。 これは現実の話とうまく整合した概念です。というのは、「Xが特定の値を取った」と言っても、その値はある精度でしか決まらない。いくらかの不確かさを持っています。だから「Xが取った値は無理数であるか有理数であるか」なんて問いは意味をなさないでしょう。 つまり、Xが取りうる値というのは、ひとつの実数aではなく、(φに比べてずっと小さな分散を持つ)ある分布ψだ、と考えねばなりません。Xの値がψに入る実数だというのではなくて、Xの値とはψそのものである、という話です。すると、Xの値がこの分布ψになる確率は P(ψ) = ∫φ(x)ψ(x)dx によって計算され、φ(x)とψ(x)が重なりを持っていればP(ψ)は0でない数値になるわけです。 そこでご質問に戻るなら、φは既知だとして、分布ψの分散を決めるのは何かというと、「Xが特定の値aを取ったかどうか」の判定基準(許される誤差)のキツさである。言い換えれば、Xの値の測定手段が持つ精度によって決まるということです。かくて、 > 可能性の大小の評価がまるで確率の値を知るように与えられるようなもののことです の答は、まさしく上記の積分にほかなりません。 さて、以上の話とはまた別の次元の話として、「確率と統計は違うよ」ということがあります。 確率というのは、いくつかの仮定を置いて、「その仮定が完全に正しいなら」という前提で導き出される数学の定理です。「その仮定が完全に正しいなら」という所を現実には保証できない以上、確率は現実そのものを写している訳ではない。はっきり言えば「現実とは関係がない」のです。 一方、統計は、過去に生じた事象を沢山集積して、「今後も同じように物事が起こるとすれば」という前提で予測をしようとする。(科学はすべてこれです。)その際に、「今後も同じように物事が起こるとすれば」という仮定に加えて、「これまで起こった物事は、ある性質を満たしているように思われる」という洞察をたよりにいくつかの仮定を置いて、「その仮定が完全に正しいなら」という前提で数学によって確率を導く。そして、それを現実に応用してみるのです。 ですから、統計による予測がまるではずれても、「沢山集積した、過去に生じた事象」が不足だった、そこから洞察した「これまで起こった物事は、ある性質を満たしているように思われる」という考え(法則)が間違っていた、そして「今後も同じように物事が起こるとすれば」という訳には行かなかった、などが分かるだけのことです。 従って、現実の事象について > その指標の値を知れば、少なくともその事象の可能性がまったくないかそうでないかが判断できる ような指標がもし作れるなら、それは「統計による予測の根拠(たとえば「Xがある確率分布に従うとき」という前提)がどのぐらいしっかりしているか。どうやってその予測を導いたのか」を評価することによって計算されるような指標である筈だ、と分かりますね。
その他の回答 (8)
- stomachman
- ベストアンサー率57% (1014/1775)
ANo.6へのコメントについてです。 うわ、ずいぶんとお詳しい。どうやら釈迦に説法をしてしまったようだ。 仰る通り、ディラックのδ関数は測度とはまた違う方向からのアプローチですね。ψの幅がうんと狭くなった極限、もう普通の意味での関数ではなくなってしまったのがδ関数だから、{x|δ(x)≠0}の測度はどう測っても0なのに積分は1になる。そこでNo.6の積分でψをδに変えてみますと、積分の結果はやはり確率密度φとなって元の木阿弥。Xがたとえばぴったり√2になる確率は0のままです。 やっぱり「X=aとなる可能性」じゃなく、「もうaと一緒ってことで良いじゃんと思える幅Δaについて|X-a|<Δaとなる可能性」を考えるのが限界なんでしょう。そのとき、有限の幅を持って「もうaと一緒ってことで良いじゃん」と言う場合も、また、その幅がaに依っていろいろ異なる場合も、あるいは(その可能性/Δa)の極限としての確率密度まで行かなきゃ気が済まない場合も、そして測定の不確かさによって否応なく幅が出来てしまう場合も、確率密度(φ・ψ)ならみんなψに織り込んでしまえるんで、「可能性の大小の評価がまるで確率の値を知るように与えられるようなもの」にはぴったしかな、と思うわけです。
お礼
> 「もうaと一緒ってことで良いじゃんと思える幅Δaについて|X-a|<Δaとなる可能性」を考えるのが限界なんでしょう なるほど、でも実際のところはその手法を使ってうまく処理できるというわけですね。 何度もお付き合いいただきありがとうございました。
- kskz
- ベストアンサー率0% (0/1)
No.1, 2への補足についてですが >根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。 「可能性の有無」をそのように定義すると、すべての事象(事象全体の集合は確率空間によってすでに定義されている)は起こる可能性がある、 また実数のすべてのボレル可測集合BについてX∈Bは起こる可能性がある、 ということになります。 この理解で合っていますか。 さらに「可能性の大小」を評価する数値を考えるとは、どのようなことを念頭に置いているのでしょうか? 上記の意味で可能性のある事象に1、可能性のない事象(存在しない)に0を割り当てる、ということではもちろんないと思うのですが。 「可能性」によって事象を区別するとは、(直観的にでもよいので)どのような意味なのですか?
お礼
ありがとうございました。
補足
ご指摘の補足は正確な表現ではありませんでした。 そのご回答だと、「可能性がある」の条件をAとしてAの定義関数を与えればおしまいとなります。 何がいいたいかというと、トートロジー。
- momordica
- ベストアンサー率52% (135/259)
勘違いだったらすみません。 確率密度関数が、質問者さんのおっしゃる「指標」そのものではないかと思うのですが。 例えば、平均0、分散1の正規分布の確率密度関数は f(x)=1/√(2πe^(x^2)) ですが、実際の確率はこの関数を積分したものであり、この関数自体は確率そのものではありません。 例えば f(1)=1/√(2πe)=0.241970725 f(2)=1/√(2πe^4)=0.053990967 ですが、これらはそれぞれx=1, x=2となる確率というわけではありません。 しかしながら、f(1)とf(2)を比較すれば、この確率分布において、x=1となることは、x=2となることに 比べて5倍近く起こりやすい事象であると評価することはできるでしょう。 これはもちろん正確な表現ではなく、実際にはxが「1に極めて近い数値」になるという事象が起こる 確率と「2に極めて近い数値」になるという事象を比較しているということですが。 また、あるxについてf(x)=0であれば、xがその値になることは真の意味で「決して起こらない事象」 ということです。(もちろん、正規分布ではありえません)
お礼
もちろんfの値は確率ではありませんよ。積分しないといけません。 絶対連続な場合一点集合上の積分は明らかにゼロになってしまうわけですし、特異部分を補っても限界があるので、測度以外の道具は何かないかなと思った次第です。 でも気分としては質問の趣旨に沿った認識をいただいたようです。fだと複雑なので他にないかなぁというものです。 ありがとうございました。
- stomachman
- ベストアンサー率57% (1014/1775)
ANo.4の前半部分、追記です。 昔は「真値」「誤差」という言葉を使って、「Xの値(測定値)がaのとき、真値vは v = a - εである。ここにεは誤差で、これは確率分布ξ(x)に従う確率変数である」という風に捉えることが多かったのですが、今では「不確かさを伴わない測定はなく、従って、そもそも真値なんてものはない」という考え方が主流で、たとえばISO規格においても「真値」という概念は一切排除されています。(ま、あまりうるさいことを言わなければ大抵 v = a - ε で事足りるのですけれども。) つまり、「本質的に、実数aの周りに不確かさがくっついているものψ(x)しか得られない」と考える。なので「測定値はaだ」というのは、「 ψ(x)=ξ(x-a)である(ただし、不確かさの分布ξ(x)は平均が0)」ってことです。(No.5さんの「ビュッフォンの針」の場合も、この考え方をすれば変な事は起こりません。) さてNo.4の P(ψ) = ∫φ(x)ψ(x)dx のところをもう少し正確に説明すると、実はこの積分は確率密度を与えます。すなわち微小な区間(s, s+Δs)について、ξ(x-a)のaがその区間に入る確率を考えると、 P(a∈(s, s+Δs)) =Δs ∫[t=-∞ ~∞] φ(t)ξ(s-t)dt ということを意味しています。 これがどうやって出て来るか、簡単に考え方を紹介しますと、φ(x)に従う確率変数Xが微小区間(t, t+Δt)に入る確率は P(x∈(t, t+Δt))=φ(t)Δt また、x∈(t, t+Δt)のとき測定値ξ(x-a)のaがa∈(s, s+Δs)である確率は、 P(a∈(s, s+Δs) | x∈(t, t+Δt)) = ∫[a∈(s, s+Δs)]( ∫[x∈(t, t+Δt)](ξ(a-x)/Δt) dt )ds = ξ(s-t)Δs なので、φ(x)に従う確率変数xの測定値ξ(x-a)のaが微小な区間(s, s+Δs)に入る確率は P(a∈(s, s+Δs)) = ∫[t=-∞~∞] ( P(a∈(s, s+Δs)|x∈(t, t+Δt))(P(x∈(t, t+Δt))/Δt) )dt = Δs∫[t=-∞~∞](φ(t)ξ(s-t)) dt 「測定の話じゃなくて、純粋に数学的な扱いではどうなっているか」というと、こちらは「測度」という概念が不可欠です。最近似たような話をいくつか書いたな → http://okwave.jp/qa/q7391540.html http://okwave.jp/qa/q7418906.html ちうわけで、やはり「無限集合の中のあるひとつの値が実現する確率、というものは0だけれども、有限の測度をもつ部分集合(上記の{x|φ(x)>0}に相当)の中に落ちる確率なら計算できる」という仕組みになっているんです。 別の言い方をすると、確率が0の事象を有限個合わせた集合Aを考えても、「集合Aの要素のどれかが実現する確率」はやはり0。しかし無限個集めたとなると話が違う。その場合、ただ無限個と言っただけでは答が決まらないんで、無限集合の大きさを数値的に表す必要がある。それが「測度」だ、というわけです。
お礼
興味深いお話ありがとうございました。
補足
要するにトータルマス1に対して”針”の落ちる狭い部分の面積が0でないから比で表せば0ではないということですよね? 評価がψに依存するのがちょっとひっかかります。 ディラックδの近似列を打ち切ったものの一つでしょうか? 打ち切るところが気持ち悪いです。
ある種の指標のようなものは、やっぱり現行の確率になると思うんです。 ただし連続確率分布の場合、x=aの確率0は、 ・aにまぐれ当りする確率は、限りなく0に近い. の意味に取る必要はあると思います。以下、ものすごぉ~く、大雑把です。 サイコロの1の目が出る確率は1/6の意味を、 a)サイコロを数回ふったくらいでは出ないだろう. b)でも6回ふったら、1回は出そうだ(もちろん出ない時もある). だとします。しますが、a),b)は、初回で1の目が出るケースを否定はしません。 同様に、x=aにまぐれ当たりする確率0は、 c)有限回の試行では、まず当たらない. d)無限回の試行でも、当たるかどうかわからない. となります。無限回の試行なんて出来っこないので、 e)実行可能な現実の試行回数では、あきらめたら?. となり、確率0の表現は妥当だと思うのですが、それでも、 f)初回でx=aにまぐれ当たりするケースを、否定はしません. 次に事象が起きるかどうかの判定ですが、確率空間を定義するためには、その母集団Xを指定する必要があります。Xは、疑問の余地なく具体的に指定しなければなりません。そうでなければ、確率空間の定義など不可能です。そして、 ・a∈Xなら、x=aは起こり得る. ・a∈Xでないなら、x=aは起こり得ない. になる気がするんですが・・・。よって、a∈Xなら、まぐれ当たりする確率0でも起こりえる・・・。 安易すぎますか?・・・(^^;)。じつはビュッフォンの針問題で、似た状況にぶつかったもので・・・。
お礼
ありがとうございました。
補足
質問内容は連続的な確率変数を前提にしています。有限個しか値を持たない場合については確率0の事象を最初から排除して考えても支障ないので。
連続、あるいは無限個から一つ選ぶ確率は、通常は0とされますね。 もっとも厳密には、その無限の濃度を問うこともあるようですが(0~1が有理数か実数か等々)、一つ(あるいは有限個)を選ぶ確率が0ということは変わりません。 有限個(離散となる)であれば、確率が0というのは「起こりえない」です。 しかし、無限個から一つ選ぶことは、どれに対しても「起こり得ます」ので、有限個から選ぶときのような概念が成立しません。 しかし起こり得る確率0という表現を嫌って、どんな小さい正の数よりも小さい「無限小」の確率と表現することもあるようです。
お礼
ありがとうございました。
- okormazd
- ベストアンサー率50% (1224/2412)
理論的には、 P(X=a)=0 なら、X=aとなる可能性は全くありません。 たとえば、普通のサイコロを振って出る目の数が0、や10、-1、3.5などになる確率は、0で、このような目が出ることも全くありません。 「世間一般の感覚では、確率=0というと可能性が全くないと認識されている」ので正しいです。 もし、確率=0なのにそれが実現されたとすれば、なにかの間違いということです。読み間違いとか、混入とかです。 「確率が非常に小さいから、実現されることはない」ということであれば、それは正しくない。実現される可能性はある、ということですが、いつ実現されるかわからないし、永久に実現されないかもしれない。確率は、それについての情報は持っていません。
お礼
ありがとうございました。
補足
根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。
- foomufoomu
- ベストアンサー率36% (1018/2761)
>X=aとなる可能性がないとはいえませんよね? 現実世界では、数値表現の精度があるため、X=aになることは、けっこう多いです。 たとえば、全校生徒に、今使っている鉛筆の長さをノギス(精度0.05mm)で測ってもらって、結果が123.45mmという数字になる確率は、新品の鉛筆の長さが150mmなら、およそ1/3000で出てくるわけです。 こういう状況を考えない(かぎりなく高精度で長さ測定が可能)なら、X=aとなる可能性はまったくないと言えます。
お礼
ありがとうございました。
補足
根元事象全体の集合Ωの部分集合Aについて、Aの確率P(A)が定義されるときに「Aが発生する可能性がある」、P(A)=0のときにAの確率が0、という意味で可能性という言葉をここでは使っています。
お礼
分布ψの考え方は面白いと思いました。 ありがとうございました。