- ベストアンサー
検定・推定で使用する確率分布
検定・推定を行う際に、 確率分布を選択しますが、どうやって確率分布を選ぶのでしょうか。 参考書の問題をやると 普通にt分布とかカイ二乗分布等が指定されているのですが どうしてその分布を選択したかが分かりません。 実務上、あるデータの集合があった場合、 どの確率分布を使用するかどうやって決めればよいのでしょうか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> 実務上、あるデータの集合があった場合、どの確率分布を使用するかどうやって決めればよいのでしょうか? 確率分布は現象のモデルなので、当人が「この分布で良い」と思えることが、まず必要です。そして実務上なのですから、さらにそれを他人に納得してもらう必要があります。これはやっかいな問題で、明確な答えは今も将来もありません。 たとえば一定時間内に到着する客の数にはポアソン分布をよく使います。それには理論的な根拠ももちろんありますけど、計算が簡単だから使うという側面も強く、反証があげやすいです。「ポアソンじゃなく集団到着だ」と言えば、多くの場合は集団到着の方が正確です。しかしそれにはまた反論があって、「ポアソンはパラメタが 1 つなのに、集団到着は 2 つだ。だから当てはまりが良いのは当然だ」というのも、正しいです。じゃあどっちが良いかは目的やデータによります。ポアソンなら単位時間あたりの客数を数えればすむのに、集団到着だと集団の数とそれらの大きさがいりますし。 また、たとえばねじの外径の測定値が正規分布すると言うと、それに反対する人はほとんどいないでしょう。しかし正規分布なら負の値を取る確率が正なのに、ねじの外径が負の値をとることはないので、その意味でモデルとしては不適切なことは、論理的には明らかです。それでも異を唱える人が少ないのは、 - 正規分布と思っても困ることはほとんどない、 - 正規分布とした前例が見つかる、 - 正規分布でないとした場合の標準的な手順がない、 など、消極的な理由の積重ねによります。 このように「こういう現象ならこの分布」という、いわば通念みたいなものが世の中にあって、それに合えば人に納得してもらいやすいわけです。通念がくせものですから、明確な答えはありません。新しい分析技術が流行すれば、その通念も変わります。だから昔はなかったのに、今はよく見る分布もたくさんあります。
その他の回答 (1)
- kgu-2
- ベストアンサー率49% (787/1592)
>どうしてその分布を選択したかが分かりません。 素直に、t検定ならt分布、カイ2乗検定ならカイ2乗分布、F検定ならF分布。 >あるデータの集合があった場合、どの確率分布を使用するか ご質問の真意は、どの確率分布⇒どの検定法を使用するか、の感じを受けますが。 これは、「習うより慣れろ」で、例題をたくさん熟して、慣れて下さい。
お礼
回答ありがとうございます。 まずは例題からですね。
お礼
非常に良くわかりました。 ありがとうございます。