- 締切済み
正規分布について
正規分布について質問させて頂きます。 正規分布と判断するには歪度,尖度の二つのパラメータをみて,歪度は0,尖度は3に近ければ近いほど正規分布に近いのは分かります。 そこで質問なのですが,10^5のデータ数で,歪度は0,尖度が2.5~3.5くらいのときは正規分布とみなしてもいいでしょうか? またその根拠を知りたいのですが,分かる方よろしくお願いいたします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- stomachman
- ベストアンサー率57% (1014/1775)
> 正規分布と判断するには データをもとに「正規分布と判断する」ということは原理的にできない。「正規分布ではないと判断する」ことなら可能で、それは「実測したヒストグラムのようなものが、確率変数が正規分布に正確に従うにもかかわらず偶然の偏りによって生じる確率」を計算することによって判定します。 (http://okwave.jp/qa/q7623770.html と似たような事情です。) > 歪度,尖度の二つのパラメータをみて,歪度は0,尖度は3に近ければ近いほど正規分布に近い 歪度と尖度(3次、4次モーメント)は、曲線を4次多項式(5次以上の項は無視)で近似したときの係数の話に過ぎません。これだけでは区別できない、正規分布とは全然違う分布が幾らでもあります。たとえばでこぼこが沢山ある分布とか。確率変数が整数値しか取らない場合がその極端な例ですね。 「正規分布とみなしてもいい」かどうか、つまりどの程度の不正確さを容認するかは用途による訳で、もちろん、そうしてもいいという根拠も、用途に応じて論じることになります。 たとえば「そもそも確率変数xを測定した尺度が歪んでいるんだ」とみなして、確率変数xを非線形変換して正規分布に無理矢理合わせる、という方法があります。これを使うとすると、それは「正規分布以外にはあり得ない」ということが前提になっているわけで、「正規分布とみなしていい」かどうかを検討することを放棄しちゃっていることになります。 > 10^5のデータ数 それだけあれば、大抵の用途には、ヒストグラムをそのまま確率密度関数だと思って利用できるでしょう。