- ベストアンサー
パラメトリックとノンパラメトリック、母集団(統計)
最近、統計の勉強を始めたばかりで、行き詰ってしまいました。 パラメトリック検定とノンパラメトリック検定のどちらを使うかで困っています。 教科書やホームページ等、いろいろと調べた結果、「母集団の正規性で使い分ける」と「標本の正規性で使い分ける」という、2種類の表現がありました。 どちらが正しいのでしょうか? どちらも正しいのでしょうか?? また、母集団というもの自体もよくわからなくなってしまいました。 例えば、A点とB点で1分間隔で3時間、気温を測定したとします。 この時の母集団は何でしょか? A点とB点で有意な差があるかどうかの検定はどのような検定法が良いのでしょうか?? 教えて下さい。 よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
分布が正規分布に近い場合にはパラメトリック法という計算手法がとれます。(正規分布に近くない場合はノンパラメトリック法を用いる) さらにパラメトリック法において、「2群」を比較する場合、「対応のある場合」(例えば薬を投与してその人達の前後の変化を比較する場合)と「対応のない場合」(例えばA群とB群でそれぞれ異なる薬を投与して投与した際のデータを比較する場合)に分けます。 「対応のある場合」にはPaired t-testというt検定を用います。 「対応のない場合」かつ「分散性が同じ(A群とB群でグラフの形が近い)」場合にはStudent t-testというt検定を用います。 「対応のない場合」において「分散性が同じ」かどうかを確かめるのに、F検定を用います。 グラフが正規分布を示さないノンパラメトリック法の「2群」比較において、「対応のある場合」にはWilcoxon符号検定を、「対応のない場合」にはMann-Whitney U検定を用います χ^2検定は有意差があるかどうか(疾患に対して既存薬と新薬を比較した場合に差が生じるかどうか)を調べる手法、つまり「帰無仮説を棄却できるかどうか」を見る方法です。
その他の回答 (1)
- backs
- ベストアンサー率50% (410/818)
理論的に正しいのは「母分布が正規分布であるかどうか」ということですが、現実に母分布が正規分布であるかどうかなど確認のしようがありません。だから、標本の分布をみて「母分布が正規分布であると仮定することが妥当である」という判断をするわけです。教科書に「標本の正規性で使い分ける」と書いていあったというのは、おそらくそういう意図でしょう。 > A点とB点で1分間隔で3時間、気温を測定した 母集団というのは一義的に決まっているものではなく、分析者が何を母集団と定義するかによるのです。例えば広い体育館の温度を知りたいとして、複数の観測地点でA地点とB地点を代表として選んだという意味であれば、母集団(母数: 真に知りたい値)は体育館の温度でしょう。それとは別に、A地点から得られる値が知りたい(真に知りたい温度は体育館の温度ではなく、A地点より得られる温度である)場合は、母集団はA地点の観測値ということになるでしょう。 > A点とB点で有意な差があるかどうかの検定はどのような検定法が良いのでしょうか?? この情報だけでは分かりません。A地点とB地点での気温変化(変動)がどのように移り変わるかが不明だからです。 例えば、2時間連続の計測で、A地点は内1時間半は日光に照らされている。一方でB地点は30分しか日光に照らされていない。でもこれは季節や、その日の天候によって大きく変動するので、単純に2地点の平均値を比較しても意味がありません。
お礼
早速の回答ありがとうございます。 とてもわかりやすい説明で納得しました。 標本自体が明らかに正規分布でない場合は、ノンパラメトリック検定を行った方が良いわけですね。 質問に書いた例が説明不足で申し訳ありません。。。 例えば、気温がほぼ一定の場所で、全て同じ条件下でAとBの2種類の温度計を用いて測定を行ったとします。 こうして得られた結果から、AとBの温度計に有意差があるかどうかを検定することは意味があるでしょうか? もし可能であるならば、どうのような検定方法が適しているでしょうか? 重ねての質問で恐縮ですが、教えて下さい。
お礼
まさに知りたかった内容です。 大変参考になりました。 ありがとうございます。 また、行き詰った時は質問を立てますので、もし見かけましたらお助け下さい。 本当にありがとうございました。