- 締切済み
Mann-Whitney Rank Sum TestとU-testの違い?
U-検定を行おうと思っています。STAT32というソフトでは、ノンパラメトリックの2群比較にMann-Whitney Rank Sum Testにあたると思い、検定を行いましたが、SUSで行った結果とまったく異なってしまいました。Mann-Whitney Rank Sum TestはWilcoxon Rank Sum Testと異なるのでしょうか。異なるとすれば、どのように使い分けをすればいいでしょうか。教えて下さい。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- zinchan
- ベストアンサー率49% (97/197)
2群の比較については、データの集まりが、正規分布していると仮定できる場合と、正規分布しているとは言えない場合で異なります。正規分布していると言える標本は、t検定の方が検出力が高くなります。逆に非正規分布の場合は、ノンパラの適切な検定手法を選択できれば、t検定に比べて検出力が高くなります。 さらに、各群の標本が、同じ対象物(もしくはほとんど同じ条件と言える対象物)から得られたデータ(例えば同じ被験者(物)から、使用前、使用後のデータを取るとか、同じ条件の場所で栽培された品種1と2を比較するなど)という、「対応のある」場合と、そうでない(対応がない<独立>)場合とに分けて考えます。 なお、対応2標本と独立2標本か、どちらに相当するのかということでは、データを表にしてみたときに、標本群Aと標本群Bの各データを並べて、同じ対象物から得られたデータとして並べられる(対応)か、または一方の標本群のデータをでたらめに並び替えても、もう一方の標本群のデータと比較するに支障がないか(独立)のいずれかを考えれば、判別できると思います。 ノンパラで行おうとしておられることから、標本群のデータは非正規分布と見なしておられるのですね。 但し、非正規分布だからということで、機械的にノンパラの特定の検定に直ぐ当てはめられるとは限りません。分布の形(分布の仕方)が同じ(と見なせる)場合に、中央値の位置の違いを検定する、もしくは中央値の位置が同じで、分布の形が異なる場合に、分布の形を検定するなどの、ノンパラ検定でも、何を比較したいかによって、得意・不得意なものがありますので、まずはグラフ化して、分布の仕方を確認する必要があります。分布の仕方までが異なっている場合、今まで行った検定に意味がないこともあります。 ノンパラ2群比較においては、分布の形が同じで、分布の中央値の差異を検定する場合に、対応標本の場合はThe Wilcoxon signed lanks test 、独立標本の場合はMann-Whitney検定(The Mann-Whitney test)で行うのが、最も高い検出力で検定できると思います。 一方、分布の中央値の位置が同じで、分布の形の違いを見る場合には、対応標本ならば符号検定、独立標本ならばSiegel-Tukey検定、またはKolmogorov-Smirnov2試料検定を選択します。 対応のある2群の検定で行うべきものを、独立2群の検定で行うと、有意差が出なかったり、有意差があってもその差は小さいと判定されることがあります。 なお、ウィルコクソンの符号和順位検定の場合、対応するデータが同値の組み合わせを数えずに、比較検討できる反復数が最低6つ必要です。それ以下では有意差が出ません。また、対応しているのが前提なので、標本数は同じでなくてはいけません。片方しかデータがとれなかったものは、それをデータとして含めずに検定します。 また、マンホイットニー検定は、片方の群のデータ数がもう一方より多くても少なくても構いませんが、片方のデータ取得数が3つの場合はもう片方が5つ以上、4つの場合は4つ以上のデータがないと、やはり有意差が出ません。反復数は十分に揃える必要があります。 なお、検定ソフトでは、計算手法の違いにより、検定結果が微妙に異なる場合があります。主に補正の仕方の違いや、端数の処理の扱いに起因します。 データの取り扱いが正しくて、そのデータを検定する最適な手法を選んでいるのでしたら、ソフトによって差があったりなかったりと言うことは、微妙な確率(0.05前後)のためで、データ数不足という可能性があります。データ数を増やして、改めて検定し、有意差が認められなければ、結論として有意差が認められないとしか言えません。 最後に。本当は、そもそも、データを集める前に、実験計画を立て、事前に何の手法で検定するかを決めておかないといけません。データは正規分布をせず(もしくは正規分布かどうかは不明だが、計量データとしてとれず、離散数値か順位データとしてしか取得できない場合)、独立標本を比べる実験なので、マンホイットニー検定で行ってみようと決めて、データを集めなければなりません。 もうデータを集められないのであれば、どういう方法で検定したかを明記して、それが信頼できる結果かどうかを自分なりに検証して結論を出すしかありません。