• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:Mann-Whitney検定を採用できる2群の前提条件)

Mann-Whitney検定の前提条件とは?

このQ&Aのポイント
  • Mann-Whitney検定は正規分布していない二つの群について有意差検定を行う方法です。
  • 研究者の中には、比較する二つの群が等分散である必要があると主張している人もいます。
  • 2群のサンプル数に差がある場合でもMann-Whitney検定は使用できますが、注意が必要です。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.4

たびたび申し訳ありません。 Ansari-Bradely検定の記述をもう一度確認してみましたが,今回の場合では不適切ですね。Ansari-Bradely検定は,代表値が(ほぼ)等しい時に,散布度(分散)に違いがあるかどうかを調べる検定法です。 今回のように,代表値に違いがあるかどうかを調べる場合には,この方法は不適切ですね。 そうすると,等分散かどうかを調べるのならば……仕方ないので,一般によく使われる「F検定を用いた等分散の検定」(正式名称ではありません)を使うのはどうでしょう? まあ,Ansari-Bradely検定で中央値が著しく異なる場合は,各条件の中央値をそれぞれ引いた値に対して,この検定を適用するなどの方法も考えられていますが…… なお,参考にした本は,既に絶版の「ノンパラメトリック法―新しい教育・心理統計」(岩原信九郎,1964年)です。

greenvs188
質問者

お礼

お礼が遅くなってしまい申し訳ありません。たびたびのご回答ありがとうございました。正規分布しないケースで等分散を検定する方法は難しいようですね。一応、F検定を用いると等分散は棄却されてしまいました。まだ、いい解決案が決まりませんが、どうにか乗り切れるように考えてみたいと思います。

その他の回答 (3)

  • selfer
  • ベストアンサー率76% (104/136)
回答No.3

今,思い出したのですが,Ansari-Bradely検定は,データ数がおおよそ等しいという検定の基本条件が守られていないと使えない検定法だった気がします。だとすると,90と700というサンプル数が大きく食い違う今回では使えないのではないかな? とすると,このままでは検定にかけることができないと思います。 もし,私がこの論文の投稿者であるならば,次善策として,900データの中から90を無作為抽出して,データ数を同数にしてから,検定をかけることにします。あまり一般的ではないですが,検定の前提条件を守るという意味では仕方ないとしてこの方策をとります。 一般的ではないので,論文本文中において,どうしてそのような方略を取るかを説明しないといけないと思いますが。 その後は「Ansari-Bradely検定」→「Mann-Whitney検定」という方法も考えられますが,私ならば,一条件のデータ数が90であることから,仮にデータが正規分布をしていないとしても,平均値の標本分布は正規近似をするだろうという「中心極限定理」を持ち出して,通常のt検定を行います(その際,分散が等質でなければ「Welch修正のt検定」を使います)。 以前指摘したようにデータ数の食い違いの大きさがネックになっていますので,これをどうにかしないといけないと思います。 繰り返しますが,上記アドバイスはあくまでも個人的意見にすぎないことに注意してください。なお,Ansari-Bradely検定の計算式がのっている説明サイトは私自身は見たことはありません。

  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

再度登場です。 論文審査者からのコメントとして指摘されたならば,そのコメントに丁寧に対応するのが良いと思います。 > 「Ansari-Bradely検定で等分散を確認した」 検定を行った上で,このような記述を補足した方が良いと思います。 気になる点は,「本当に等分散であるという結果が得られるか」,「いずれにしろデータ数が大きく違うのではないか」です。前者は実際に検定をしてみればよいですが,これで等分散でないのならば,マン・ホイトニー検定は使えないことになります。更に条件が緩い「中央値検定」に切り替える必要があるかもしれません。 しかし,どのような方法を使うにしろ,データ数の違いはつっこみどころなので,予め補足をした方がよいかもしれません(「本来なら,検定は同数データが基本となるが,○○の理由から,同数データを確保することができなかった」など)。あるいは,データ数が多い条件から,改めて無作為抽出を行って少ない条件の人数に合わせるという方法も考えられます。後者は私案であり,一般的に使われている手法ではないことに注意してください。 論文審査コメントへの対処法には「絶対」というものはありませんので,あくまでも私感を述べさせていただきました。

greenvs188
質問者

お礼

たびたびのご回答ありがとうございます。確かに、等分散が仮定できるかかなり怪しいことと、「Ansari-Bardely検定」に関する記述がネットでは見つからないという問題が残っています。もし、記述のあるサイトや本を教えていただければ幸いです。時間がないのでできればネットがいいのですが。。。よろしくお願いします。

  • selfer
  • ベストアンサー率76% (104/136)
回答No.1

こんにちは。 Mann-Whitney検定の前提条件を挙げるとすれば,二条件の各変数の分散が等しいと仮定できる(等分散)と,二条件のデータ数がほぼ等しいということがあげられるでしょう……ただし,この二つの前提条件は,Mann-Whitney検定のみならず,t検定,分散分析,多重比較,その他のノンパラメトリック検定など,多くの検定法の前提条件となっています。取り立てて,Mann-Whitney検定だけに当てはまる前提条件ではないので,数理統計学の教科書ではわざわざ指摘されることがないのだと思います。 ただし,実際の分析データには上記の前提条件を満たせない場合も多く,データ数が一方の変数の二~三倍という場合にも強引に適用しているものもありますが,統計学的には不適切な適用法だと言います(多重比較法の中にデータ数が等しくなくても使えるという手法がありますが,それにしても限度があります)。なので > 今回2群のサンプル数が8倍くらい違います。90と700というような状況です。これについてはMann-Whitney検定を行うことに問題はないのでしょうか。 あります。統計学的には「データを追加して,同数になるようにしてください」というアドバイスが適切でしょう。ただし,実際のデータ分析では強引に適用していることが多々ありますが,「統計学的には不適切だが,現実的に仕方ない」としているだけなので注意してください。 なお,等分散を検定したいのであれば,マイナーな手法ですが「Ansari-Bradely検定」というものが使えます。これの説明文章を探すのが一苦労だと思いますが。

greenvs188
質問者

お礼

早速のご回答ありがとうございます。勉強になりました。実は論文投稿中でして、もっと前に気がつくべきでした。もし、このままの検定の方法で投稿するとした場合なのですが、「Mann-Whitney検定を行う条件として、正規分布していないからというだけではこの検定を適用する条件として説明が不十分ではないか。母集団が等分散と仮定したなど二つの群の有する性質を示すべきではないか」との指摘がありました。質問での「」内の説明と同じ方からの指摘です。例えば、教えていただいた「Ansari-Bradely検定で等分散を確認した」などの記述をすべきなのでしょうか。インターネットなどでMann-Whitney検定を使っているケースを調べても、大抵「正規分布していないから適用した」程度のものばかりなので困っています。もし、ご意見ありましたらよろしくお願いします。

関連するQ&A