• 締切済み

二群間の検定について

体内で、ある現象が起こったか起こらなかったかで その有無で内部情報(心拍数等)変数に差異が見られるか検定したいのですが。 サンプルが 3000人 と 100人 と言う関係です。 t検定を考えましたが、ks検定によって変数に正規性はなく、wilcoxを考えていますが、このサンプル数の差がある場合どのように検定すればよいでしょうか?そもそも検定が無意味でしょうか?

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 3000人ぶんも対照データがあるんですから、必ずしも対照データの分布をパラメータ付きの式で表さなくたっていいんじゃないかな。つまり、「その100人のデータは互いに独立であり、それぞれのデータは、対照データの累積ヒストグラムで表される分布に従う」という帰無仮説をお考えになっては如何。

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

1. 群の大きさの差はさして問題ではないですが、分布の形状 (ばらつき) についての推測が3000人のグループに引きずられるのも事実です。たとえば、t検定で併合分散を計算すると、実質は3000人のデータでの分散とほとんど変わらないことになります。しかし、平均値の推測には問題ないと思います。 2. ks検定で正規性が認められないとありますが、それだけ大きなデータだとわずかな正規性からのずれも有意になってしまうので、それを基にして手法を選択するのはどうかと思います。 3. まずはヒストグラムとか書いてみて、おおざっぱに左右対称で平均値あたりにピークのある分布だったらt検定で問題は起きないと思います。t検定は外れ値には弱いですが、左右対称な単峰性の分布ならば正規分布でなくてもそれほど悪くなりません。

関連するQ&A