• 締切済み

χ^2適合度検定の制約条件について

統計の本を読んでいたら、χ^2適合度検定の行う際、観測値の組の数が5個以上である場合、各組の理論度数が5を超えていれば、多項分布のχ^2分布による近似は十分制度がよく、したがってχ^2適合度検定が可能である、と書いています。そしてこれは経験則だ、と書いてあります。 理論値が5に満たない場合は、近隣の組と合併して理論値が5以上になるようデータをプールせよ、と書いてあります。そして組の数が5よりも小さい場合には、理論度数が5より若干多くとるように、とあります。しかしどれぐらい大きくとればよいのかは何も言及していません。 したがって心配なのは、組の数が3つの場合と、4つの場合です。この場合、各組の理論度数がいくらあればχ^2適合度検定が行えるのでしょうか。あるいはこの場合は理論値が5あれば、だいたい大丈夫だ、と結論できるのでしょうか。

みんなの回答

  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

再度登場します. 今読み返してみましたが,質問者さんが,実務的な問題意識からの質問ではなく,純粋な統計学的疑問からの質問であるという可能性をすっかりと失念しておりました. 数学カテゴリへの投稿ですし,後者のタイプの質問であることを考慮すべきでした.見当違いのアドバイスをしてしまった可能性があります.そうであれば,申し訳ありません.ご容赦お願いします.

adinat
質問者

お礼

ありがとうございます。お礼遅くなり申し訳ありませんでした。実はある資格試験で過去に出題された問題だったのですが、ほんとにそれが正しいことなのか疑問に思って質問させてもらいました。大抵の問題にはたとえば小数第4位を四捨五入して、などとかなり正確な確率を計算させたりもしていて、近似計算で本当によいのかとかたびたび不安に感じていました。確かに今は計算機でいくらでも複雑な計算が出来てしまうので、近似する必要性はそれほどないのですね。

すると、全ての回答が全文表示されます。
  • selfer
  • ベストアンサー率76% (104/136)
回答No.1

こんにちは.同じ内容の質問を繰り返しされているようなので,有益な回答はできませんが,多少アドバイスを書きます. 質問者さんが調べられたように,χ2検定の「期待値5未満」という基準は多項分布の正規近似から派生したものです.質問者さんはどのようなデータであれば,あるいは加工をすれば,近似が上手くいくかどうかを問題にされていますが,正直,今の統計学では,そのような近似にこだわることはもはや得策とはされていません. 正規近似に基づいて統計解析法が開発されてきましたが,現在では,正規近似を仮定しない解析法に統計学者の関心が移っています.つまり所詮,近似は近似にすぎないので,どのような近似になるかにこだわっても意味がないと,統計学者は考えるようになったのだと推測されます. 多少実践的な統計学の教科書であっても「どのようにプールすればよいか」という事細かな指示が書かれているのを,私は知りません.つまり,そのような指示はないと考えた方がよく,また,その指示を発見して,質問者さんがその指示に従って分析をしても,後述する「直接確率法を使えばいいじゃないか」と反論されてしまうでしょう. 現在の統計学では,質問のχ2検定については,近似確率を求めるのではなく,直接確率を求めよ,という指示がされます.無論,直接確率をするのは手計算ではかなり難しい(というか,ほとんど無理)ので,専用の統計ソフトが必要になります.とはいえ,直接確率をしてくれる統計ソフトは,例えばSPSSのアドインソフトにそのようなソフトがありますが,数万円で販売されています. もともと統計解析法は多数データの分析法です.よって小数データに適応する場合,どうしても無理があることを自覚し,何かをすれば万全だ,というある意味甘い期待は捨てた方がよいでしょう. そのような自覚をした上で,専門の統計ソフトが使えないのであれば,「仕方なく」期待値5以上になるまでプールするという案を進めていくしかないと思います.

すると、全ての回答が全文表示されます。

関連するQ&A