- 締切済み
統計学の適合度検定についての質問です
統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
> 最初から観測度数と理論度数を「A」と「B~Eの合計」の2種類だけと考えた場合でもこの検定はダメなのでしょうか? 最初からならば、問題ありません。 > 「本当はすべきではない」とのことですがAで計算していただきましたが、これの正確性(?)に欠けるからなのでしょうか? 最初に全体について検定をやって有意であれば、A~Eの真の理論度数は添付画像の数値と異なると言えるので、A~Eのどれが違うのか調べることは当然の流れです。 しかし、全体で有意でなければ、A~Eの真の理論度数は添付画像の数値と異なるかどうかはわかりません。 つまり、添付画像の理論度数で間違いないかもしれないのです。 その場合、A~Eのどれが違うのか調べることはおかしいのです。 (勿論、添付画像の理論度数が間違いという仮説も否定していないのですが) 全体についての結果が有意であろうとなかろうと、次の検定をするのであれば全体についての検定はする意味がないですよね。
カイ二乗検定で”全体”の検定はそれでOKですが、このあとにAのみの観測度数と理論度数を検定することはできません。 全体の検定の結果が有意であったときに、どのセルが理論度数から異なるのか調べます。 つまり、有意な結果でないと差があるのかないのかは全く分からないので、そのあとの検定ができないのです。 ご質問の例の場合ですと、帰無仮説の下では、各セルの実測度数が二項分布Bin(計, 理論度数/計)に従うことを利用して、理論度数から有意に異なるセルを見つけることができます。 全体で有意な結果ではないので、本当はすべきではないのですが、例えば、Aで計算してみると |(60-50)/√(100*50/100*(1-50/100))| = 2 > 1.96 なので、有意水準5%で理論度数と異なると言えます。 (正規分布近似を使った結果です) 「残差分析」について調べてみることをお勧めします。 貴方の検定したい内容によっては「検定の多重性」についても知っておく必要があるかもしれません。
補足
回答ありがとうございます! 再度、質問よろしいでしょうか? 最初から観測度数と理論度数を「A」と「B~Eの合計」の2種類だけと考えた場合でもこの検定はダメなのでしょうか? >ご質問の例の場合ですと、帰無仮説の下では、各セルの実測度数が二項分布Bin(計, 理論度数/計)に従うことを利用して、理論度数から有意に異なるセルを見つけることができます。 >全体で有意な結果ではないので、本当はすべきではないのですが、例えば、Aで計算してみると・・・ 「本当はすべきではない」とのことですがAで計算していただきましたが、これの正確性(?)に欠けるからなのでしょうか? よろしくお願いします。