- ベストアンサー
統計:クロス表に関して
クロス表に対してX2検定を行う場合でも明確な理由がない限り両側検定を行うべきなのでしょうか。 また、同じデータであれば、2標本データを対応のあるデータと暑かった方が対応のないデータとして扱うよりも帰無仮説を棄却出来る可能性は高いのでしょうか。 答えられず困っています。 よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
> クロス表に対してX2検定を行う場合でも明確な理由がない限り両側検定を行うべきなのでしょうか。 両側検定を行う必要がある場合は、予想した値に近すぎる結果がでるのを除きたいときです。 どんなに頑張っても、誤差というものがある限りデータはばらつき、理論値どおりにはでません。 そのため、予想した値に近すぎる結果があった場合、予想が正しいと結論付けられるようにデータを改ざんしたのではないかと疑われる可能性もあります。 クロス表に対するカイ二乗検定の場合、検定統計量が0に近いほど理論値(帰無仮説の期待値)どおりの値が得られたということになりますので、両側検定でそれを除くのです。 > また、同じデータであれば、2標本データを対応のあるデータと暑かった方が対応のないデータとして扱うよりも帰無仮説を棄却出来る可能性は高いのでしょうか。 温度の差を調べたのかと少し悩んでしまいました。 冗談はさておき、ご質問の答えとしてはそのとおりです。 例えば、下記のようにAとBの二群の平均の差を検定したいとします。 同じデータについて、初めは対応なしとしてt検定を行うと、帰無仮説は棄却されませんが、次に対応ありとして検定を行うと棄却されてしまいます。 A B 1 3 2 5 3 4 4 6 5 6 > t.test(x$A, x$B, paired = F) Welch Two Sample t-test data: x$A and x$B t = -1.964, df = 7.72, p-value = 0.08644 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.9269095 0.3269095 sample estimates: mean of x mean of y 3.0 4.8 > t.test(x$A, x$B, paired = T) Paired t-test data: x$A and x$B t = -4.8107, df = 4, p-value = 0.008581 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.8388506 -0.7611494 sample estimates: mean of the differences -1.8