- ベストアンサー
統計学(信頼区間)
信頼区間が95%の時、平均±(2×標準偏差)の範囲に値が収まると覚えたのですが、 なぜ信頼区間を求める際には、平均±1.96標準誤差を用いるのでしょうか。 1.96はどこから来た数字なのでしょうか? 2で計算するのではなく1.96で計算するのはなぜでしょうか?厳密には1.96みたいな感じですか? この質問をわかる人が見たら質問の意図も分かりづらいと思うのですが、よろしくお願いします。 (分からないことを質問するって難しい。。)
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
まずは、信頼区間とは何かということを再確認しましょう。 何らかの実験をして平均値mを得たとします。 しかし、もう一度同様の実験を行い平均値を得たとしても、前の値とぴったり同じ値にはならないでしょう。 つまり、平均値mは確率変数であるということがわかります。 mが確率変数であれば、何らかの確率(密度)分布に従っているはずです。 その母平均をμ、母分散をσ^2とすると、適当な正数kを使えば、 μ-kσ ≦ m ≦ μ+kσ を満たす確率が95%にすることができます。 この不等式を変形した m-kσ ≦ μ ≦ m+kσ がμに関する95%信頼区間となります。 次に、kは一体幾つなのかという話になります。 これは、mの分布が何なのかで決まります。 例えば、正規分布ならば1.96ですし、自由度10のt分布であれば2.228となります。 そういうことで「 > 信頼区間を求める際には、平均±1.96標準誤差を用いる のは平均値の分布が正規分布(分散既知)であるからです」ということになります。 では、何故そのとき1.96ではなく2を使うことがあるのかという点ですが、両者の信頼区間の広さの違いを考えてください。 2を用いたときは1.96を用いた時よりも2%程広くなります。 この2%の差が大きいと感じるのであれば1.96を使う必要があり、そうでなければ計算の楽な(暗算でも計算できる)2を使用しても構わないということです。
お礼
まさに私の疑問だったことをピンポイントで教えて下さいましてありがとうございます!!! なかなか調べてもそこに言及しているものに出合えずモヤモヤしていました^^; おかげですっきりしました^^