• ベストアンサー

Confidence Intervalについて教えて下さい

Confidence Intervalについて教えて下さい。 エクセルの関数を使って算出はできるのですが、意味するところがわかりません。 概念的には理解できるのですが、 実際のデータで何を意味しているのかがわからないのです。 例えば: ある品物の遅延に関するデータがあるとします。 品物A 4日 品物B 6日 品物C 5日 品物D 5日 品物E 6日 品物F 3日 品物G 4日 品物H 1日 品物I 3日 品物J 7日 ・平均は4.4(平均で4.4日遅延している) ・95%のCIは1.27 となるのですが、この「平均」と「95%のCI」はどういう関係なのでしょうか。ご教示宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • gef00675
  • ベストアンサー率56% (57/100)
回答No.3

>・真の平均値は4.4日 違います。真の平均値が不明だから、推定するのです。4.4は真の平均値に対する推定値にすぎず、真の平均値は、4.4の付近のどこかにあるということです。他の値、たとえば、4.2とか、4.1よりは、4.4のほうが確からしいというだけです。 >・仮に、正規分布をしている、と仮定した場合には信頼区間が±1.27日ある(≒誤差が±1.27日ある) 真の平均値をμと書くことにすると、4.4-1.27≦μ≦4.4+1.27になっている確率が95%であるということです。ただ、4.4や1.27は、今回たまたま得られた10個の標本から算出した値にすぎず、もし、もういちど10個標本を取り直すと、また違った値になるはずです。そのような試行を何度も繰り返すとすれば、全体の95%の割合でμはその範囲にあり(すなわち推定が当たり)、残り5%はその範囲外にある(推定がはずれ)と考えます。このことに母集団と標本を区別する意味があります。 >・つまり、これによりどういう判断をすればよいかと言えば、「4.4日の平均ではあるが、誤差として±1.27日あり得る」ということ(?) ±1.27の幅を許せば、95%の確率で推定が当たると考えられる。そういう意味の誤差です。 >・各々の値が平均値からどれ位分散しているかについては、標準偏差を算出すればよい 個々の値の平均値からのずれは、「偏差」といいます。標準偏差とは、偏差を2乗して足してn-1で割ったものの平方根であり、これは標本が全体として平均値のまわりにどれぐらいばらついているかを表す指標の一つです。

ikedica
質問者

お礼

ご丁寧にありがとうございます。 非常によくわかりました。 >このことに母集団と標本を区別する意味があります。 特にこの部分がしっかりと理解できました。 本当に有難うございました。

その他の回答 (2)

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.2

>実は直接の関係はまったくありません これはちょっと言いすぎだったかな。 「事前分布として正規分布を仮定している」場合には、 標本平均は母平均の不偏推定量かつ最尤推定量です。 この場合であれば、品物Aから品物Jの遅延日数という過去の実績をもっているときに、 この品物の遅延日数の真の平均値(無限回、品物を買った場合の遅延日数の平均)は、4.4日である、 と結論することが、最もよい推論方法ということです。

ikedica
質問者

お礼

早速ご丁寧にご回答頂きまして有難うございます。 ポイントの理解が正しいか確認をさせて頂いても宜しいでしょうか(すみません、数学センスがないものでして…)? ・真の平均値は4.4日 ・仮に、正規分布をしている、と仮定した場合には信頼区間が±1.27日ある(≒誤差が±1.27日ある) ・つまり、これによりどういう判断をすればよいかと言えば、「4.4日の平均ではあるが、誤差として±1.27日あり得る」ということ(?) ・各々の値が平均値からどれ位分散しているかについては、標準偏差を算出すればよい 標本、母集団の概念についてはもう少し勉強してみます。 各々、調べてみると独立したものとして理解はできるのですが、関係性を理解出来るよう勉強してみるつもりです。 本当に有難うございました。

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

一言で言えば、 ・「平均」は標本平均のこと、 ・「信頼区間」は、(母集団が正規分布に従っていると仮定したとき に)母平均が95%の確率で入っている区間です。 もうちょっと正確に言えば、事前分布として正規分布を仮定した場合に、与えられた標本のもとで、母平均が信頼区間に入っている条件付確率(事後確率)が95%になる、ということです。 というわけで、「平均」と「信頼区間」には、実は直接の関係はまったくありません。極端な例だと、母集団の事前分布として正規分布ではなくて変な形の分布を仮定すれば、標本平均が信頼区間の中に含まれないということもありえます。 まず、標本とか母集団とかいう概念は分かりますか? これが分からない場合には、補足してくれれば、気が向いたときに追加で回答するかもしれません。(あんまり期待しないでください)