区間推定の問題
鳥居泰彦先生の書いた「はじめての統計学」という統計学の入門書の153頁にある問題なのですが理解できません。教えていただきたいです。
問題文:あるエレベーター(11人乗り)の利用客の一人一人の体重の母標準偏差は、σ=10kgである ことがわかっている。利用客の中から121人を選んで調査したところ、標本の平均体重は 65kgであった。
(Question):信頼係数95%のもとでは、満員(11人)での総体重をどのくらいに見積もればいいか。区 間推定せよ。
エレベーターを利用する人達の体重xは正規分布に従っていて、x:N(μ,10^2)である。
n人の体重xの和の分布は正規分布の再生性より、N( nμ , n*10^2 )に従っている。
つまり、11人の体重の和の分布は、N( 11*μ , 11*10^2 )に従っていることになる。
体重xの母集団から11人を標本抽出したときの標本平均は、N( μ , 10^2/11 )に従う。
N ( μ , 10^2/11 )に従う標本平均(平均体重)が11人集まった時の総体重は、標本平均を11倍したと考えると、標本平均を11倍した総体重の分布は、N ( 11μ , 11^2*10^2/11 )に従うので、総体重の母平均11μを信頼係数95%で区間推定すると、
65*11 - 1.96*10*√(11) ≦ 11μ ≦ 65*11 + 1.96*10*√(11)
715 - 1.96*33.1662 ≦ 11μ ≦ 715 + 1.96*33.1662
650 ≦ 11μ ≦ 780
となる。
以上の様に考えると答えが合うのですが、どうもスッキリしません。理由としては、標本平均を11倍したと考えましたが、標本平均は正規分布に従っているから標本平均を11人分足したものは正規分布の再生性より、N ( 11μ , 11*10^2/11 ) に従うので、総体重の分散は10^2となり、総体重の標準偏差は10になってしまい、答えと合わなくなります。
また、標本の平均体重65kgは121人を選んで調査したと問題文に書いてありますが、これは121人分の体重を加えて121で割った値なのでしょうか?それとも11人を1つの標本として11回抽出して、11回平均体重を出して、この平均体重の平均が65kgなのでしょうか?だとしたら根本的に間違っているきがします・・・。
この問題の解き方を教えていただきたいです。正規分布の再生性の理解に問題がありましたらご指摘ください。
補足
回答をありがとうございます。書かれたことはよく分かります。 もしかしたら、私の質問の仕方がまずくて、意図が伝わっていないのでは ないかと思い、少し補足させてください。 たとえば、ある市に20の高校があるとします。全部の高校の全生徒が参加して 統一模擬試験を実施します。その結果は正規分布に従うものとします。 さて、試験の当日に何らかの事情が発生し、もっとも優秀な1高校だけが試験を 実施できなかったとします。得られた試験結果のデータは、当然無作為抽出では ありません。残りの19校のデータから、標準偏差と平均を算出してもいいのですが、 知りたいのは、優秀な1高校が参加した場合の分布はどうなっていたか、なのです。 19校も参加したわけですから、地道にデータを拾ってグラフ化していけば、かなり 正確なグラフがかけます。一部分データの欠落(最優秀の高校のデータ分)が ありますが、それらを補って全体の分布を描くことも不可能ではないと考えます。 もちろん、不正確さが発生するのは覚悟の上です。 この作業を、手作業でやるのではなく機械的に、つまりコンピュータプログラムに やらせたいのです。 もしそれが可能であるならば、参加しなかった高校が、2校、3校……と増えても 信頼性は落ちるにせよ、元の分布(すなわち全校が参加した場合の分布)が 推定できるのではないか? と考えたのです。 これが私の意図する、無作為抽出でないデータから、元の分布を復元するという 意味なのです。 お手間を取らせて申し訳ありませんが、なにかご教示いただけると幸いです。