- 締切済み
区間推定の問題
鳥居泰彦先生の書いた「はじめての統計学」という統計学の入門書の153頁にある問題なのですが理解できません。教えていただきたいです。 問題文:あるエレベーター(11人乗り)の利用客の一人一人の体重の母標準偏差は、σ=10kgである ことがわかっている。利用客の中から121人を選んで調査したところ、標本の平均体重は 65kgであった。 (Question):信頼係数95%のもとでは、満員(11人)での総体重をどのくらいに見積もればいいか。区 間推定せよ。 エレベーターを利用する人達の体重xは正規分布に従っていて、x:N(μ,10^2)である。 n人の体重xの和の分布は正規分布の再生性より、N( nμ , n*10^2 )に従っている。 つまり、11人の体重の和の分布は、N( 11*μ , 11*10^2 )に従っていることになる。 体重xの母集団から11人を標本抽出したときの標本平均は、N( μ , 10^2/11 )に従う。 N ( μ , 10^2/11 )に従う標本平均(平均体重)が11人集まった時の総体重は、標本平均を11倍したと考えると、標本平均を11倍した総体重の分布は、N ( 11μ , 11^2*10^2/11 )に従うので、総体重の母平均11μを信頼係数95%で区間推定すると、 65*11 - 1.96*10*√(11) ≦ 11μ ≦ 65*11 + 1.96*10*√(11) 715 - 1.96*33.1662 ≦ 11μ ≦ 715 + 1.96*33.1662 650 ≦ 11μ ≦ 780 となる。 以上の様に考えると答えが合うのですが、どうもスッキリしません。理由としては、標本平均を11倍したと考えましたが、標本平均は正規分布に従っているから標本平均を11人分足したものは正規分布の再生性より、N ( 11μ , 11*10^2/11 ) に従うので、総体重の分散は10^2となり、総体重の標準偏差は10になってしまい、答えと合わなくなります。 また、標本の平均体重65kgは121人を選んで調査したと問題文に書いてありますが、これは121人分の体重を加えて121で割った値なのでしょうか?それとも11人を1つの標本として11回抽出して、11回平均体重を出して、この平均体重の平均が65kgなのでしょうか?だとしたら根本的に間違っているきがします・・・。 この問題の解き方を教えていただきたいです。正規分布の再生性の理解に問題がありましたらご指摘ください。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
#1 です。 あぁ、やっとわかりました。つまり >n人の体重xの和の分布は正規分布の再生性より、N( nμ , n*10^2 )に従っている。 これと >標本平均を11倍した総体重の分布は、N ( 11μ , 11^2*10^2/11 )に従うので これの言っていることが違うって話ですか? 1時間以上何が問題なのかずっと悩んじゃったさ。 正規分布の再生性とは一般にこう書きます。 確率変数X₁、X₂が独立でそれぞれ正規分布N(m₁,σ²₁)、N(m₂,σ²₂)に従うとき、a₁,a₂を定数として Y=a₁X₁+a₂X₂ とおくと、Yは正規分布N(m₁+m₂,a₁²σ²₁+a₂²σ²₂)に従う。 n人の体重xの和、と言ったら個々それぞれの人の体重の和ですから、分散はnσ²になります。個々の体重をX、合計をYとすると Y=X₁+X₂+・・・X₁₁ という計算をしているわけですからね でも平均値を11倍しているのは、個々それぞれの人のことではなく文字通り平均値を11倍しているのでしょう?つまりこういう計算をしているわけです。 Y=11X だから分散は11²σ²になります。 その正規分布の再生性自体の説明や証明は書きません。その教科書に書いてあるんじゃないですか? 平均値は個々の標本の値とは違います。平均値を何倍かしたものと、個々の標本の合計値は違う分布になって当然です。 余談ですが、その教科書の回答は半分余計です。 >つまり、11人の体重の和の分布は、N( 11*μ , 11*10^2 )に従っていることになる。 普通ならここで95%の信頼区間の表を見ればいいのです。 その教科書は11人の和の分布を求めて、それをわざわざ一人一人に分けて(前提条件として一人一人の体重の分布はすでに与えられている)、また11人分にまとめています。 一回自動車を分解して、再組立てして、やっと「お、これはプリウスだ」とか言っているようなものです。
>標本平均を11人分足したものは正規分布の再生性より、N ( 11μ , 11*10^2/11 ) に従うので、・・・ その教科書にN(nμ,n*10^2)となると書いてあるのに、どうしてN(11μ,11*10^2/11)という話が出てくるのですか? 実際、N(nμ,n*10^2)となることを正規分布の再生性というのですが。 分散が大きくなることは、わざわざ証明を読まなくても明らかです。 11人全員が平均以下の場合は平均から大きく離れますし、平均以上なら平均からより大きく離れます。分散が同じってはずはないです。 また、121人の平均、といったら121人の合計体重を121で割った数です。 もっとも、11人のサブグループを11グループ作って、サブグループの平均の平均を計算したって別に構いません。サブグループのサイズが同じなら、どっちで計算しても同じ値が出てきます。
補足
回答ありがとうございます。解法の流れを教えて頂けると助かります。