• ベストアンサー

標準平均Xバーの標準偏差について

たびたびすみません。 http://oshiete1.goo.ne.jp/qa3484149.html を質問させていただいたものです。 まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という のですか? そもそもこの標本誤差というのは何に役立つのでしょうか? 高校の数学の教科書の問題で、下記のようなものがありました。 「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。  この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の  平均Xバーの期待値と標準偏差を求めよ。」 この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 この0.9kgはどんな意味をもつのでしょうか? 100人全体の標準偏差は、「標本標準偏差」というものになり本来は 分母をn-1にして、これが母標準偏差の推定値ということなんです よね?それでこれはだいたい9kgに近いということですよね? (分母をnにしたものを標本標準偏差と呼ぶの?) 文章下手ですみません。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

高校の教科書の問題が意図しているものが標準誤差なのかどうかは分かりませんが、標本平均値のばらつきの程度(つまり平均値の標準偏差)は標準誤差によって表されます。標準誤差が分かると、推定の精度がわかります。詳しくは参考書を読むか、googleすれば分かるでしょう。 > この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 95%の信頼区間は標本平均±標準誤差*1.96で表されます。つまり、今回の場合だと [62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764] となりますから、母平均が60~63の区間に含まれる確率が95%ですよというわけです。 > 100人全体の標準偏差は、・・・ 標準偏差はデータのばらつきの程度を表したものです。今回の場合だと、標準偏差が9なのですから、 [62 - 9 * 1.96, 62 + 9 * 1.96] = [44.36, 79.64] という公式に基づいた計算をすると、標本値(データ)は44kg~79kgの範囲内に95%程度のデータが存在しているというわけです。 > 分母をnにしたものを標本標準偏差と呼ぶの? 違います。分母がnであろうと、n-1であろうとそれはまぎれもなく標本標準偏差(単に標準偏差と呼ぶ)です。分母がnであるのは普通の標準偏差で、分母がn-1であるのは不偏推定量です。不偏推定量の標準偏差だとサンプルサイズが小さくても誤差が少ないというわけ。

shiritai
質問者

補足

ご回答ありがとうございます。 計3回の質問でかなり理解させていただきました。 ところで、 >[62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764] >となりますから、母平均が60~63の区間に含まれる確率が95% とのことですが、今回の教科書の問題では問題文に「平均62kg」 とあります。これがわかっているのだから意味がないのではないか・・・ と思うわけです。

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

> これがわかっているのだから意味がないのではないか・・・ そんなことはありません。この「平均62kg」という平均値は標本平均であって、母平均ではないのです。つまり、推定値であって真の値(母数)ではないということ。 > a <- rnorm(100, mean=62, sd=9) #平均62、標準偏差9の正規分布から100個サンプリング > mean(a) #100個のデータの平均値 [1] 63.74326 > b <- rnorm(100, mean=62, sd=9) > mean(b) [1] 63.1398 > c <- rnorm(100, mean=62, sd=9) > mean(c) [1] 62.29182 上記のように、コンピュータによって、平均が62で標準偏差が9という正規分布に従うデータを100個発生させて、その都度に平均値を求めてみる。そうすると、微妙には標本平均値はばらついているのが分かりますでしょ?

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

期待値や標準偏差をバラツキがあるデータ固有のものと思っていませんか? バラツキがある母集団から標本を採って統計量を計算すればその値もバラツキを 持ちますからそれらも期待値と分散(⇒標準偏差)を持ちます。 例えば、サイコロを転がして出目の平均を求めたとします。 100回振って平均がぴったり3.5になると思いますか(合計がぴったり350) 確率としては結構低いです。(実行すれば合計で330から370ぐらいだと思います) ある程度の標本を採って平均を求めても真の値からの誤差は常に含まれることを覚悟することが必要です。 理論値が分かっているときは『誤差だと思います』でいいですが、理論値が分かっていないときはどうしましょう。 A県の高校生女子の身長を100人のデータに基づいて出したとします。 平均158cmでした。これってどれぐらい正確なデータなのでしょう? 真の平均から誤差はないのでしょうか。(誤差が0.0cmというのはありえそうもないですね) 標準偏差が5cmと分かっていれば(分かってないときは標本から求めた標準偏差で代用するしか ないのですが)5/√100=0.5 という計算結果から 158±2*0.5から真の平均は157から159cmであると確率95%で言えるのです。 逆にもっと精度を上げて幅1cmで結論つけたければ 5/√x=0.25   x=400 標本数が400必要と計算もできます。その結果が158cmなら157.5~158.5の範囲であると確率95%で結論がつけられます。 こういうことをするための標準誤差なのです。 >今回の教科書の問題では問題文に「平均62kg」 >とあります。これがわかっているのだから意味がないのではないか・・・ 教科書だからそう書いていますが、実際にどういうときに統計が必要でしょう。 実際に平均や標準偏差が分かっているときはとる必要がありませんから、 分かっていない時の方がはるかに多いです。そして、それらを理解してもらうための 初期段階として分かっているときの求め方、式の操作を勉強して、やがて推定を勉強して いくのだと思います。算数から数学への移行もまず、数字の計算をしっかり勉強してから 方程式などの勉強に入るでしょう。+-×÷ができなければ方程式、等式変形など できるわけありませんから。それと同じだと思います。 とりあえず、この段階では平均62kg、標準偏差9kgと分かっていても標本を100とって 平均を求めたら60.2~63.8ぐらいのデータが得られそうだということは理解してください。

関連するQ&A