- ベストアンサー
平均値±標準偏差は?
質問させていただきます。 平均値±標準誤差はわかるのですが 平均値±標準偏差は何を表しているのかよくわかりません どなたかご教授ください・・・。
- みんなの回答 (16)
- 専門家の回答
質問者が選んだベストアンサー
No13の補足について オリジナルのご質問のなかの、 >平均値±標準誤差はわかるのですが の書き込みで、標準偏差と標準誤差を逆にとっておられるかもしれない、ということに気づくべきした。というのも、標準誤差について書いてあるテキストは少ないからで、標準誤差がわかるなら、統計学の初歩はご理解されているハズ、だからです。 さて、母集団とというのは、自分が対象としようとしている集団全体が、母集団です。例えば、A校の一年生と二年生を比較しようとする場合は、それぞれ1年生と2年生全員が母集団ということになります。ですがら、無限ではありません。 ヒトについての場合は、ヒト全体が母集団になります。実験者が、現在生存するヒト、と断らない限り、理論上は亡くなったヒトや将来生まれてくるヒトも対象になるので、ヒトという母集団は、無限になります。実際は、何歳のヒト、とか条件がつくので、数学的には有限になります。 とにかく、対象としようとするもの全てが母集団で、無限であることは絶対条件ではありません。 母集団は、ひつと一つの集まり全体です。その中から、一つを取り出す操作を抽出、といいます。抽出時には、作為(実験者の意志)が入るのはマズイので、無作為抽出を行います。サイコロをふって決めるのは、イカサマのサイコロでなければ、偶然によって決まるので作為は入らず、無作為抽出になります。最近は、コンピュータで、乱数表を発生させ、それによって決めるとか。 標本は、抽出されて、取り出されたものです。 6人いて、誰に当番をさせるかを決める場合、サイコロを振って決まるのは偶然です。サイコロを振るのが抽出、当番に当たったヒトがサンプルです。 サンプル数は、一つでも、複数でもいいのです。しかし、統計学では、サンプルが一つの場合はマレ(偶然性が強すぎる、あるいは平均も標準偏差が計算できないので全体が見えない)なので、サンプルといえば複数を想定します。 サンプルたち、とお書きにならなくても、複数を対象にしていると判断できれば、そのように想定します。
その他の回答 (15)
- sanori
- ベストアンサー率48% (5664/11798)
また、お邪魔します。 まだ論争(?)が続いてたんですね(笑) 私も、遅ればせながら「標準誤差」という言葉の定義を調べてきました。 標準偏差÷√nだったんですね。 そういえば、これ、実験の基礎知識でした。(「95%」という数字は全く忘れていました) というわけで、あらためて整理しますと、 >実際に測定した値たちの平均値±標準誤差、に値たちの約68%が収まるか? →Yes >真の平均値は、平均値±標準偏差、内に95%の確率であるか? →Yes 2番目のほうは、QCの本で、なんちゃら検定だか危険率5%だかという用語で載ってたような気がします。 以下、引用です。 基礎科学分野の測定の場合,例えば地球の質量や月までの距離を正確に知りたいとき,その値(母平均μ)が中心課題となり,何回かの測定実験による標本平均値から真値がどの範囲にあるか示すため,標準誤差などを用いる。 (下記、参考URL)
- he-goshite-
- ベストアンサー率23% (189/802)
もとの質問については理解が済んだのでしょうか? >平均値±標準偏差は何を表しているのかよくわかりません について,別の観点からお答えします。 正規分布のグラフはご存じですね? 横座標で,平均値+標準偏差と平均値-標準偏差 のところがこの曲線の変曲点です。この横座標の間は曲線が上に凸,その外側は下に凸の形状をしています。 (今までのやり取りをみれば,質問はこんなことを聞いているんじゃなかったんでしょうね,きっと・・・ 失礼しました。でももとの質問だけからは何を聞きたいのかよくわからなかったので,ちょっとわき道にそれてみました )
- kgu-2
- ベストアンサー率49% (787/1592)
No8の回答の補足 >全体(実際測った値たち)の68%が平均値±標準偏差のなかにが収まり、 無限個の中からいくらかずつとりだした平均値は、その都度ずれるものの、その平均値たちの68%は、平均値±標準誤差、のなかに収まる。 で正しいと思います。 ただ、専門用語の、母集団、抽出、サンプル(標本)などを使われて、書き込まれた方が、認識のずれが生じにくくなるので、答えやすくなります。 統計は、何か具体的な問題がないと、勉強しにくい分野だと思います。ご質問の姿勢には好感がもてるのですが、統計学の入門書をもう一度ごらんになるのが一番です。 私の場合は、教科書どおりやってみて、次は教科書なしにトライして分からなくなり、また教科書を見て、の繰り返しでした。 ただ、標準偏差については、どの本にも書いてあると想います。標準誤差については、ほとんどありません。しかし、標準偏差がご理解できようになれば、標準誤差については、「サンプル」の部分を「サンプルの平均値」と頭の中で読みかえれば、それでOKです。
お礼
サンプル=無限個(母集団)のなかからいくつか取り出した(抽出した)値たち でよろしいでしょうか
補足
確かに専門用語を使うと、専門家同士の話のやり取り で、認識のずれが生じにくいのはいえてますが・・・ 専門家じゃない僕自身、用語すらあいまいなものですから・・・・すみません。 僕の頭のなかでは 母集団=無限個のデータ で 抽出?≒サンプル? なものですから、用語を使って話が出来なかったんです・・・ そのせいで、逆に皆様にわかりにくい話になってしまたかもしれません 上の3つについて説明していただけたら幸いです。 本当に素人ですみません。 でも、皆様のお力添えでとても助かりました。
- he-goshite-
- ベストアンサー率23% (189/802)
ゴメンナサイ。またまた訂正です。 「その平均値たちの68%は、平均値±標準誤差、のなかに収まる。」 ここで使われている用語「標準誤差」が, 毎回 (標本の)平均値たちを求めるときに使われたデータの個数の平方根で (母集団の)標準偏差を割ったもの, を意味するのだとすると, すなわち, 標準偏差÷√(標本データの個数) を,ここでいう「標準誤差」だとすれば, そのとおりです! かなり,「その平均値たち」は,平均値に近いところに分布していることになります。
- he-goshite-
- ベストアンサー率23% (189/802)
NO.7&8 再登場です。 あらたなご質問が 「無限個の中からいくらかずつとりだした平均値は、その都度ずれるものの、その平均値たちの68%は、平均値±標準誤差、のなかに収まる。のか?」 ということだとすると,違います。 No.10回答さんの答えでよいです。 すなわち, 「無限のデータたちから有限個のデータたちを取り出して,その平均値を計算する」という操作を何回か繰り返すと,そのいくつかの平均値たちは,もとの(無限のデータの真の)平均値にきわめて近いところに分布することになります。
- sanori
- ベストアンサー率48% (5664/11798)
またまた補足します。 #7さんの回答が気になったのですが、 おそらくsasaallyさんの新たな疑問の2つめは、 「測定した有限個のものの平均値は、無限個全てを調べたときの真の平均値とは異なるものであって、真の平均値が、「有限個のものの平均値±なんちゃら」の中に入っている確率は?」 ということなんですよね? これは、68%という怪しい確率なんかではなくて、ものすごく高い確率になります。 しかも、測定した「有限個」のデータの数によって、変わってきます。 (測定した個数が多ければ多いほど、真の平均値が、測定平均値±なんちゃら の範囲にある確率は上がります。)
- sanori
- ベストアンサー率48% (5664/11798)
#5です。再び。 >実際に測定した値たちの平均値±標準誤差、に値たちの約68%が収まる。 「標準誤差」を「標準偏差」に読み替えると、正しいです。 「標準誤差」って「標準偏差」と同じだったんでしたっけ・・・? >実際に測定しきれないほどの、無限個の平均値は、 >平均値±標準偏差、内に95%の確率であるという解釈は >違ってるのですか? あー、これですね。そんなのも確か見たような・・・。 これは結構難しいです。たしか確率統計だか工業(QC)関係の文献に書いてたような気がします。 その文献が手元にないんで、すぐお答えできません・・・
- he-goshite-
- ベストアンサー率23% (189/802)
あ!ゴメンナサイ 書き間違いに気づきました。 訂正です。 誤:(残りの約38%はその範囲外にあります) 正:(残りのデータ(すなわちもとのデータの約32%)はその範囲外にあります)
補足
みなんさん、つきあってくれて感謝します。 全体(実際測った値たち)の68%が平均値±標準偏差のなかにが収まり、 無限個の中からいくらかずつとりだした平均値は、その都度ずれるものの、その平均値たちの68%は、平均値±標準誤差、のなかに収まる。 ということですか。
- he-goshite-
- ベストアンサー率23% (189/802)
>実際に測定しきれないほどの、無限個の平均値は、 平均値±標準偏差、内に95%の確率であるという解釈は違ってるのですか? →違っています。(キッパリ) 無限個のデータがあったとして,もしその平均値と標準偏差がわかったとします。(どのようにして分かったのでしょうね?) その場合も,無限個のデータの約68%は平均値±標準偏差のなかに入ります。(残りの約38%はその範囲外にあります) ・もとの質問の次の問について: >平均値±標準偏差は何を表しているのかよくわかりません →「標準偏差」というものが,たくさんあるデータのバラツキを表すのに理論的に都合がよいので,多くの理論的議論のなかで用いられます。 で,『「標準偏差」って,もとのデータとどういう関係にあるの?』 という問に対する答えの一つが 「平均値±標準偏差 という範囲の中に,もとデータの約68%が入る という関係があるよ」 というものです。 「その関係について,もうちょっと多く教えて!」という要求に対する答えとして, 「平均値±2×標準偏差の範囲には,もとのデータの約95%が入っちゃうんだよ」とか 「平均値±3×標準偏差 の範囲には,もとのデータの約99.7%が入っちゃうんだよ」などという答えがあるのです。 「さらにもっと知りたい」という物好きのひとのために, 「標準偏差±0.6745×標準偏差 の範囲内に,もとデータの約50%が入るんだよ」 「標準偏差±1.6449×標準偏差 の範囲内に,もとデータの約90%が入るんだよ」 などと,(理論のはなしですから)いくらでも詳しくその関係を述べることができます。 ※ 別に「平均値±標準偏差」だけを特別扱いしなくてもいいのです。d(^_^.)
- kgu-2
- ベストアンサー率49% (787/1592)
>無限個の平均値は、平均値±標準偏差、内に95%の確率であるという 平均値のバラつきは、標準偏差ではなく標準誤差で表します。95%の確率は、標準誤差の1倍ではなく2倍の範囲になります。 したがって「無限個の平均値は、平均値±2×標準誤差のうちに、95%の確率で入る」なら正しいのでは。 下に、以前回答したものがあります。私の知識は、それで全てです。
- 1
- 2
補足
はい! 理解できました有難うございます。 私、質問した当初は 平均値±標準偏差 平均値±標準誤差 を正反対に解釈してました(ーー;) 大変お騒がせしました。