• 締切済み

標準偏差ってなんですか??

ずっと思ってたんですが、標準偏差って、「平均からのズレ」ですよね?それはなんとなく分かるのですが、標準偏差が大きいと何がいえるんですか?公務員目指して勉強しているのですが、そこが分からず、悩んでいます。どなたか教えてください。

みんなの回答

回答No.5

ヒストグラムというグラフの形式はご存じですよね。 例えば、横軸を身長として、身長150~151cmの人は何人、151~152cmは何人、というようなグラフです。 この手のグラフは、それが身長であれ試験の得点であれ、なぜか形が似ています。角を丸くした富士山みたいな形をしてます。 データのバラつきが小さいヒストグラムは、とがって細い富士山、バラつきが大きいと、低くて広がってる富士山に見えます。 標準偏差とは、その富士山の広がり具合を表すために考え出された物です。標準偏差が大きいとは、データのバラつきが大きい(富士山が低く広がってる)ことを意味します。 とんがった富士山でも、広がった富士山でも、 (平均値-標準偏差)と(平均値+標準偏差)の間には、全体のデータ個数のうち約70%が含まれます。 (平均値-標準偏差×2)と(平均値+標準偏差×2)の間には、全体のデータ個数のうち約95%が含まれます。 (平均値-標準偏差×3)と(平均値+標準偏差×3)の間には、全体のデータ個数のうち約99.7%が含まれます。

参考URL:
http://homepage2.nifty.com/crop_shimane-u/kougi4new.htm
  • adinat
  • ベストアンサー率64% (269/414)
回答No.4

標準偏差は「平均からのズレ」の程度を表す一つの指標です。分布のレンジ(範囲)を表す指標の一つでもあります。一概に言えないのは母集団分布に依存するからなのですが、母集団がある程度正規分布に近いという前提がある場合は、だいたいデータのほとんどは平均から標準偏差の±3倍に収まっているという感覚です。これは偏差値の言葉に直せば、ほとんどすべての受験生は偏差値20から80に収まっているという意味と同じです。 たとえば平均が20で標準偏差が3であれば、ほとんど全員が11~29に収まっているという感じですし、平均が50で標準偏差が40なら、10~90にだいたいデータが収まっているという分けです。 ただし上でも注意しましたが、これはあくまでも目安でしかなく、データが正規分布から程遠い場合はここまで正確なことは一般には言えません。しかしながらたとえばチェビシェフの不等式を使って、標準偏差によってデータの散らばりがどの程度かをある程度制御できるのです。とにかく、標準偏差が大きければ大きいほどデータのばらつきが大きい、標準偏差が小さければデータはほとんど平均のすぐ近くにしかばらついていない、そういう風に思われればよいと思います。 それからこれは余談になりますが、平均からのずれを表す指標は標準偏差の他に平均偏差というものも使われたりします。これは各要素から平均を引いて絶対値を取ったもの(つまり平均との差の絶対値)の平均で定義されます。標準偏差が平均との差の二乗の平均(つまり分散)の平方根で定義されたのと比較すると、こちらの方が計算が易しそうに思えるかも知れませんが、実際は絶対値を外すという計算はなかなか面倒で、分散のルートの方が計算はかなり易しいことが多いです。そういうわけでこちらが「標準」偏差と呼ばれるようです。偏差という言葉そのものに「平均からのずれ」という意味が含まれているので、平均偏差っていうのはちょっと違和感あるかも知れないんですけれど、標準偏差を二乗平方根偏差って呼べば平均偏差との違いが分かりやすいかも知れませんね。

  • ysk888
  • ベストアンサー率21% (3/14)
回答No.3

こんな考え方はどうでしょう。 何かを測ります。長さでも重さでも構いません。 何度も測ると誤差が出ますが、その分布が広がっていたら精度が低い、分布が狭い値に集中していたら精度が高い(可能性がある)と考えられます。標準偏差が大きいと、信頼できないという訳です。 別の例としては、製品のばらつきを考えてみるとわかりやすいと思います。最近は重さのばらつきはあまりないと思いますが、ばらつきが多いのは問題ですね。ですから標準偏差は、必要な範囲で小さく抑えられているはずです。 計測では、本当はもっと別の誤差要素を含みますし(標準偏差が小さくても必ずしも精度が高いとは言えない)、製品管理でも現実には単純に標準偏差で制御される訳ではないとは思いますが、考え方として。 ガウス分布(正規分布)の一般的な話で、簡単すぎる例だったらごめんなさい。

回答No.2

1様のご回答は標準偏差についてすごく正当な理解の仕方だと思えます.標準偏差や分散は個々のデータの平均値からのずれの平均を表してるので、私は、これは、一般的なノルム空間(距離空間までは難しいかも)上の概念にまで拡張できるような気がするんですが、今一よく分ってません.

  • shkwta
  • ベストアンサー率52% (966/1825)
回答No.1

標準偏差は、分布の広がりをあらわします。 100人の生徒がいて、テストの成績が全員60点だったら、標準偏差は0です。 1点から100点まで1人ずついるなら、標準偏差は29です。 0点が50人、100点が50人なら、標準偏差は50です。 データの散らばりが大きいほど、標準偏差が大きくなります。

関連するQ&A