• ベストアンサー

標準偏差について

お世話になっております。 数学が苦手な30歳です。 標準偏差(σ、3σ、6σ)という言葉を耳にしますが、私は、公立高校の文系の出身なのですが、標準偏差について学んだ記憶がありません。 数1、数2、数3、数A、数Bとかあると思うのですが、どのへんで学習するもんなのでしょうか? また、標準偏差(σ、3σ、6σ)について全く知識がありません。 数学が苦手な私でも簡単に理解出来るような説明で教えていただければ幸いです。 もしも、参考になるような参考書やURLなどもありましたら教えてください。 宜しくお願い申し上げます。

質問者が選んだベストアンサー

  • ベストアンサー
  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

確率分布・統計は数学Cらしいです。 非常に粗っぽく説明します。 例えば3mはなれた地点を目掛けてコインを投げ続けると横から見ると富士山の形になります。 釣鐘型とも言います。これは理論的に解明されていて正規分布またはガウス分布と言います。 器用な人と不器用な人では形が違います。 それを表現する数値として標準偏差=σを使います。 全体の約67%のデータが入る幅を2σと言います。(片側は1σ) 同様に4σ(片側2σ)で95% 6σ(片側3σ)で99.7%です。 例えば製品が流れてきたとき片側3σを外れると異常(だろう)と判断します。 2σで判断するときもあります。 ここで標準偏差(σ)は(1データの値-平均値)^2の総和をデータ数で割って平方根を取ったものです。 データのバラツキが大きいほど標準偏差(σ)は大きくなります。

POP7152
質問者

お礼

ymmasayan様 数学Cです・・・勉強してないですね(泣) 大変分り易い回答有難う御座いました。

その他の回答 (4)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.5

あなたが毎朝同じ時刻に家を出ても、職場に着く時刻はバラつきます。原因はたくさんあります。原因がたくさんあってバラつくものをグラフに書くと、釣鐘形になります。この形を「正規分布」といいます。 100日のうち68日は、(中心時刻)±10分の範囲に入っている、とします。このとき「σ」の値が10分である、といいます。3σはこの3倍、6σは6倍です。中心値±3シグマ(30分)の範囲には、1000日のうち997日ぐらいが入ります。 学校などでは「偏差値」という言葉を使います。偏差値55の人の得点から偏差値45の人の得点を引いた値(つまり偏差値の差が10になるような得点差)を「σ」と呼びます。これは、上に述べたσと同じです。その理由を示すには、数学的な証明が必要ですが。

POP7152
質問者

お礼

Ishiwara様 回答有難う御座いました。 もう少しσについて少しずつ勉強していこうと思います。

POP7152
質問者

補足

Ishiwara様 上記について再度質問させて下さい。 (1)「100日のうち68日は、(中心時刻)±10分の範囲に入っている、とします。このとき「σ」の値が10分である、といいます。」 ±10分とありますが、なぜ10分なのでしょうか?1分ではだめなのでしょうか? (2)「1000日のうち997日ぐらいが入ります。」 なぜ997日なのでしょうか?1000日では考えないのですか? 質問ばかりですみません。宜しくお願いします。

  • f272
  • ベストアンサー率46% (8469/18132)
回答No.4

> 標準偏差について学んだ記憶がありません。 と言われると,昔の人(の一部)はびっくりします。 1969年から1980年までの中学校3年生の過程では「標準偏差,相関表,相関図,標本,母集団,標本調査」という用語を用いることができるようにカリキュラムが組まれていました。その後,どんどん教える内容が希薄になってしまったのですね。かわいそうなことです。

POP7152
質問者

お礼

f272様 昔は中学3年生で学習してたんですね? こんな難しい内容を中3で学ぶなんて・・・ 学校での学習内容ってころころ変わってるみたいですね。 回答有難う御座いました。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

最近になって数学Bで確率分布を教えるようになりました。 No.1さんのいうように、今までは数学Cで主にコンピュータ(線形代数)の内容と一緒に統計学(の入門的な確率の話)がありましたが、受験に出ないからと私も勉強しませんでした(^_^;) だから、理系であっても統計に関する部分はあまり勉強しないのでは?と思います(ちなみに私の高校は理系も文系もありませんでしたけど)。 一石「道具としての統計解析」日本実業出版社 という本が初心者でも分かりやすいと思いますよ。

POP7152
質問者

お礼

backs様 理系の人でも勉強してなかった方もおられるんですね。 回答有難う御座いました。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こんばんは。質問者様より年長のおっさんです。 3σや6σという言葉が登場しますから、正規分布の話ですね。 社会人では「ガウス分布」と呼ぶ人が多いですが、高校数学では「正規分布」という名称で習います。 標準偏差というのは、データがどれだけばらついているかの指標です。 こちらのいちばん上の図だけをご覧になってください。 http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83 標準偏差が最も小さいのが赤、最も大きいのが青、平均値がマイナス方向にずれているのがピンクです。 コインを投げて表が出たら+1点、裏が出たら-1点として、決まった回数(N回)だけ投げて合計点数を数えるゲームがあるとしましょう。 横軸に合計点数、縦軸にその合計点数になった回数(頻度)を取ってヒストグラム(棒グラフ)を描きます。 左右対称な山の形のグラフになりそうだということがイメージできるでしょうか? そして、投げる回数(N)を無限回にしたときのヒストグラムが正規分布と同じ形のグラフなのです! (ちょっと難しい言い方をすれば、左右対称の二項分布で個数が無限の極限を取り、さらに、グラフの面積を1に規格化したものが正規分布。・・・このことは数学Cで習います。) もう、これだけで、「標準偏差」と「正規分布」を7割程度以上理解したことになります。 >>>どのへんで学習するもんなのでしょうか? 私は、数学IIICで習いました。 現在の学習指導要領でも、数学Cのようです。 ですから、文系の方は習わないのでしょうね。 (学習指導要領) http://www.mext.go.jp/b_menu/shuppan/sonota/990301/03122603/005.htm 数学IIICの教科書の末尾には、こんな表が印刷されたページがあります。 (計算が物凄く大変なので、コンピュータで計算した数値表を使うしかないのです。) 表A http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html 表B http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm 3σ、6σは工業の用語で、私も散々携わってきましたが、 ・σとは、平均値±σ のこと、 ・3σとは、平均値±3σ のこと、 ・6σとは、平均値±6σ のことです。 No.1様のご回答にある定義(「2σは片側1σ」等)は見たことがないです・・・。 では、実際に、平均値がμ、標準偏差がσの正規分布について、前述の表を利用して確率を求めましょう。 μ+σ より上に外れる確率は、縦軸が1.0、横軸が+0.00のところを見ます。 表Aでは、-∞~1.0 の面積が 0.8413 なので、それより上は、1 - 0.8413 ≒ 0.16 表Bでは、0~1.0 の面積が 0.3413 なので、それより上は、0.5 - 0.3413 ≒ 0.16 つまり、μ+σ より上に外れる確率は16%です。 左右対称なので、μ-σ より下に外れる確率も16%です。 よって、μ±σ から外れる確率は32%です。 同様に、3σ、すなわち、μ±3σ については、外れる確率は、0.26% となります。 模擬試験や受験で「偏差値」というものが使われますが、 あれは、実は、全受験者の得点分布を正規分布に見立てて、 平均点を50、標準偏差を10の正規分布に規格化したものです。 ですから、平均値より10大きい偏差値60は、 「その人より上には、全受験者の16%しかいませんよ」 という意味と思ってよいです。 左右対称を仮定していますから、偏差値40以下(μ-σ より下)の受験者も16%です。 μ+3σに相当する偏差値80は、それより上に0.13%の受験者しかいないという、極めて優秀なことを表します。 つまり、順位がわからなくても偏差値がわかれば、だいたいの順位が推測できます。 自転車通学の人が高校の3年間で1回ぐらいしか遅刻しないようにするためには、どうしたらよいでしょう? 登校回数は、3年間で、ざっくり1000日弱。 ですから、遅刻の確率を0.13%ぐらいにすればよいです。 ということは、登校にかかる所要時間の平均値μと標準偏差σを求めて、 定刻 - 家から出る時刻 < μ+3σ を満たす時刻に家から出ればよいです。 このことからもわかるとおり、 工業における「3σ」(μ±3σ)というのは、 「特性規格や寸法規格から外れる確率を1000個当たり3個未満にしよう」 ということです。 標準偏差σの計算ですが、 σ = √分散 です。 分散の計算は、 ・全品のデータがある場合は、   分散 = {(各データ - 平均値)^2 の合計} ÷ 全個数 ・抜き取りの場合は、   分散 = {(各データ - 平均値)^2 の合計} ÷ (抜き取り個数 - 1) です。 以上だけで、すでに9割方を理解したことになります。 <参考> 単純に μ±6σ の6σという考え方は当然ありますが、 こういう概念の「シックス・シグマ」もあります。 http://ja.wikipedia.org/wiki/%E3%82%B7%E3%83%83%E3%82%AF%E3%82%B9%E3%83%BB%E3%82%B7%E3%82%B0%E3%83%9E 以上、ご参考になりましたら幸いです。

POP7152
質問者

お礼

sanori様 大変細かく回答していただき有難う御座いました。 ここに書かれた内容を理解するにはもう少し時間が必要です。 じっくり内容を理解していこうと思います。