• 締切済み

標準偏差の意味がわかりません

標準偏差の意味がわかりません。 1  平均との差を求め 2 それを2乗して 3 その総和を求めて 4 データ数で割って 5 その平方根 以上が一般的な標準偏差の説明の説明のようですが、4、5が入れ換わり . . 3 その総和を求めて 4 その平方根 5 その平方根をデータ数で割る ならば標準偏差の値の意味が理解できるのですが? 数学に疎い私でも理解できるような説明をお願いします。 ネット上も探したのですがよくわかりません。

みんなの回答

noname#227064
noname#227064
回答No.6

実際に具体的なデータで平均、分散、標準偏差及び貴方が提案された標準偏差を計算してみましょう。 例1(■で頻度1。以下同様) -1:■ 0 :■■  1 :■ 平均 0 分散 1/2 標準偏差 (√2)/2 提案された標準偏差 √2/4 例2 -1:■■ 0 :■■■■  1 :■■ 平均 0 分散 1/2 標準偏差 (√2)/2 提案された標準偏差 1/4 例3 -1:■■■■ 0 :■■■■■■■■  1 :■■■■ 平均 0 分散 1/2 標準偏差 (√2)/2 提案された標準偏差 √2/8 以上3つの具体例を挙げてみましたが、如何でしょうか? 3つの例は、データ数は違いますが頻度ではなく割合で表示しますと、全部同じであることはお分かりかと思います。 さて、分散も標準偏差もデータが平均からどれだけばらついているかの指標ですが、この例のように割合で表示したときに同じ分布になるものは、ばらつきの指標も同じ値になって欲しいと思いませんか? 残念ながら、貴方の提案された標準偏差では同じにはならず、データ数に依存した値になっています。 データ数が多ければ多いほどその値が小さくなっています。 一方、分散と標準偏差は3つの例で全て一致しています。

回答No.5

例えば、 a,b,c,d,e の5個のデータの平均値は x=(a+b+c+d+e)/5 と、データの個数5で割るから、 標準偏差も同じように、 √{(a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5 のように、   5で割るべきだ。 と考えているわけですね。 √[a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5] だと、   √5 個の平均 になってしまうのではないかと。 この、平均値 や 標準偏差 を学習するとき、 平均値 と 標準偏差 の間に  分散 というのを学習すると思います。 これが、 {(a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5 であり、データの個数5で割ります。 でも、これは 2乗 しているため データの平均値からの 平均的なばらつき を表していない  と考えられ、(← ここの表現はいろいろあるので ウィキペディア等参考にして下さい)     データがテストの点数だと  (得点)^2 データが長さ(cm)だと   (cm)^2 になってしまい、 √ をとる(平方根にする)ことによって、 単位がそろい、 データの平均値からの 平均的なばらつき を表すことができる。 のではないかと。    平均値 → 標準偏差 ではなく    平均値 → 分散 → 標準偏差 の流れを考えれば、理解できるのではないでしょうか。  

a_yamada
質問者

お礼

回答ありがとうございます。 分散までは数字の意味が理解できるのですが?

  • bran111
  • ベストアンサー率49% (512/1037)
回答No.4

1  平均との差を求め 2 それを2乗して 3 その総和を求めて ここまでは一緒です。総和=S、データ数=nとします。 統計では v=S/n (これを分散といいます) をもとめ、この平方根として標準偏差σを決めます。つまり σ=√v=√(S/n) です。 質問者の手順は σ’=√S/n を求めるものであり、 σ’とσの関係は σ’=σ/√n ということです。データ数が100の場合 σ’=σ/10 となり、質問者の方式で得られるσ’は統計で使う標準偏差の1/10になります。 多くのデータは平均値の左右2σの間に95%以上が入ってしまうことが解っています。 この性格はデータの種類、データ数、平均値、標準偏差の値によらず普遍的に認められます。 標準偏差の1/10である、σ’はその意味で何の意味も持ちません。データ数が大きくなるとそれはさらに明らかです。

a_yamada
質問者

お礼

意味があるかないかはわかりませんがσ’ならば数字の意味がわかるのですが?

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.3

標準偏差の求め方はご質問に書かれているとおりですが、それが何を意味するかがわからないわけですよね。それをこれから説明します。 平均値は判りますね。それは測定したデータの中心値ということでよく使われ、データは平均値の両側にばらついて存在することになります。そこでそのデータがどのくらいばらついているかを知りたくなることがあります。そのばらつきの程度をこの標準偏差が示しているのです。この値が大きいとデータは平均値からばらついた状態で存在しており、小さいとデータは平均値の周りに密集して存在しているいということを示すのです。ではどのくらいなのかというと、標準偏差のプラスマイナス3倍の間にほぼ100%のデータが入ることが保証されているのです。これでデータのばらつきが掴めることになりますね。

a_yamada
質問者

お礼

回答ありがとうございます。 やはりσと実データ関係のイメージが掴めません。

  • trytobe
  • ベストアンサー率36% (3457/9591)
回答No.2

なぜ、後者だと「標準偏差の値の意味が理解できる」のか、というご自身の理論がわからないと、 ご自身が「統計の数学的理論のどこに疑問を抱いているのか」がわからないので、答えようがありません。 なぜなら、ご自身の定義のほうが、統計学としてより便利で有用な系が構築できるのだ、という主張であれば、その検討価値がありますが、そこまでの深い理由ではないのであれば、統計学の入門書を最初から読んで、標準偏差を活用した検定のところまで読んだ上で、冒頭の定義であるメリットがご理解できるかと思うためです。

a_yamada
質問者

お礼

かいとうありがとうございます。 やはりσと実データの関係がイメージできません

noname#209945
noname#209945
回答No.1

いづれにしても数は変化しません。 相加平均も相乗平均も理解しているなら単に順番が違うだけです。

a_yamada
質問者

お礼

回答ありがとうございます。やはり数値としてのσは理解できません。 (分散までは数字としての理解はしているつもりですが)

関連するQ&A