• ベストアンサー

標準偏差に「通常の範囲」はありますか?(初心者の質問です)

現在、仕事で必要のため大変困っています。 大量のデータ(物件の見積金額)のばらつきを出すために「STDEVP」関数を用いて「標準偏差」を出しました。 この標準偏差というのは、よくある「山のようなグラフ」(すみません、名前がわかりません)の平均からどれだけ離れているか・・・ということをみるものでよかったでしょうか? また、この標準偏差に「通常の範囲」というのはありますか?たとえば「マイナス」にはならないとか100以上の数値はない・・・など そしてこのデータを「山のようなグラフ」にして見た目にすぐにわかるようにしたいのですが、どのようにしたら良いですか? くだらないご質問だとはお思いでしょうが、なんとかお力を貸してください。

質問者が選んだベストアンサー

  • ベストアンサー
  • imogasi
  • ベストアンサー率27% (4737/17069)
回答No.6

>よくある「山のようなグラフ」 ●正規分布グラフのことでしょう。 ●標準偏差は、1峰の山型分布に限らず、平均を出せるデータがあれば(また平均はどんな場合でも出せますから) (データ-平均)の2乗を全てのデータに亘って加えた (Σ)もの(分散)から計算するからです。その平方根(+の方を採る約束)です。(不偏分散に付いては略) ●正規分布かそれに近い分布でないと、「もの」(推論)が言えないだけです。(例えば「平均値 ± 1 標準偏差の範囲内には全データの 68.27% が含まれる」など) 誤差に関係するようなものは使えます。正規分布以外の分布は沢山あります。むしろ正規分布が特殊でしょう。 >この標準偏差に「通常の範囲」というのはありますか プラス値であることだけです。値について、1より小とかの原理的範囲はありません。公式から判ります。データが2個しかないと仮定して、仮定で平均を決め、平均+α、平均-αのαの値を大きくすればいくらでも「分散」値は大きくなることで判ります。 >そしてこのデータを「山のようなグラフ」にして 現実データの現実分布の形によるのです。無理に山のような形に出来るものでもなく、して良いものでもありません。 現実の分布の形が「まずありき」であって、現実をモデル 分布に強引に当てはめては、本末顛倒です。 経験的に理論的に正規分布をするはずのものが、そうなっていない時には、QC活動でおなじみの、何か外因的作用(機械の故障)や何かの要因が加わっていると、疑うわけです。試験成績であれば、あるクラスではその出題関連単元を教え、他のクラスでは教えなかったとか、カンニングが行われたのではないか、問題があまりにも易しすぎたのではないかなど。 パチンコの例の解説がありました。 http://www.yi-web.com/~ps/java/kakuritu_syoho11.htm http://www.yi-web.com/~ps/ 小生はダメですが、この方面に興味があれば理解のキッカケが掴めるかも。

kunikunichan
質問者

お礼

ありがとうございます。 標準偏差の値というものの「算出方法」が参考になりました。

その他の回答 (5)

  • tnt
  • ベストアンサー率40% (1358/3355)
回答No.5

補足拝見しました 標準偏差は、ある特定の数値の集合に対して そのばらつき具合を与えるものです。 ですから、平均値が同じ物同士なら比較する事が できます。 でも、 たとえば、ある地域の平均価格が100円、 別の地域だと50円というときに、 それぞれの地域毎にばらつき具合を 調べる時にはそのままでは使えません。 一方、偏差値は、この標準偏差と平均を利用して 平均的なもの=50 に固定することで 平均値が違う物同士でも平均値からのばらつきを 比較できるようにするものです。 どちらが良いかは一長一短ありますが、 ご質問の例では、これらにとらわれずに 積み上げ折れ線グラフで良いのでは?と思います。 具体的には、 縦軸は%で、最大は100%、 販売してくれる会社の割合となります。 横軸は価格です。 こうすると、安いところは左に、高い所は右に出ます。 で、一番高い価格を提示すればどの会社からも 買えますから、そこが100%です。 つまり、グラフの傾き=散らばり具合     グラフの位置=全体的な価格の高低 という形になります。 これを標準偏差を用いて表す場合は、 単純に数値にして 平均=価格の高低 標準偏差=価格の散らばり具合 ということになりますが、 散らばり具合だけだと、 最低価格(これは誰でも興味あるでしょう)が 見えて来ないという欠点があります。

kunikunichan
質問者

補足

何度もありがとうございます。 アドバイスにありましたような「積み上げ折れ線グラフ」というのを試してみようと思ったのですが、 >具体的には、 >縦軸は%で、最大は100%、 >販売してくれる会社の割合となります。 >横軸は価格です。 この縦軸の「%」というのは「会社の割合」とありますがどのように算出されるものでしょうか? また、今回は最低価格というのを見るわけではなく 平均からどれだけ離れているか・・・というのが 見たいのだそうです。 よろしくお願いします。

  • tnt
  • ベストアンサー率40% (1358/3355)
回答No.4

標準偏差は統計的には優れたものですが、 普通の範囲を比較する時には ちょっと直感的では無いようで、 こういう場合は受験で有名な 偏差値の方がわかりやすいです。 偏差値=(X-平均値)/標準偏差*10+50 という式になります NO.3の方の標準偏差の上下3倍というのは、 偏差値では80~20に相当します。 偏差値で80以上、または20以下というのは 普通ありえませんね。 受験で言えば、偏差値70以上、30以下 つまり標準偏差の2倍を超えた数値は もう、母集団の形で数値が変ってしまうので 事実上つかえません。 ここらへんは何の「通常の範囲」なのかで 変ると思います。  

kunikunichan
質問者

補足

ご回答ありがとうございます。 具体的に「標準偏差」と「偏差値」の違いというのはあるのでしょうか? 今回出したいのは、 たとえば 愛知県にある5社の会社がA商品について見積金額を出しました。 その見積金額というのは、5社の平均と比べてみてどれだけばらけているものなのか・・・ということを出したいのです。 そしてそれを視覚的に訴えるために、「ヒストグラム」のようなグラフにできないか・・・ A商品は愛知県だけでなく岐阜県でも三重県でも見積をとるので各県での違いというのもみてみたい。 ご回答いただいてずうずうしいとは思いましたが、もし何かアドバイスがありましたらお願いいたします。

  • ice_rif
  • ベストアンサー率20% (68/325)
回答No.3

平均値+/-3σなら通常の範囲と言えると 思います。例えば、赤ちゃんの体重が小さ い場合も平均値より3σ以内であればあまり 心配する必要がありません。3σをはずれる 値とは、小学校の一学年に一人もいないよう な値と思ってください。 グラフは平均値をゼロとして、横軸の目盛り をσにすれば良いと思います。これ以上は、 統計学の本を読んでください。

kunikunichan
質問者

お礼

アドバイスありがとうございます。 「統計学」は難しいですね。。。 なんとかがんばってみます。

noname#4692
noname#4692
回答No.2

#1です。何度もすみません。下記回答に誤りがありました。平均±標準偏差の範囲に含まれるのは68.26%だそうです。(参考URL) ちなみに標準偏差についての考え方ですが、参考URLに正規分布表が載っています。標準偏差(σ:シグマ)とは、平均から正規分布表の変曲点までの距離を示しています。ですから、完成した度数分布表がきれいな正規分布を示していたら、そのグラフの変曲点が標準偏差であると視覚的にとらえることが可能です。(もちろんSTDEVで計算された標準偏差が正確な値です。)

参考URL:
http://procgtw.mach.bio.mie-u.ac.jp/Seminar/Seminar2001/NormalDistribution/NormalDistribution.htm
noname#4692
noname#4692
回答No.1

専門家でも何でもないのですが、お困りのご様子なので来てしまいました。間違っている情報もあるかも知れませんので、必ず他の方の回答も参考にしていただければ幸いです。 標準偏差は、集団のデータのばらつきを示す数値です。 たとえば、2つのグループA・Bに、0から100までのデータがそれぞれ150個・200個あったとして、両グループとも平均値が50だったとします。 Aグループの平均±標準偏差が50±10 Bグループの平均±標準偏差が50±20 である場合、Bグループの方がばらつきが大きいと評価されます。ということで、プラスとマイナスの両方のデータがありますし、平均値の大きさによって100とか1000とか小数点の数値ももちろんありえます。 グループのデータの分布が正規分布を取る場合、平均±標準偏差の範囲に、全体の個数のうち66%のデータが入ると考えられます。つまり、Bグループは50±20ですから、30から70というデータ範囲内に132件のデータが分布しているといえます。 さて、山のようなグラフは「度数分布表(ヒストグラム)」といいます。これは標準偏差の算出とは無関係です。エクセルをお持ちでかつアドインがインストールされていれば、ツール→分析ツール→ヒストグラムで書くことが出来ますが、アドインを使用しなくても、frequency関数を使うことで度数分布表をグラフで書くことが出来ます。詳細は参考URLをご覧下さい。 ただし、きれいな山形にするには階級値の設定が重要で、たとえば上記のデータの場合、階級値を5にするか、10にするかでできあがるグラフの形が全く異なります。この点はある程度の経験が必要になるそうですので、山形にならない場合は何度か階級値幅を適当に変えて試してみてください。

参考URL:
http://www.tokuyama.ac.jp/home/~n-harada/statistics/enshu/enshu1.html
kunikunichan
質問者

お礼

まだしっかり内容は把握しておりませんが、とりあえずお礼をさせていただきます。 グラフは「ヒストグラム」ですね。アドインで分析ツールはありますのでとりあえずやってみます。 ありがとうございました。

関連するQ&A