- ベストアンサー
(仮の?)標準偏差の計算方法について
あるデータで、 上限・下限の範囲のみわかっているータがあります。(n数は不明) 例 下限データ 2.4 上限データ 4.4 この時、平均は(上限+下限)/2 標準偏差(上限ー下限)/4 で良いのでしょうか?(平均はわかるのですが、標準偏差が・・・) 理由もわからず、このように言われたのですが・・・ 説明もわかりずらいと思いますが、補足説明もしますので よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
標準偏差は、下限~上限の間のデータがどのような分布になっているかで変わります。 もし、下限~上限の間のデータが一様に分布しているとすれば、 標準偏差=(上限ー下限)/(2√3) となります。 平均値に近いデータの割合が多くなればなるほど上記の割る数(2√3)が大きくなって行きます。(標準偏差は小さくなります) 標準偏差=(上限ー下限)/4 となるのは、おおよそですが、上限と下限の間を5等分し、その間にあるデータ数が、1:4:6:4:1 の分布になっている場合です。 どのようなデータかは分かりませんが、標準偏差をこの式でいいと言った人は、経験上、データの分布が上記のような割合になっていることを知っているのでしょう。
その他の回答 (2)
- ur2c
- ベストアンサー率63% (264/416)
関連質問が http://aoki2.si.gunma-u.ac.jp/taygeta/statistics.cgi の「Xbar-R管理図について」とか http://elsmar.com/Forums/archive/index.php/t-2021.html にあります。 品質管理は現場で使うので、1950 - 1970 年代には簡便法が発達していました。今はパソコンや関数電卓があるから、昔ほど使われなくなりました。 その簡便法の 1 つに、データが正規分布にしたがうことを仮定して、標準偏差を「データ範囲 / d_2」で見積もる、というのがあります。d_2 は測定値の数 n の関数で、 http://www.qualityadvisor.com/library/capability_4.2.php にあるような値です。その計算法は http://www.caspur.it/risorse/softappl/doc/sas_docs/qc/chapc/sect9.htm にあります。 「範囲を 4 で割る」というのはこの簡便法によっていると想像します。とは言え、d_2 が 4 に近くなるのは n がよほど大きなときでしょう。たとえば n が 10 とかだったら使いたくない値だ、と私は思います。 それから、簡便法はデータが持っている情報を全ては使っていないのですから、それだけ効率が落ちます。 d_2 を使った推定の効率がどれくらいだったか忘れましたけど、かなり悪かったという印象です。効率は http://openlibrary.org/b/OL18423871M/Rapid_statistical_calculations に載っていた記憶があります。ついでに言うと、著者の Quenouille はジャックナイフ法の発明者です。
お礼
ありがとうございます。 説明不足な質問でも回答していただいてよかったです。
- hitokotonusi
- ベストアンサー率52% (571/1086)
おそらく経験に基づくノウハウがあるのだと思いますが、 推測でものを言うと・・・・ 標準偏差をσとすると、正規分布を仮定すると平均±2σの範囲におよそ95%のデータが入ります。なので、測定値がこの範囲におおよそ収まるとすると上限-下限はおよそ4σとなるので、上限-下限の1/4を標準偏差として仮の見積もりをすると、そう外れてはいないような気がします。 (上限+下限)/2で平均値を概算するのと同程度にはということですが。 概算としては割りと使えるかもしれませんね。どうだろう・・・・
お礼
ありがとうございます。 説明不足な質問でも回答していただいてよかったです。
お礼
ありがとうございます。 説明不足な質問でも回答していただいてよかったです。