- 締切済み
標準偏差の計算方法
最大値と最小値だけが分かっている状態で標準偏差って計算できるでしょうか? たとえば最大値が130で最小値が90と想定したとき、平均は(130+90)/2=110と想定計算できますが、標準偏差はどう計算すればよいでしょうか? 教えてください。
- みんなの回答 (10)
- 専門家の回答
みんなの回答
無理。
確認しておきたいことがあります。 例えば 80, 90, 100, 110, 120 というデータだったとき、最大値は120、最小値は80、標準偏差は √[{(80-100)^2 + (90-100)^2 + (100-100)^2 + (110-100)^2 + (120-100)^2} /5] = 10√2 となりますが、最大値と最小値から10√2を推定したいということですか? それとも私が回答したように母標準偏差の推定をしたいということですか? 前者であれば、皆さんが既に指摘されているように無理なことです。 ANo.6お礼 > 最大値130で最小値90の間で正規分布しており、平均値は真ん中の110と考える。標準偏差は、最大値と平均値の差の1シグマ分の約32%で計算してみる。 32%の根拠がわかりません。
- alice_44
- ベストアンサー率44% (2109/4759)
A No.7 は、「←A No.2 補足」だった。 アンカーミス、他意はない。
- alice_44
- ベストアンサー率44% (2109/4759)
←A No.1 補足 ばかいっちゃなんね。 データが全部で2個なら、計算できる。 そうでなければ計算できない…て言いおろ? 回答をねじ曲げて意味を変えないように。 数学以前に、人間として要反省。
お礼
たしかにおっしゃる通りですね。 反省します。。
ANo.4の訂正 > 母平均は最大値と最小値の平均で、母標準偏差は上述の式でd2=0.5907を用いて計算しました。 正しくは > 母平均は最大値と最小値の平均で、母標準偏差は上述の式で1/d2=0.5907を用いて推定しました。 です。 ANo.4の補足 > このd2はどうやって計算するのでしょうか? > 申し訳ないです。資料見てもわかりませんでした。。 サンプルサイズが2の場合は http://okwave.jp/qa/q4803054.html をご覧ください。
お礼
回答ありがとうございます。 難しくてすぐには理解できそうにないですが色々な計算方法があることを知れて良かったです。 しつこくて申し訳ございませんが、データが正規分布しているという条件を付けて、以下のように考えてはダメでしょうか? 最大値130で最小値90の間で正規分布しており、平均値は真ん中の110と考える。標準偏差は、最大値と平均値の差の1シグマ分の約32%で計算してみる。 この場合は、(130-110)*0.32=6.4が標準偏差と想定する。
- sanori
- ベストアンサー率48% (5664/11798)
No.3の回答者です。 >>>データの分布が均等であるとか何か別の条件があれば計算できますかね? >>>それでもやはり強引すぎますかね? んー、均等だったら正規分布ではないですね。 別の条件を付け加えるのであれば、No.4様がすでに示されたとおり、(詳しくは知りませんが)N(測定数もしくはサンプル数)の情報を加えるのが一つ。 あと、ものすごくNが多くない場合では、最大・最小に加えて2番目に大きい値と2番目に小さい値がわかっても推定できそうな気がします。 具体的にどうやるかわかりませんが、Nが大きくなるほど1番目と2番目の差が小さくなろうとするはずですから意味のある情報になると思います。
母集団が正規分布に従うと仮定できるなら、最大値と最小値から母標準偏差を推定することはできます。 まずは、日本工業標準調査会のサイトからシューハート管理図(Z9021)を検索してください。 この規格の表2のd2を使った (最大値-最小値)/d2 が母標準偏差の推定値となります。 例として、標準正規分布からサンプルサイズ3の標本を得て、母平均と母標準偏差を推定するということを1000回繰り返し、結果を散布図にプロットしてみました。 母平均は最大値と最小値の平均で、母標準偏差は上述の式でd2=0.5907を用いて計算しました。 1000回の結果の平均は、母平均の推定値の方が-0.0006876163、母標準偏差の推定値の方が1.002291と良い値なのですが、個々の値はかなり散らばっているように見えます。 しかし、これはサンプルサイズが3と小さいので仕方がありません。
お礼
回答ありがとうございます。 色々あるものですね。 このd2はどうやって計算するのでしょうか? 申し訳ないです。資料見てもわかりませんでした。。
- sanori
- ベストアンサー率48% (5664/11798)
こんにちは。 >>>平均は(130+90)/2=110と想定計算できますが、 まあ、110がもっとも確からしいといえば確からしいです。 >>>>標準偏差はどう計算すればよいでしょうか? できません。 これは少しだけ考えてみるとわかるのですが、計測回数あるいは試行回数を増やすたびに、最大値はより大きくなろうとし、最小値はより小さくなろうとします。 ダーツがへたくそな人が矢を投げるとき、投げる回数が多いほど、その回数の中で最も外れたところは、より真ん中から遠くなります。つまり、「外れ距離の新記録」が更新されていきます。 このことだけからも、最大値と最小値から標準偏差を推定しようとする考えは正しくないことがわかります。
お礼
回答ありがとうございます。 そうですね。 強引すぎですね。 データの分布が均等であるとか何か別の条件があれば計算できますかね? それでもやはり強引すぎますかね?
- alice_44
- ベストアンサー率44% (2109/4759)
いくつかあるデータの中から最大値と最小値だけが判っているのなら、 平均を求めることもできません。 例えば、データが 3 個数で、最大値が 130、最小値が 90 であれば、 平均は 110 とは限らないし、 あと一つのデータが判らないと、平均は求められません。 データが全部で 2 個しかないということなら、 普通に、分散 ={ (130-平均)2乗 + (90-平均)2乗 }/2 = 400 から、 標準偏差 = √分散 = 20 と計算すればよいです。
お礼
回答ありがとうございます。 平均も強引に出しているので、たしかにデータは2個としてこの計算でも概算値は出ますね。
- k_kota
- ベストアンサー率19% (434/2186)
最小値と最大値だけでは標準偏差は出ません。 標準偏差の取る範囲は絞れますけど意味はありません。 計算方法から明らかだと思いますけど。 ちなみに平均値の推定方法もそれでは間違いです、推定としては雑過ぎです。
お礼
回答ありがとうございます。 たしかに雑過ぎですね。 もし、この最小値と最大値の間で均等に分布している条件がつけられれば、どうでしょうか?
お礼
回答ありがとうございます。 質問の仕方がへたくそですいません。 皆様の回答で無理ということは十分にわかりました。 ありがとうございます。 32%の根拠は、1シグマが68.26%の区間ですので、使えないかと考えただけです。 最大値と最小値は平均から3シグマほどの数値となり、その数値の間で正規分布していると仮定した場合にこの計算で標準偏差を推定できるのではないかと考えました。 質問の前提が変わったりして混乱させましてすいませんでした。