- 締切済み
平均値±3σについて
データが正規分布に従うとき、平均値±3σの範囲内に99.7%のデータが入るというところまでは理解できています。ここで、正規分布を適用するためには、母分散が既知の場合という条件が付きますが、実際問題として母分散が未知の場合がほとんどなので、正規分布ではなくt分布を使わなければならない気がします。そうなると、信頼区間は平均値±定数×標準偏差S×√nとなりますので、例えば工程管理等で平均値±3σを利用する意味がイマイチ理解できません。3σのσも、実測値から計算したものならSと表記すべきな気もします。 的外れな質問かもしれませんが、詳しい方がおられましたら、ご教示のほどよろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- Ishiwara
- ベストアンサー率24% (462/1914)
現実問題として「データの分散」と「母分散の不偏推定値」と「母分散そのもの」は、表記上かなり混用されています。これらは「s」「σの^付き」「σ」と書き分けるべきですが、実務上混乱がなければ、混用も許される場合があります。しかし「s」と「σの^付き」は、もともと大きさが違うことにもご注意ください。 なお、A2の話は、範囲(データの最大値と最小値の差)を統計量とするものですから、σとはやや縁が薄くなると思います。
- km1939
- ベストアンサー率33% (59/176)
母標準偏差(σ)未知の場合の平均値の信頼区間の推定に関する質問だと 思います。 信頼区間は質問者さんの平均値±定数(t(φ、α))×標準偏差σ×√n です。ここで平均値±3σを利用する意味がわからないと言う質問だと 思います。 ±3σ(99.7%)か±2σ(95%)のどちらかで管理するかは その工場の方針で決まることで、2σと3σでは信頼区間つまり 平均値の管理幅が違います。
- rabbit_cat
- ベストアンサー率40% (829/2062)
n→∞で、t分布は正規分布に一致します。実際問題、n=無限大でなくても、n=100になれば正規分布との誤差は1%程度です。 ここで、誤差1%といってるのは、正規分布で「平均値±3σの範囲に99.7%」に対して、n=100にt分布では、「平均値±2.97Sの範囲に99.7%」てことです。 普通、サンプリング調査では100個ぐらいは取るでしょうから、実用的には、正規分布として扱ってもほとんど問題ないのでは。
補足
質問の仕方がまずかったです。すいません。 正規分布かt分布かというよりは、標本平均から、「平均値±定数×標準偏差÷√n」により、母平均の区間推定をするはずなのに、「平均値±3σ」から母集団が推定できるとすると、これは母集団の分布そのものなり、標本平均から母集団のデータの区間推定をできるのか?と疑問に思い質問しました。 統計学の書籍で確認したところ、3シグマは、管理図で用いられている考え方で、上の式の定数=3とし、式を変形していくと、管理限界線が平均値±A2Rバーとなりるそうです。(ここで、A2は、n数によって異なった値をとる定数。) 母集団からn個のサンプルをとって、標本の平均、分散から母平均を予想する式は、あくまで「平均値±定数×標準偏差÷√n」であり、「平均値±3σ」は、母平均を求める計算式ではなく、母集団が99.7%入るときの定数が3であること、標本平均から母分散を推定するときの定数にすぎないことがわかりました。
お礼
ご返信ありがとうございます。 ±3σに設定しているのは、管理幅を広く取って、第一種の過誤が小さくなる様にし、管理幅から外れたら、明らかに異常であると言えるようにするためですね。