• 締切済み

3σについて

3σとは何でしょうか? σというのは標準偏差(ばらつきを評価するもの?)ですよね。 また、実験値(数値列)があるとします。1.05±0.4%(正規化分散というらしい、この範囲に正解値が分布しているという事例があるので、実験値を評価したい)というのは、3σの範囲を表示すれば、3.15±1.2%となり、±3.15%、つまり、1.03と0.97を正解値に掛けることになるのでしょうか?それはなぜでしょうか?イマイチ理屈が分かりません。 またここで、1.2とは何でしょうか? 2σや6σもあるが、3σを使う理由は何か?何を意味するのか? 3σの範囲に入らなければ、ばらつきがある?駄目なのでしょうか? 言い訳ではないのですが、確率を習ってなく、自分で調べているのですがよく分かりません。 この汚い文章を見て、私が何をしたいか予想がつく方は、どうかお助けください。

みんなの回答

回答No.12

質問者さんの状況はこの様なものでしょうか? ・過去にも測定例のある測定を行った ・過去の測定で σ はわかっている(ようだ) ・今回の測定結果を過去の測定結果の σ から「測定の」妥当性を知りたい それに対する疑問は次のことでしょうか。 1)3σをかければいいのか?どうして?(3σの使い方って?どうやって評価すべき?) 2)3σを使う理由は?意味は? 3)3σの中に(今回の測定データが)はいらなければ、ばらつきが大きいということ? 違っているようでしたら補足をお願いします。 以下、上記を前提に回答いたします。 1)1.05±0.4% と書かれていますが、統計的なデータを表す場合は 平均±ばらつき範囲(3σとか) で表す場合が多いです。 この表記に従えば 平均=1.05、偏差(σ)=0.4% となります(0.4%は3σとかかもしれませんが、ここではσとします)。 そうすると 3σ=1.2% になります。 つまり同一条件にて測定を行えば(分布の両側で判定の場合)約99.5%範囲内に結果が現れます。 ざっくり言って今回の測定データ数が10個程度であるならば範囲外のデータが1個あると今回の測定は疑わしい(測定ミスや元々測定再現性が低いなど)かもしれません。 一方、偏差(σ)=1.05±0.4% という表記の場合も(見たことはありませんが)ありえるかも知れません。 (例えば、個体ばらつきと製品ばらつきを別々に記載したいときとか、測定の度ばらつきが異なる測定とか) その場合は(多分正確ではないですが) 3.15±1.2%→±4.35% を使ってもよいかもしれません。 2)については他の方が示されている通りだと思います。 数学的にはあまり意味はなく、直感的な「ほとんど」を表す適当なところ、みたいな感じでしょうか。 工業系では最近6σで工程能力等を評価する向きもあるようです。 3)については大きく外れている、山が明らかに2つ以上あるなどの場合は別のばらつき要因がある可能性があります。 ですが、測定対象によってはある程度許容される場合もあるかと思います。 判断がつかない場合は、データ数を増やしてみるのもいいのではないでしょうか。 その場合はできれば今回の測定データと一緒にしないほうがよいと思います(単一の測定以外のばらつきを含むので)。

参考URL:
http://yoshio.sccs.chukyo-u.ac.jp/courses/applied-statistics/contents/bunpu-hyouhon-heikin.html
回答No.11

誤解を生んでいるようなので補足します。 >3σや5σは、ばらつきの幅です。数字が大きいほうが幅が有るということです。 ↑これはその通りです。 >製品の精度を上げるのは、同じ分布であれば、その幅を狭い範囲で使うことになります。5σにするということは、ばらつきのひどいものまで採用するということです。だから逆に(選別などして)2σまでの採用にすることになります。この場合、歩留まりが悪くなります。 ●これは、σをどう使うかの話ですね。  私は、自分の経験のマスプロダクションの話をしてしましたが、  通常の工業製品は、全品測定して選別などして生産できません。  したがって、抜き取ったサンプルから平均値と標準偏差を出して、  たとえば寸法で言えば最悪寸法がいくつになるかを推測するわけです。  その最悪の寸法でも機能上、問題がないかどうかで製品化してよいかを  判断します。(標準偏差も不偏分散から計算する方が正しい)  その最悪寸法を類推するときに、3σを使った方が甘く  6σを使った方が厳しいという訳です。  より厳密な数学的な手法や開発段階ならば実験計画法などいろいろ方法があるのですが、  日本の工場レベルでは、この程度の手法でよい製品を永らく作ってきました。  3σなどという数学的な意味が薄い単語が出てきたので、製造業にたずさわって  とまどっている方と思って回答しましたが、内容次第では誤解を生みそうですので、  もし疑問があれば補足でお知らせ下さい。

  • fool_ish
  • ベストアンサー率16% (2/12)
回答No.10

おそらく,#4さんは,#3さんの書き込み > 「この飛行機は大丈夫です。99.7%は墜落しません。」と言われたら、あなたは乗りますか? を見て,「飛行機が落ちるか落ちないかの2値データに対して適用するものではない」と言ったのでしょう.この指摘はもっともだと思います. 上の表現を見て,#8で仰っているような「飛行機の部品の寸法」の話であるとは,まず思えません.後出しと感じました.

回答No.9

もう最後にしますが、滅茶苦茶な回答がされているので、補足しておきます。 3σや5σは、ばらつきの幅です。数字が大きいほうが幅が有るということです。 製品の精度を上げるのは、同じ分布であれば、その幅を狭い範囲で使うことになります。5σにするということは、ばらつきのひどいものまで採用するということです。だから逆に(選別などして)2σまでの採用にすることになります。この場合、歩留まりが悪くなります。 また、その3σなりの幅の絶対値を狭くする(ばらつきを少なくする)という改善を図ります。 もう一つは、規格上**以下というようなばあいは、センター値を規格に対してさらに余裕があるように改善します。

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.8

#5です。 私の口下手の分を#7さんが正確に言ってくださいました。ありがとうございました。 #4,6さん Wrote: > データ数が少ない時はポアソン分布になり、充分多くなれば正規分布になります。 分布のタイプは母集団の性質であり、データ数の問題ではありません。正規分布から少数の標本をとることは、日常いくらでもあることです。また、自由度の非常に小さいポアソン分布から、どんなにたくさんのデータを取っても、左右非対称な山になって、決して正規分布には近づかず、±3σというような検討には適しません。 > 飛行機の事故の例‥‥3σなんか使うわけないじゃないですか。5σだの6σだのに何の意味があるのでしょうか、 飛行機のある部品の寸法が、ある許容範囲から出ると危険だということが分かっているとします。しかし、工場で実際に作られているその部品が、分布の中心は安定しているとしても、標準偏差が上記の許容範囲の1/6程度だったら、私は乗らない、と言っているのです。1/12 程度だったら安心して乗りましょう、ということです。これが「何でも±3σじゃない」の意味です。統計的品質管理の概念や手法から外れた話じゃないと思います。

回答No.7

複数の会社の製品開発をしております。 自分の私見ですが、 ●個人的には、3σ の 3 には(学術的な)意味はないと思います。 ●日本の工業会では、通常の工業製品では3σを使うことが多く、  命にかかわるもの (医療機器や、自動車の安全装置(エアバック)など)  では、6σなどを使っている企業もありました。  (あるいは、3σとした上で安全率を2倍にしたり・・・ こうなると   もう数学的には全く意味を成しません) ●結局、製品開発時や量産時に、故障もそこそこ少なく経済性もいい  バランスで 3σ が選ばれて、工業界では半ば標準化している  とう風に理解しています。

回答No.6

#4です。 #5さんと議論するつもりはありませんが、 #5さんは、多分わかっているのに、質問にたいする私の回答にたいして、混乱させているので、補足しておきます。 正確な学問上は、ポアソン分布ではなく正規分布といえばよかったのでしょうが、分散に対してデータ数が少ない時はポアソン分布になり、充分多くなれば正規分布になります。実際の世界ではデータ数が十分に多くない場合が多いのでポアソン分布を引用しただけです。また、ポアソン分布であっても正規分布に近似出来ます。  飛行機の事故の例は、そんなのにつかわないと言っているだけです。  3σなんか使うわけないじゃないですか。  5σだの6σだのに何の意味があるのでしょうか、だいたいどのようなデータの集団を想定して言われているのでしょうか。

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.5

#3です。 #4の方は、ポアソン分布を例に挙げられましたが、この分布は非対称であって、±3σは意味をなしません。自由度が非常に大きければ意味があるといえますが、その場合は、近似正規分布として扱われるからです。ポアソン分布本来の性質の中には、±3σ←→99.7%というものはありません。 飛行機の例はふさわしくない、と言われますが、正規分布で判定を行う場合、もし人命に関わるようなことであれば、3σにこだわるべきでなく、5σとか6σという基準もありうる、という意味で申し上げたものであって、大いに関係があります。3は、常識の数であって、学問的に導かれた数ではない、ということを強調しておきます。

回答No.4

3σには意味があります。 ばらつきがあるデータをたくさん集計するとポアソン分布をなします。 この分布は、中心値に近いところはデータがたくさんあり、離れていくと急激に下がりそしてまただんだん緩やかにデータ数が減少していきます。 3σというのは、±3σの中におさまるデータが全体の97.7%であるということで、ばらつきのほとんどのデータが治まると共に、そのあたりのばらつき以降は発生確率が非常に低い範囲となります。(ここが重要)  品質管理などばらつきを管理する時、あるデータが発生した時にそのデータが正常なばらつきで発生したものか異常な状態で発生したかの判定が必要になります。その目安として、±3σを超えたデータは正常なばらつきではなく異常なデータとして判定できるだろうという値になります。 #3の方が言われているような、飛行機が落ちる確立などに使う値ではありません。  

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

私は、3σの"3"には、学問的な意味はまったくないと思っています。 ごくごく平凡な常識として、99.7%なら、ほぼ全部と考えていいんじゃない?といった程度のものです。もちろん、検討の対象となる問題によります。 「この飛行機は大丈夫です。99.7%は墜落しません。」と言われたら、あなたは乗りますか?

関連するQ&A