• 締切済み

3σと最大値,最小値

今ある計測データのまとめを行っています。 その計測データに対して、要求元からこのような要求がありました。 ・計測データの3σはxxx以下でかつ計測データ内における最大値と最小値の差は  yyy以下であることが望ましい。 いまxxxの条件は満たすことができているのですが、yyyの条件を満たすことができていません。 そこでこの要求に対して質問があります。 (1)3σと最大値と最小値の差との間には数学的に関連があると言えるのでしょうか? (2)関連があると言えるのであれば、数学的にそれを理解できるよう教えていただけないでしょうか? 統計学はシロウトです。 よろしくお願いします。

みんなの回答

  • info22
  • ベストアンサー率55% (2225/4034)
回答No.6

#3~#5です。 A#5の補足質問の回答です。 >3σというのは、平均からのばらつきという意味で相対的な値ですが MAX-MINという値は、そういった相対的な値ではないと思うのですがいかがでしょうか? 分布が正規分布で近似でき、かつσが相対的であるがゆえに、σで統計的性質が統一的に扱え、絶対的なMAX-MINの値が何σにあたるかで、yyyの影響が直ちにわかるのです。 そうすれば、以下の疑問もはれると思います。 >確かに3σもMAX-MINも単位は同じですが >今回の場合、数値としてMAX-MINが6σと等しいだけであって >その値を平均からのばらつきと同じ尺度で考えるとおかしくありませんか? >つまりMAX-MINはあくまでもyyyであり、6σや9σではない。ということ >になりませんか? MAX-MINを決めるのは、測定データと独立に決められるものではないですね。 意味の無い(効力のない)MAX-MINを統計データと無関係に決めても何の意味もありません。MAX-MINの設定は、どれだけの規格外のデータが出るかを把握した上で許容される規格外データが何σならOKということで、MAX-MINの設定の設定を、実用的な値に決める必要があるということです。 逆の考え方をするなら、先にMAX-MINを決めるなら、測定データの母集団の平均値と何σにするための母集団のデータの製造法を改善する(許容σの範囲でコストを低減または追加する)ことが判断できます。 こういった意味でσとMAX-MINが結びついているわけで、それをどう決めるか、決めた結果どう状態が起こり、どういう措置をしないといけないかががわかります。それを関係付けるのは、現場の製造責任者であったり、発注主であることになります。製造コストと規格外品の発生割合を元に決めることになりますね。

  • info22
  • ベストアンサー率55% (2225/4034)
回答No.5

>・xxxとyyyには数学的な関連性はない。ただしyyyがxxxを超える確立は非常に高い。 正規分布ということで関連性が無いとはいえませんが、 yyyがxxxの3倍の±9σに設定しても、そこから外れるのは 下記の考察から実用上ありえません。したがってyyyの規制は 無いのと同じです。 正規分布と見なせば ±3σの外の測定データが0.27%=27/10000 になります。 このとき最大最小を±6σに設定すれば その外に飛び出すデータが 1.97/1000000000=1.97×10^-9 つまり 10億個あたり約2個のデータが外に飛び出すということになりますね。 つまり、±3σのxxxがクリアできていれば、 2倍の±6σのyyyの最大・最小の規制は殆ど満たされているということかと思います。 現状の3倍の±9σにyyyを設定した場合の最大・最小の規制から外れるのは 2.26×10^-19 で一垓個(垓(ガイ)は京(ケイ)の1万倍の桁の単位)に約23個が外れるということで現状のyyyを外れるデータは全く無いに等しいということでしょうね(最大最小規制は無いと同じ)。 >・今回の場合、測定データに出現回数は少ないものの(0.27%の範囲)  山の中心から大きく外れた測定値がある。 ±3σから飛び出すデータは少ないものの、0.27%は無視できないデータの出現数である。 といえます。 >yyyがxxxの2倍というのは、厳しいものなのでしょうか? 厳しくないと思います。 10億個あたり約2個のデータ位しか外に飛び出さないという程度ですから。

breset
質問者

補足

早速のレスポンスありがとうございます。 ご回答に対する質問で恐縮ですが(Info22さんのこの回答を見て以下のように考えました。 初めからこう考えていたわけではありません。ご了承ください。) 3σというのは、平均からのばらつきという意味で相対的な値ですが MAX-MINという値は、そういった相対的な値ではないと思うのですがいかがでしょうか? 確かに3σもMAX-MINも単位は同じですが 今回の場合、数値としてMAX-MINが6σと等しいだけであって その値を平均からのばらつきと同じ尺度で考えるとおかしくありませんか? つまりMAX-MINはあくまでもyyyであり、6σや9σではない。ということになりませんか? 変な表現かも知れませんが、ご確認ください。

  • info22
  • ベストアンサー率55% (2225/4034)
回答No.4

#1です。 最大と最小の差がσの何倍位か、または最大と最小は何σの所にして見えますか、補足していただいていないので、 ±3σよりかなり外になる大きさなのか、あるいは、最大値が3σより大きいのか、最小値が-3σより小さいのか、分からないのでA#1の回答は、両方の可能性に対して、回答しておきました。 また、回答は正規分布を想定して書いてあります。 正規分布と見なしていいのでしょうか? yyyの条件をσ(標準偏差)の何倍位か、またほぼ正規分布と見なせるのか、 補足にコメントいただけませんか?

breset
質問者

補足

みなさん 詳細に解説くださりありがとうございます。 私の説明が不足していて申し訳ありませんでした。 まず今回の前提となっているのは、何かの製品のばらつきを見るというものではなく ある不変のものを計測した時の計測値のばらつきについて見ています。 よってすべての測定値は他者によって利用されるものであり 不良であるからといって弾かれる性格のものではありません。 (もちろん利用側で弾くことも可能ですが、今回はそうではありません。) 測定値は、ほぼ正規分布になっています。 要求としては、yyyは3σの2倍で 現状は、yyyは3σの3倍ほどになります。 (No.2さんの解釈のとおりです。) 今回なぜこのような質問をさせていただいたかというと xxxとyyyの間に数学的な関連があるとすれば xxxがクリアできていれば、yyyをクリアする必要はないということが 言えると考えたからです。 以下にご回答いただいた内容からすると ・xxxとyyyには数学的な関連性はない。ただしyyyがxxxを超える確立は非常に高い。  (今回の場合は、yyyはxxxの2倍なので厳しいかどうかは別にして  このこと自体は問題ではない。) ・今回の場合、測定データに出現回数は少ないものの(0.27%の範囲)  山の中心から大きく外れた測定値がある。 ということでよろしいでしょうか? あと一般的な話で結構なのですが yyyがxxxの2倍というのは、厳しいものなのでしょうか?

  • masa2211
  • ベストアンサー率43% (178/411)
回答No.3

計測データというのが、製造物の品質管理の目的で計測した「何か」であると仮定します。 1)「3σ」と「最大値と最小値の差」との間の関連 数学的には、#1さんのとおりですが、製造物の場合は別の意味を持ちます。 「3σ」がある値以下というのは、品質が一定しているということ。 具体的には、製品のばらつきが少ないこと。 一方「最大値と最小値の差」というのは、ある1データが平均からズレまくっている(他はズレていなくても。)、というのとほぼ等しいため、 異常事態などが起きているかの指標という意味になります。 したがって、「3σ」が許容値内で「最大値と最小値の差」が許容値から外れる、というのは、 普段は、きちんと品質管理されていて品質のバラツキが少ない。 ただし、たまに異常事態が起こり、とんでもない品質の製品ができてしまう。 といった状態にある、ということです。 言い換えれば、3σと最大値と最小値の差には数学(統計学)的な関連は「無い」のです。 関連があれば、どちらか片方で用が足ります。 関連が無い現象が実際におこるからこそ、2つの管理指標が必要となります。 また、逆に、「3σ」が許容値からハズレ、「最大値と最小値の差」は許容値内、というのもありえます。 具体的には、 工作精度の甘いポンコツ機械を使って製品を作っている。当然、不良品をたくさん作る。 しかし、検査機械はまともで、しかも全数検査している。 したがって許容値外の製品は監査でひっかかるから一切無いが、許容値ぎりぎりの製品は多量にある。 このような製品を購入し、購入後の品質検査した場合のデータ。 つまり、全数検査で不良品をはじくことで3σのほうをごまかしてしまったデータ。 なお、上のような回答は、以下のことを字句どおりにとった場合の回答です。 >計測データの3σはxxx以下。この条件は満たす。 3σの値(=ばらつき)が小さいことが条件であり3σを超えるデータがごくわずか混じることは許容する。 >最大値と最小値の差はyyy以下 yyyの値には、2*xxxより大きい値が設定されている。たとえば、3σが4でyyyが10。 #1さんは、 ・±3σをxxx以下という要求と<その中に設定>する「最大値と最小値」 とありますが、私は、<その外に設定>しています。 ここの解釈が違うので、#1さんと結論が違っています。 ですから、<その中に設定>なら、#1さんとほとんど同じ感想をもちますが、 2ハン縛りを合理的解釈するのを優先し、#1さんとは異なった解釈としました。 ですので、ここの値によっては、私の意見は却下してください。 また、この場合の「製造物」とは、 ・生コンが固まったときの強度、アスファルト舗装工事直後の凹凸 ・リンゴや梨などの農作物の大きさ、甘さ(糖度) ・計測作業だけであっても精度管理を行うもの(測量データなど) といった、通常は製造物とはみなされないものも製造物と解釈してください。 結論。(警告!これは倫理的には問題のある発言です!) 2ハン縛り、かつ、全数検査であるなら、不良品はほっかむりして、全数検査通過後の最大最小を申告しよう!

  • masudaya
  • ベストアンサー率47% (250/524)
回答No.2

#1の方が詳細に説明されていますが, そもそも,データは正規分布になっているのでしょうか. なってない場合は,±3σを外れる確率は0.27%ではなく (出展は忘れましたが)1%程度になるそうです. (1)については関係はありますが,確率の話になるので 3σがいくらなので,最大最小がいくらになるという 定式化はできません.例えば,正規分布の場合でも 100個のデータであれば,最大か最小が±3σを外れる 確率は約24%となり結構よくあることになります. (1-(0.9973)^100≒0.24,1-(0.9973)^1000≒0.93) ちなみに1000個の場合は93%の確率で最大か最小が±3σ を外れることになります.

  • info22
  • ベストアンサー率55% (2225/4034)
回答No.1

>(1)3σと最大値と最小値の差との間には数学的に関連があると言えるのでしょうか? ±3σの中に収まるのは99.73%ですから 3σをxxx以下と要求し、それを満たしていても ±3σの外側に100-99.73=0.27%は収まらないものが発生することを 許容するわけです。1万個に27個の割合で±3σの範囲の外に飛び出す ことを許容することが、3σをxxx以下という要求の内容なのです。 とは行っても1万個に最大27個の不良品(±3σ内のものを合格品としたとき)がでる。100万個では2700個の不良品がでるということを 意味しますね。 とはいっても全数検査で不良品をすべてはじき出し除外するには検査コストがかかりすぎる。そこで、不良品でも上下に飛び出す極端なもの(最大許容規格と最小許容規格を±4σなどと決めて)を除外する(センサーで検出して除去する)ことかと思います。 同じ±3σ内に最大値と最小値を設定する事は、大量の不良品を発生させる事を意味します。生産品の分布に対して、±3σをxxx以下という要求とその中に設定する「最大値と最小値」は理不尽な要求で、±3σをxxx以下をさらに狭める要求であって、コスト対価を要求できる内容を含みます。 実質上のコストアップとなりますので、コストを上げたくないために、 最大値と最小値の差はyyy以下であることが「望ましい。」という表現にしているだけです。それが、良品を選別納入しろと言った要求に他なりません。(統計に無知な人の要求に他なりません。) 本来、最大値と最小値を設定するのは、±3σを飛び出しても0.27以下であれば許容するが、でも極端にかけ離れた規格の製品だけは混入しないで欲しいという要求なのですね。 もし、コストが10倍かかってもこの規格内のものを納品して欲しいという要求なら、全数検査して、規格内の合格品だけを納品すれば良いかとおもいますね。もちろん不良品をすべてはじくわけですから、不良品が沢山でます。不良品は、使えても、決めた規格外のものは不良品として扱うわけです。 僕が昔大量に部品を購入していて、正確な値のそろった物が必要だったので、全数検査して値ごとに分類、仕分けて、使ったことがありますか、100本入りの袋の中身の計測値の分布が、正規分布の一方が欠けた袋がたまに見つかっていましたが、多分、センサー等で自動計測してある値で分別してはじいたのだと思います。 >(2)関連があると言えるのであれば、数学的にそれを理解できるよう教えていただけないでしょうか? この内容はよく分かりませんが、上記に含まれた内容かも知れません。最大、最小値をどう設定するか、それとコストとの関係、不良品の発生率の増加との関係など含んでいるかと思います。