- 締切済み
確率の計算が得意な方お助け下さい
とある商品を売っているお店が何店舗もあります。 そのお店のうちいくつかは,商品に偽物を混ぜています。 商品が本物か偽物かを見分けるには,かなりの手間がかかりますが, 鑑定をすれば100%正確にジャッジができるものとします。 この時に,店舗Aが偽物を混ぜているかどうかを見分けたいとします。 仮に店舗Aで扱っている23個の商品のうち,4個が偽物だとしたら, 90%以上の確率でA店に偽物があるかどうかを判断するには 何個の商品を鑑定すればよいでしょうか? いろいろ数字を変えて試行したいので, 計算方法まで教えていただけるとありがたく思います。 よろしくお願いいたします。
- みんなの回答 (10)
- 専門家の回答
みんなの回答
- kamiyasiro
- ベストアンサー率54% (222/411)
#4です。 たびたびスミマセン。 超幾何分布は、エクセル関数にありました。 hypgeomdist です。Excel2010以降は hypgeom.dist らしいです。 N=23,K=4,n=10 として 10個の抜き取り試験で、不良品がx個見つかる確率質量を計算すると、 0個:hyogeomdist(0,10,4,23)=0.080745342 1個:hypgeomdist(1,10,4,23)=0.322981366 2個:hypgeomdist(2,10,4,23)=0.396386222 3個:hypgeomdist(3,10,4,23)=0.176171654 4個:hypgeomdist(4,10,4,23)=0.023715415 なります。これらの確率質量の合計は1です。
- 島崎 崇(@tadopika)
- ベストアンサー率63% (36/57)
「90%以上の確率で「A店に偽物がある」と判断できる」 というのは、 「「A店に偽物がない」と誤って判断する確率が10%未満である」 と言い換えることができます。 商品を1個ずつ鑑定していき、偽物に当たらない確率(本物に当たり続ける確率)が10%未満になるような鑑定回数を求めれば、これが答えになります。 1個の鑑定で偽物がないと判断してしまう確率、即ち、本物を選んでしまう確率は、19/23≒0.826 2個の鑑定で、2個とも本物に当たる確率は、19/23*18/22≒0.676 3個の鑑定では、19/23*18/22*17/21≒0.547 という具合になります。 このように計算していくと、9個の鑑定では、19/23*18/22*...*11/15≒0.113 そして、10個のときに、19/23*18/22*...*10/14≒0.0807 となり、確率が10%を下回ります。 従って、10個の商品を鑑定すれば、90%以上の確からしさで、A店に偽物があるかどうかを判断することができます。
- kamiyasiro
- ベストアンサー率54% (222/411)
#4です。 n個まとめて抜き取ったとき、検査規格x=0として判断するのです。 よって、1個出る、2個出る・・・はどうでもよく、#3さんのように、少なくとも1個出たら、その店はクロです。 #7さんの事例は分かりやすい! ここでも、4個というタレコミ情報はどうでもよく、90%の確率(10回同じ検査をしたら1回は間違える)で、その店に4個出ていれば捉まえることができるという基準としての意味だけです。 同じ基準(抜き取り数10)で検査すると、店舗に出しているのが3個のときは、84%しか捉まえられませんし、2個のときは約69%しか捉まえられません。 また、同じ4個でも母数が40個もあると、約70%の確率でしか捉まえられません。 ですから、4個の意味は、あくまで発見できるか否かの基準として考えるべきです。
- stomachman
- ベストアンサー率57% (1014/1775)
問題文を不適切に省略したんじゃないのかな。 勝手に推測して問題を復元してみた: 「巨大ショッピングモールのオーナーへ、確かなスジから『あんたのショッピングモールでCOACHの最新モデルを扱っている沢山の店の中に、極めて高度な偽物を4個仕入れた店がある』という密告が入った。もちろん、最新モデルなら、仕入れたらすぐに店頭に出るに違いない。オーナーとしては、偽物を混ぜているケシカラン店を特定したいのだが、こっそりやらないと、その悪い店が偽物を隠してしまうから真相が分からなくなる。そこでオーナーは、店長の顔つきがなんとなく怪しいなと思う店『ホントに本物激安君』にまず目を付けた。『ホントに本物激安君』は店頭に23個のCOACH最新モデルを並べている。その中から幾つか品物を買ってきて鑑定士に送り、調べてもらう事にした。もちろん、買ってきた中にひとつでも偽物があれば『ホントに本物激安君』はクロである。問題は、買ってきた中にひとつも偽物がなかった場合。そのとき、『『ホントに本物激安君』は顔に似合わず偽物を混ぜていない』という判定が誤っている確率が10%未満になるようにするには、最低幾つの品物を買ってくれば良いか」 これなら、へんてこな回答の余地はなくなるでしょ。 計算に必要な要点だけを書き出せば 「23個中4個が偽物である場合、『23個中からN個をランダムに取り出したところ、どれも偽物ではない』ということが生じる確率P(N)が10%未満になるような最小のNは幾つか」 ということ。たいして難しい問題ではない。 『23個中からN個をランダムに取り出したところ、どれも偽物ではない』ということが生じる確率P(N)は、『取り出さなかった23-N個の中に全ての偽物が入っている』確率と同じ。つまり、 P(N) = (23-N)C4 / 23C4 = (23-N)! 4! (23-4)! / (4! (23-N-4)! 23!) = (23-N)×(22-N)×(21-N)×(20-N) / (23×22×21×20) だから、これが10%未満になる最小のNをExcelかなんかで計算すればよろしい。
確率の計算が得意な訳ではありませんので、悪しからずご了承ください。 これは、回答と言うよりも、質問者の方への逆質問か確認になります。 また、あくまでも23個の商品のうちの4個が偽物だと分かっていた場合です。 そして、どこかで偽物が1個出れば鑑定は終了という考え方です。 ANo.3の方の回答に、「少なくとも1つ偽物が入る確率」とありますが、これを言い換えると「偽物が1個か2個か3個か4個入る確率」になります。 自分は、1個目に偽物が出る確率、2個目に偽物が出る確率、3個目に偽物が出る確率と順に計算して行って、これらを加えることを考えました。 計算方法は次の通りです。 1個目に偽物が出る確率:4/23 2個目に偽物が出る確率:19/23*4/22=4/23*19/22 (式の変形によって、1個目に偽物が出て2個目に本物が出る確率とも考えられます。) 3個目に偽物が出る確率:19/23*18/22*4/21=4/23*19/22*18/21=19/23*4/22*18/21 (式の変形によって、1個目に偽物が出て2個目と3個目に本物が出る確率とも、1個目に本物が出て2個目に偽物が出て3個目に本物が出る確率とも考えられます。) この結果、やはり10個目でした。 しかし、偽物が2個か3個か4個出る確率も考える点について、質問者の方は疑問に思われませんでしたか。 質問の場合には、23個と数が多くて計算が大変なので、自分は5個の商品のうちの2個が偽物であるとして計算し、漸く理解出来ました。(90%云々は関係なく考え、自分の考え方が正しかったことも分かりました。) 以上、ご参考まで…。
- kamiyasiro
- ベストアンサー率54% (222/411)
#4です。 回答者のみなさんが誤解してみえるようなので、補足しておきます。 「偽物が4個あるのだから、もう分かっている」ではありません。 偽物が4個あるのを、10%の確率で(同じ検査を10回やれば1回の割合で)見逃すのを覚悟の上で抜き取り検査しろ、と言っているのです。 同じ抜き取り数だと、偽物3個とか2個の店は、検査をすり抜ける確率がもっと高くなります。 ご質問者が数字を変えて試行されたいのは、このことです。
- kamiyasiro
- ベストアンサー率54% (222/411)
私は企業に勤務する統計屋で応用統計の学位(博士)があります。 この問題は、計数規準型抜取検査の類題で、レベルとしてはQC検定1級レベルの高度な問題です。「無理」とか言う回答が出るのもしかたありません。 #3さんが正解を述べられていますが、私はそれを補足します。 まず、前提知識です。 『N個の有限母集団中にK個のAがあり、ここからn個非復元抽出を行ったときにx個のAを得たとします。このとき確率変数xが従う分布を超幾何分布といい、 P(x)=combin(K,x)*combin((N-K),(n-x))/combin(N,n) となります。 また、超幾何分布において有限母集団の大きさNが十分大きいときはP(x)は二項分布に近づき、K/Nが小さく抽出数nが大きいときはポアソン分布に近づきます。』 次に問題の理解です。この問題は言い換えれば、次のような工業問題に置き換えられます。 『複数のロットがあります。 そのうちいくつかには不適合品が混入しています(JISでは不良のことを不適合と言います)。 不適合品は検査をすれば100%ジャッジできます。 この時に、納入ロットが不適合を含んでいるかどうか見分けたいとします。 仮にロットはN個からなり、K個不適合を含んでいるとすると、90%以上の確率でこのロットを不合格にするには、何個抜き取り検査をすれば良いでしょうか。』 このとき、10%の確率で(同じ検査を10回やれば、うち1回は)不合格を合格として受け入れてしまうことになります。これを『消費者危険』と言います。 では、最後に事例と計算です。 『製品は23個入りアーモンドチョコです。アーモンドが割れ欠けなど規定外という不適合(不良)はロット中に4個まで許されているとします。このロットが合格かどうか調べるには、アーモンドチョコをどれだけ破壊検査(溶解検査)しなければならないか、検査規格をx=0,消費者危険10%として抜取数を求めなさい。』 エクセルで計算します。x=0のとき、KCx=1なので#3さんは省略されていますが、ここでは明記しています。消費者危険が0.1を下回るのは、n=10の時です。 (このサイトは、空白を勝手に詰めるので、あえてアンダーバーを入れています) ________N______23 ________K_______4 ________x_______0 ________n_____KCx__(N-K)C(n-x)_________NCn____________P(x) ________1_______1___________19__________23_____0.826086957 ________2_______1__________171_________253_____0.675889328 ________3_______1__________969________1771_____0.547148504 ________4_______1_________3876________8855_____0.437718803 ________5_______1________11628_______33649_____0.345567476 ________6_______1________27132______100947_____0.268774704 ________7_______1________50388______245157_____0.205533597 ________8_______1________75582______490314_____0.154150198 ________9_______1________92378______817190_____0.113043478 _______10_______1________92378_____1144066_____0.080745342 _______11_______1________75582_____1352078_____0.055900621 _______12_______1________50388_____1352078_____0.037267081 _______13_______1________27132_____1144066_____0.023715415 _______14_______1________11628______817190_____0.014229249 _______15_______1_________3876______490314_____0.007905138 _______16_______1__________969______245157_____0.003952569 _______17_______1__________171______100947_____0.001693958 _______18_______1___________19_______33649_____0.000564653 _______19_______1____________1________8855_____0.000112931 _______20_______1________#NUM!________1771___________#NUM!
- tsuda16
- ベストアンサー率85% (6/7)
n個の商品を鑑定したとき,偽物が1つも見つからない確率は 19Cn / 23Cn なので,少なくとも1つ偽物が入る確率は 1 - 19Cn / 23Cn これが90%以上なので, 1 - 19Cn / 23Cn > 0.9 => n >= 10 ですかね。 ただ,#1 さんが仰っていることと似たようなことですが, 4個偽物が入っていると仮定しているからこの式が成り立つわけで, 実際はわかっているわけではないので,あくまで試行実験ですよ。
- 中村 拓男(@tknakamuri)
- ベストアンサー率35% (674/1896)
見分けるという話と4個偽物があるという話は全然つながらないけど、 とりあえず、偽物を検出する確率は 1 - 19P4 / 23P4 = 0.562 と意外と高いです。
それは無理。 まず、調べる人が「23個の商品のうち、4個が偽物だ」ということを知っているとしたら、もう調べる必要はありませんよね。偽物がある確率は100%だとすでにわかっているわけですから。 次に、偽物が入っているかどうかわからない場合です。 1個調べてそれが偽物だったらその時点で結論は出ますね。偽物がある確率は100%です。 また、1個調べてそれが本物だった場合、残り22個の中に何個の偽物があるかの判定はまったくできません。まったくないかもしれないし、1個だけ偽物かもしれないし、全部偽物かもしれない。「90%以上の確率で」「偽物があるかどうかを判断する」ための要素は何一つありません。 これは2個でも3個でも同じです。22個調べて全部本物だったとしても、残った1個が偽物である確率は計算できません。 結局23個全部調べて偽物がひとつも出てこなければ結論は0%だし、調べている間に1個でも出てくれば結論は100%ということになります。