- ベストアンサー
確率について(サンプル数の計算方法)
- ある試験を行おうとしています。改善前のエラーの発生比率や機械の運転回数、エラーの発生制限などの条件が与えられており、それを基に確認に必要な試験回数を求める方法について質問しています。
- 具体的には、アンケート調査のサンプル数の求め方に関連して、上記の式を使用して試験回数を求めることができるのか、また、適正な調査結果の数値を具体的にどのように設定すればよいのか、エラーの発生比率の関連性などについて質問しています。
- 専門外の方であり、具体的な計算例などを出して説明してもらえると助かるという要望を述べています。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
> 「ほんとは 0.001 以下に~~~どこまで許容できるか」=5% とした場合、式のどの変数に割り当てればよいのでしょうか? Agresti-Coull のαです。 > 今回の質問は、実際あった話ではありません。ここに質問するために、ある程度の数値を設定して仮定の具体例として挙げました。もう少し補足しますと、 模索の挙句に「実はこれがほんとの問題じゃない」と言われると、騙された気がします。誠意は尽くしたつもりだし義務もないので、回答は楽しい範囲にしておいて、これでやめます。
その他の回答 (4)
- ur2c
- ベストアンサー率63% (264/416)
> 求めたいのは、何回試せばよいのかで、10万回試せば改善が判断できるか?ではありません 「10 万回試せば改善が判断できる」は「10 万回試せばよい」と同じに見えます。 > 改善前に、10万回動作させたときに、エラーの発生率が7%でした。これを、改善したので、エラーの発生率が0.1%以下になったことを判断できる試験回数は何回になるか? もしも「何回で判断できるか」ではなく「『最低限』何回で判断できるか」が問題だという意味ならば、もっと明確な条件が必要です。その条件とは、「ほんとは 0.001 以下になっていないのだけれど、それを誤って 0.001 以下になったと判断してしまう確率はどこまで許容できるか」とか「ほんとは 0.001 以下になったのだけれど、それを誤って 0.001 より大きいと判断してしまう確率はどこまで許容できるか」とかです。最初の「」の確率をたとえば 5% にすれば、最低限の試行回数は 1% のときより減らせます。まちがった判断を下す可能性をより多く許容するのですから。 その条件が与えられて「最低限」を計算する場合、理屈は ANo.3 とほぼ同じで、ただ未知数を n にして方程式を解けば良いです。もちろん、方程式を解くだけ面倒になります。それから上の条件について「なぜ 1% とか 5% とかで良いの?」という疑問には答えられません。世の中でそうすることが多いから、程度の話です。 以下、根本的な疑問です。改善前の測定はもう済んでしまっていて、たとえば「7% と判断した根拠が薄弱である」とか言われても、もう測定しなおすことはないのだろうと想像します。そして改善前には測定を 10^5 回で良いとした経緯があります。その試行回数には、何か根拠があったはずです。費用とか時間とか測定機とかの制約でしょう。そして、その測定は実行できたわけです。とすると、なぜ今回の測定を 10^5 回より減らそうとするのでしょうか? 10^5 回ならじゅうぶんなことは、ANo.3 の計算でわかっています。 めんどうな理論を使うと、その理論を説明する責任が生じます。英語の文献も読まねばならず、数式も並べねばならず、計算もせねばならない。それが自分でできなければ、だれかと契約しなければならず、余計な費用がかかる。というわけで、私だったら、「最低限」を苦労して求める前に、さっさと多めに測定しちゃいますけど。 > 改善前に、10万回の測定をしたときに、測定値は±7%の変動値を示しました。 > これを、改善したので、変動値が±3%以下になったことを判断できる試験回数は何回になるか? これは意味がわかりません。変動値って今回、初出の言葉ですよね?
補足
ご回答ありがとうございます。 早速計算してみたいと思うのですが、 「ほんとは 0.001 以下に~~~どこまで許容できるか」=5% とした場合、式のどの変数に割り当てればよいのでしょうか? >以下、根本的な疑問です。~~良いとした経緯があります。 今回の質問は、実際あった話ではありません。ここに質問するために、ある程度の数値を設定して仮定の具体例として挙げました。 もう少し補足しますと、機械を納品してから保障期間を1年間としますと、おそらく年間で100~200万回の動作をします。その間を全て評価に費やすわけにはいかないので、何か試験をするにしても期間短縮したいというのが目的のひとつです。 そして、「エラーの発生率が7%」と言う数字は、2つのケースが考えられます。 1つ目は、1時間ほど実験した結果、出てきた数字です。 この場合、1時間で7%だったのだから、また1時間評価すれば十分だろう・・・ は、通用しないのです。 なので、仮に改善後の期待値を1%とした場合、 1時間で7%≒1年でも7%だろう⇒改善後の1年分(1%以下)を評価する回数は? 2つ目は、想定にマージンを求める場合の数字です。 この場合は、機械の仕様として、エラー発生率を10%以下として販売したとします。 でも、実力的には、余裕をみて7%以下であることを確認しておきたかったとします。 なので、仮に実力値(期待値)を7%とした場合、 仕様は10%⇒1年間で10%を想定⇒1年間で7%以下を確認できる回数は? などを予め想定して評価回数を決めたいと考えまして、その計算方法を知りたいのです。 ですので、今回の7%とかは、全て空想の数字です。 >これは意味がわかりません。変動値って今回、初出の言葉ですよね? はい。初です。 上記同様、空想の数字についてですが、上記では回数に対して結果が2値(OK or NG)でしたが、これが変動の幅の場合だったら、同様な式になるのかを知りたかったのです。 例えば、温度を一定に保つ機械だったとします。 上記と同様に考えますと、 ケース1では、 25℃を設定して1時間運転した結果、25℃±7%だったとします。 なので、仮に改善後の期待値を1%とした場合、 1時間で25℃±7%≒1年でも25℃±7%だろう⇒改善後の1年分(1%以下)を評価時間は? ケース2では、 機械の仕様として、温度変動率±7%以下として販売したとします。 でも、実力的には、余裕をみて±3%以下であることを確認しておきたかったとします。 なので、仮に実力値(期待値)を±3%とした場合、 仕様は7%⇒1年間で7%を想定⇒1年間で±3%以下を確認できる回数は? 以上のような感じで計算したいと考えています。
- ur2c
- ベストアンサー率63% (264/416)
訂正がないので、 > 母数は10万回 を「標本の大きさが 10^5」と解釈します。Agresti-Coull を使い、Maxima で計算します。 load(distrib); z: float(quantile_normal(1-1/200,0,1)); n: 10^5; nt: n + z^2; pt: (x + z^2/2)/nt; l1: pt - z*sqrt(pt*(1-pt)/nt); u1: pt + z*sqrt(pt*(1-pt)/nt); l1,x=100; 7.714379168388485*10^-4 u1,x=100; 0.0012947739581499 だから 10^5 回試行して error が 100 回出たら、error 率が [7.7*10^-4, 1.3*10^-3] に入ってる確率は 99 % です。つまり、10^5 回試行すれば、error 率 7% からの改善の有無は、まず判断できますね。
補足
何度も回答いただきありがとうございます。 しかしながら、求めたいのは、何回試せばよいのかで、10万回試せば改善が判断できるか?ではありませんでして、無駄なお手間を取らせてしまったみたいで、申し訳ありませんでした。 こちらの不心得で、あまり何度も回答を求めることに対して恐縮しているのですが、もし、これに懲りずご回答いただけるのでしたら、と、期待を込めまして、もう少し質問をまとめる意味で、下記のようにまとめますので、ご検討いただけると幸いです。 【質問内容】 改善前に、10万回動作させたときに、エラーの発生率が7%でした。 これを、改善したので、エラーの発生率が0.1%以下になったことを判断できる試験回数は何回になるか? です。 また、もし、ご回答に余力があるようでございましたら、 改善前に、10万回の測定をしたときに、測定値は±7%の変動値を示しました。 これを、改善したので、変動値が±3%以下になったことを判断できる試験回数は何回になるか? のようなケースでは、また式が変わってくるのでしょうか? その場合、どのような式になるのでしょうか? です。 素人を相手にするのは大変でしょうが、ご検討いただけると大変助かります。
- ur2c
- ベストアンサー率63% (264/416)
> A1で「もう少し精密に考えておいた方が良い」との事ですが、他の式があると言う事でしょうか? そうです。「故障率の推定は世論調査ではなく、目的が異なる」という意味です。 > その場合、どのような式になるのでしょうか? 先の回答の URL にあるとおりなんですけど… > 英語版のwikiは、英語が不得手でして・・・(汗 学生でもできるので、近くの大学で統計ができる院生を推薦してもらうのはいかがですか? 真剣にやってくれると思います。 > A2で「「故障率はこれくらいなはず」(たとえば 7%)という想定に当ります。」との事ですが、この数字が小さくなると、サンプル数も小さくなってしまいます。 まず、「世論調査におけるサンプリング数の決定」の記事はあいまいな話で、随筆みたいなものですよね? それに、どうして故障率と世論調査が同じだと思うのかが理解できません。もしかして「sample size という言葉が同じだ」というくらいの根拠なのではありませんか? > 母数は10万回とします。 ここで言う母数は標本の大きさのことですよね? それならもう標本の大きさは精度とは独立に決まってしまっているので、問題はなくなってしまったように見えますが。
補足
貴殿の回答は、ことばの定義が難解で、小生にはなかなか理解できず残念です。 また、せっかく頂戴した回答ですが、先に専門外と述べているように小生は、確率論は素人ですので、ある程度知っていることを前提としたような回答内容では、根本的な回答にはなっておらず、せっかく、具体例を挙げていたのですが、それに合わせた計算なども無く、もしかして計算まではできないのでは?と感じてしまいました。残念です。 質問する立場で、贅沢を言える立場で無いことは理解していますが、もう少し質問者のレベルに合わせた回答を頂きたかったというのが感想です。
- ur2c
- ベストアンサー率63% (264/416)
A1. 状況に合わせて、もう少し精密に考えておいた方が良いです。 A2. 「想定する調査結果」は今の問題では「故障率はこれくらいなはず」(たとえば 7%)という想定に当ります。 A3. 当然、関係します。故障が稀なら、何回も実験しないと故障自体が観測されないのですから。その意味で、上の想定は低めにしておいた方が安全です。 A4. 機械を 1 回、運転する毎に故障したかしないかを観測することにします。故障が独立に起きるとすると(つまり、たとえば「無故障が続くと故障が出やすくなる」ようなことはない、とすると)故障の発生は 2 項分布に従います。だから、その仮定が正しいとするなら(これ、重要です)、問題は「2 項分布の母数を所与の精度で推定するには標本の大きさをどうすれば良いか」になります。 この問題については簡単で大雑把な方法から複雑で精密な方法までいろいろな考え方があります。その中でどれを選ぶかは、主に精度の重要性と処理や説明の手間との兼ね合いで決めます。どんな方法があるかは、↓にまとまっています。
補足
早速のご回答ありがとうございます。 頂戴しました回答の中で、下記の件について、いまいち理解に至らなかったのですが、 A1で「もう少し精密に考えておいた方が良い」との事ですが、他の式があると言う事でしょうか? その場合、どのような式になるのでしょうか?英語版のwikiは、英語が不得手でして・・・(汗 A2で「「故障率はこれくらいなはず」(たとえば 7%)という想定に当ります。」との事ですが、この数字が小さくなると、サンプル数も小さくなってしまいます。そうなると、故障率(発生の割合)が小さいのに、それを小さなサンプル数で見つけられるのか?と言うような疑問が残ります。 そのような意味で、どのような数値なのかを知りたかったのですが・・・ なので、A3との絡みが、よく判らなくなってしまいます。 A4で、補足しますと・・・ 機械を 1 回、運転する毎に通信エラーが発生したかしないかを観測する。です。 通信エラーは独立に起きるとします。 母数は10万回とします。 改善前の通信エラーの発生率は7%とします。 改善後の通信エラーの発生率の期待値は0.1%とします。
補足
>騙された気がします。誠意は尽くした~~ 何をもって、騙されたなんて思ったのか理解に苦しみます。 最初から、仮定条件として記述していたのですので、これが架空の条件であることは一目瞭然です。 なんか、被害妄想が強くないですか? それに、誠意って何ですか? 質問に対して、丁寧に対応する姿勢をさしているのでしたら、それは、違いますね。 本当にそうなら、4回もらりとりすれば、いくら素人の私でもとっくに伝わるはずです。 失礼ながら、貴殿の回答には、素人に対して噛み砕いて理解させようとする姿勢はありません。 結果だけを言えば、私には伝わっていませんし、確信的部分には説明はないし、英語のwikiのURLだけでしたので、とても素人向けの説明とは思えません。 自己顕示欲が強くないですか?<俺は知ってるんだぜぇ~みたいな・・・ よくある話ですが、教科書に書いてある事くらいしか、知らなく、応用とか出来ないレベルの人が、さも知っているかの如くふるまう方を見かけます。 そういう人は、たいていは、自分が知っている前提を外れると、強引に定義づけして、勝手に見当違いの答えを出して豪語しているようなパターンが多いです。 他人に判り易く伝える能力って、とても大事だと思います。 貴殿が、そうなのかは謎ですが・・・ まぁ、今回は、ちゃんと素人にも説明できる優秀な回答者に恵まれなかったと、あきらめます。 今回のやりとりで、確率論って「いいわけ」を前提にした後ろ向きな学問だと感じました。 そのせいか、いままでに確率論を語る人と何度かやり取りしたことがありますが、たいていは屁理屈をこねまわしたうえに、ちゃんと答えないタイプが多かった気がします。 まぁ、言い訳を前提にした学問なので、論理思考もそうなるのかなぁ等と改めて認識しました。 この事は、私の人事選考などの判断基準として参考になるので、役に立ちました。 今回の質問は、あきらめて、これで終わりにしますが、お手間は取って頂いたので、その事には感謝しております。 お礼を言わせていただきます。ありがとうございました。