• ベストアンサー

統計的には(あるいは確率的には)

現在、4000種の物質それぞれにJANコード(物質固有の13桁の番号です)を打ちこんでおります。 そこで教えていただきたいのですが、無作為にいくつの物質を抽出して正しいJANコードが打ち込まれているとことを確認した場合に、ほぼ全て4000種の物質に正しく打ち込まれていると統計的に考えられるのでしょうか。全く数学的センスが有りませんので、簡単な説明で結構ですので、ご教示よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • hashioogi
  • ベストアンサー率25% (102/404)
回答No.2

私も昔統計を独学したきりなのでよく分かりませんが、 入力は専門家が行うわけでしょうし、そうそうミスをするとは思えません。ということはミスの出現はポアソン分布のようなものになるのではないかと想像します。 あらかじめ入力の専門家が今までの経験上どのくらいミスをするのかといった情報、つまりポアソン分布の形がわかっていないと計算できないのではないかと想像しますがいかがでしょうか?

yohoushi
質問者

お礼

ご教示ありがとう御座いました。 どうも私のような数学的センスのないものには難しい問題のようですね。

その他の回答 (1)

  • hashioogi
  • ベストアンサー率25% (102/404)
回答No.1

若干の誤入力があっても許される事例と100%完全な入力が求められる事例とがあると思います。 例えば役所における住民登録のような場合99.9%合っていればよい、0.1%程度は間違っていても許されるなんてことはないわけです。100%合っていないとまずいわけです。そのような場合は統計的な処理は意味はないわけでいくら全数の大きさが大きくても全数チェックが求められるわけです。 今回の場合は若干の誤入力は許される場合ということでしょうか?

yohoushi
質問者

補足

早速ご教示いただきありがとう御座います。 100%正しいためには、一つずつ照合しないといけないということに気付かされました。 たとえば、99.9%、99.8%正しく入力されていると推定されるにはいかがでしょうか。 よろしくおねがいいたします。

関連するQ&A