※ ChatGPTを利用し、要約された質問です(原文:統計学的に必要なサンプリング数について)
統計学的に必要なサンプリング数とは?
「正規分布している母集団の中から、何個のサンプルを取り出せばその母集団の振る舞いを再現できるか」
という質問をさせて頂きます。統計学の知識・知見がある方ご回答どうかお願いします。
私は化学研究に携わる学生です。
ある時間範囲における、箱の中の分子の運動をコンピュータシミュレーションで描画しました。
その結果ある瞬間に分子が箱のどこに居るかという位置情報を1000万個得ました。(パラパラマンガの要領で、この多数の構造から分子の運動が描けます)
現在分子が統計的にどの位置に存在しているのかを求めています。
(例)箱を三等分し、A,B,Cのエリアに分けた時に、それぞれ何%の時間ずつ分子が存在しているか
計算時間短縮のため、1000万個からいくつかサンプリングしようと考えています。
しかし例えば、サンプリング数が10個だけだと、再現性は非常に低いと予想できます。
では何個サンプリングすれば、1000万個位置情報を処理したものと等しい結果を得られるのでしょうか。
分母が1000万個もあるので、簡単にするために母集団が正規分布すると考えることにしました。
調べてみましたが、二項母集団に関するものしか理解できませんでした。
100%の再現性が得られることは無いだろうと思いますが、「大体正しい」(統計的に何%、というのでしょうか)結果を得るためには何個サンプリングすればいいのでしょうか?
宜しくお願い致します。
お礼
ありがとうございます! 所属キャンパスの図書館に無かったので取り寄せを頼みました。