※ ChatGPTを利用し、要約された質問です(原文:データの整理と平均値のまとめ方)
データの整理と平均値のまとめ方
このQ&Aのポイント
データの整理と平均値のまとめ方について質問があります。実験を行っており、データのまとめ方で困っています。
実験結果のデータをまとめる際に、誤差が大きくなってしまう問題について悩んでいます。
また、同じ実験を3回行った結果、平均の範囲に重複がないことがあり、原因を考えています。データのまとめ方についてアドバイスをいただけると助かります。
よろしくお願いします。
現在、実験を行っており、データの整理をしているのですが、まとめ方で困っているので質問させていただきました。
9000ほどの母集団から100個取り出し、帯電量測定をします。正規分布であることを確認し、同じ実験を3回繰り返します。
このような実験を数種類行い、どのように変化したか(平均帯電量やバラつき具合など)を報告しようと思っています。
ところが、この実験はばらつきが大きく、サンプリングの計算をすると100個では平均の誤差(平均と標本平均の差)が大きくなっていしまいます。
100個以上の測定では大幅な時間がかかり実験としても成り立たず、効率が悪くなるため、また、他の数種類の実験結果との比較のために同じ100個で統一するために、100個で行いました。(100個でも誤差が大きくなる、というだけの話なので問題はないと思います)
ですが、同じ実験を3回行った結果について疑問点が出てきました。
実験から得られた標本平均Xbarと標準偏差σを、
Xbar-k*√(σ^2*(N-n)/n/(N-1)) < μ < Xbar+k*√(σ^2*(N-n)/n/(N-1))
(信頼係数K、母集団N、標本数n)
の式に用いて平均の範囲を出せると思います。(誤差が大きいということはこの範囲が大きくなるということですよね)
同じ実験を行って誤差の違い(平均μから近いか遠いか)はあれど、平均μの値はかならずどの実験でも範囲内に入るはずですよね。
ですが、3回行った実験のうち、範囲が重ならない結果(重複する範囲がない)が出てきました。3回すべて重ならなかったり、2個だけ重なって残り1個は重ならなかったりしました。重なれば少なくともその範囲に平均μがあると思っているのですが・・・
最初はこの3回行った同じ実験でそれぞれ得られた平均の範囲から平均の範囲をある程度決められるかなと思っていました。(誤差が大きくても)
原因として何が考えられるか考えたのですが、
1. 3回の実験のうち、測定中に触ったり何かしてちゃんと測定を行えなかったなど何らかの影響でちゃんとしたデータではない実験があるため。
2. 実は同一条件ではなかった(異なる実験扱いで比較できない)
どのようにデータをまとめていいか困っています。すべてのデータを載せるのも要領の関係で難しいので、まとめたいと思うのですが・・・
自分の統計の勉強不足なのでしょうか。
それか、Xbar±3*σで範囲を決めようかとも迷っています。
何か「ここは間違ってるよ」とか「こういう風にしたら?」などありましたら書き込んでいただけないでしょうか?
わかりづらい質問でお手数おかけしますが、ご教授いただけますでしょうか。
よろしくお願いします。
補足
回答ありがとうございます。 n=100個なので推定の式も大丈夫だと思います。 今回の帯電量は正規分布になることが分かっているので、おそらく同一実験になっていないことが原因だと予想しています。 今回の実験の経験から湿度などの影響が大きいのでそのあたりかなと思っています。 また、他のうまくいっているものはうまくいっているのでやっぱりその実験だけ実験条件がずれてしまったのではないかと思います。 <n=100で、平均を推定した結果と、2回の実験結果を合わせてn=200で、平均を推定した結果と、3回の実験結果を全て合わせてn=300で平均を推定した結果を比べてみては。 実際に検討してみたいと思います。 具体的なことは、もう一回やり直すか、報告できるデータかどうかの妥当性など担当の教授に相談して決めたいと思います。 ありがとうございました。