- 締切済み
標本から母集団の標準偏差を求められるか
あるN(~5000)個のデータ母集団があります。 そこから10回に分けてデータを重複無く抽出し、それぞれのデータが下記だったとします。個々のデータは調べられない前提です。 データ数:n1,n2,…,n10 (n1+n2+…+n10=N) 平均:m1,m2,…,m10 標準偏差:s1,s2,…,s10 このとき、母集団の平均は(m1*n1+m2*n2+…+m10*n10)/Nで表されると思いますが、母集団の標準偏差を求めることは出来るのでしょうか? 実際に求めたいのはある製造工場における製品バラツキの月単位集計データが開示されているが、個々のデータが開示されていない場合に年間の総合バラツキが求められるか、を考えています。 ※統計学に詳しくないので、言葉の定義・文字の使い方に間違いがありましたらすみません。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
>母集団の標準偏差を求めることは出来るのでしょうか? 求める、というのが正確に計算できる、というのなら不可能です。抽出する毎に、平均にせよ、微妙に違ってきますので。しかし、推定はできます。 平均とデータ数と標準偏差が分かっていれば、不偏標準偏差が推定値となります。ただし、母集団が正規分布しているならば、という条件がつきます。 http://www.statistia.com/glossary/E4B88DE5818FE6A899E6BA96E5818FE5B7AE.html 理系の動物実験などでは、平均±不偏標準偏差で結果を表わさねばなりません。欧米は、標準誤差の研究者が多いようです。
- backs
- ベストアンサー率50% (410/818)
dat = {d1, d2, ..., di} という母集団(と仮定したデータ群)から、それぞれの標本でデータが重複しないように同じ大きさの標本をk個作ったとき: n1 = {...} n2 = {...} ・・・ nk = {...} 各標本の平均値の平均値は母平均とほぼ一致するようです。標準偏差についても、各標本の標準偏差の平均値をとると母標準偏差にほぼ一致するようです(擬似データでシミュレーションしてみたらそうなりました)。 ただ、こういう質問者さんがやろうとしている作業は私はお目にかかったことがないので、、、 どうなんでしょう。個人的には情報の1つとして参考にはできるけど、ちょっと灰色だなぁ、という気がしますね(^_^;) それよりは各標本の平均と標準偏差をプロットして、図から何かを読み取る方が適切だと思います。
お礼
標本の大きさは別(300~1000)となります。 各標本の平均と標準偏差はプロットして確認してましたが、標本の大きさが違うことによる重み付けをどのようにすれば良いか分からず結論を出せませんでした。 私の求めようとしているのは、「推移データ」を総分布として見ようとしているので、確かにおっしゃる通り参考にしかならないかもしれませんが、統計的に解があるかどうかを確認したく質問させて頂きました。 回答いただきありがとうございます。
お礼
お礼が遅くなり申し訳ありません。 教えて頂いた情報は参考になりましたが、やはり当方が求めようとしている値とは違うものになっているようです。うまく説明が出来ず申し訳ありません。 結果として、データ数、平均値、標準偏差が分かっているので正規分布と仮定してEXCELでデータを作成し推定してみました。