- 締切済み
統計学-母集団が少ない場合の標準偏差について-
はじめまして。よろしくお願いします。 現在、70個ほどのデータの標準偏差と平均をグラフにしてまとめている作業をしています。(エクセルで、まず平均の棒グラフをつくり、その後、y誤差範囲に標準偏差を代入してグラフ化しています。)母集団もすくなく、データも明らかにばらつきがある、たとえて言うと、1のものもあれば、1000のものあるのに、データは70前後。 もちろん、標準偏差もものすごく大きくなります。 エクセルで作成しているのですが、STDEVPという母集団全部を考慮に入れる(標本としないで)式でやっています。 本題ですが、そのばらつきのある標準偏差をどうにかして縮めたいのです。「誤差を範囲に入れるような感じでやればもっと標準偏差のバーが小さくなるだろう。それを考えろ。」と上司は言ってきますが、私にはさっぱりわかりません・・・。 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか・・・。
- みんなの回答 (7)
- 専門家の回答
みんなの回答
- chicago911
- ベストアンサー率30% (213/706)
もう一つ状況がわからないのですが、 母集団と言うことは、すべての Data が取れている、ということであって、抜き取りではない、で間違いないですね。そうなると 「70 個ほど」 ではなくて、「確定した個数」 になります。 「母集団も少なく」 と言うのは、個数が 70 前後の母集団がいくつかある、と考えていいですか。 さて問題は、標準偏差と平均値を出す意味ですが、これはあくまで正規分布をしていることが前提です。そのままの数値では正規分布していないときは、対数変換した値の正規性の検討を行ない、正規性が確認できたら対数値を用いて、標準偏差、平均値の評価ができます。従って、見かけを良くするために対数を用いるのは間違いです。 また、測定上に問題があり、一部の数値を棄却することは可能ですが、適切な棄却検定を行なうことも必要になります。 > 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか。 は、きつい言い方をすれば、質問としては成立しません。
- chicago911
- ベストアンサー率30% (213/706)
もう一つ状況がわからないのですが、 母集団と言うことは、すべての Data が取れている、ということであって、抜き取りではない、で間違いないですね。そうなると 「70 個ほど」 ではなくて、「確定した個数」 になります。 「母集団も少なく」 と言うのは、個数が 70 前後の母集団がいくつかある、と考えていいですか。 さて問題は、標準偏差と平均値を出す意味ですが、これはあくまで正規分布をしていることが前提です。そのままの数値では正規分布していないときは、対数変換した値の正規性の検討を行ない、正規性が確認できたら対数値を用いて、標準偏差、平均値の評価ができます。従って、見かけを浴するために対数を用いるのは間違いです。 また、測定上に問題があり、一部の数値を棄却することは可能ですが、適切な棄却検定を行なうことも必要になります。 > 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか。 は、きつい言い方をすれば、質問としては成立しません。
下手なことをすると、データのねつ造ということになり、発覚したとき大変なことになりますよ。上司の指示であることを証拠として保存しておくことをおすすめします。
- keikan
- ベストアンサー率42% (75/176)
>「標準偏差のバーが小さくなるだろう」 Excelの使い方の話? 標準偏差の値は全体の約68%が入る平均を中心とした幅なので母集団がばらつく以上小さくはならない。 標準偏差そのものを小さくするのならば、今までの回答者の方々のとおり。 あとは、データで下限上限付近の物を取り除く。 (その代わり、取り除く理由がほしい。:「このデータは明らかに観測者の測定ミス」、「測定機器に異常があった。」など) ヒストグラムを書いてみて外側のデータを無視するなどしてみる。
- fortranxp
- ベストアンサー率26% (181/684)
まず、上司の方に聞いてみて下さい。 何のためにデータを取っているのか? 答え 1.履歴の収集 2.工程の維持管理 3.バラツキの減少 等々 もし3ならば 母集団そのものにアクションをとるべきです。たとえば 全数検査を行い規格値をこえるものはどの程度あるのか? で 規格より外れたものやそのロットは 不良扱いするのか? で いくら外れたデータが出ても何もしないのであれば 意味がないのではありませんか?
- 12m24
- ベストアンサー率23% (193/817)
データそのものがばらついている場合は分散は(標準偏差も)でかくなります。データそのものが否定されない限りこれを直すのは無理でしょう。 分散の検定方法として、カイ2乗分布によるものがあります。この分布関数は分散の信頼度を検定するために使われています。詳しいことは確立統計の本に譲りますが、何パーセントの確率で分散がこの範囲に入るということを示すことができます。 こんなものではだめでしょうか?
- graduate_student
- ベストアンサー率22% (162/733)
log変換すればいいのではないですか?