- 締切済み
標準偏差の2つの出し方の違い
データのばらつきを統計処理して標準偏差を出したいのですが、2つのやり方で値が異なるので困っています。 ・標準偏差の定義の式でもとめるやりかた ・データから度数分布表を作ってヒストグラムを描きそれをガウスフィットしてそのガウス関数の式から標準偏差を求めるやり方。 この2つを比較したらフィットするやり方のほうが標準偏差が低くでました。 この標準偏差の値の違いの原因がおわかりになりましたら教えて下さると非常に助かります。 また、正しく母集団の標準偏差を算出できる方法はどちらなのでしょうか。 不勉強で申し訳ありません、教えて下さると幸いです。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- goma_2000
- ベストアンサー率48% (62/129)
No.2で回答したものです。 不偏分散とは分散の期待値です。母分散がわからないときに取得されたデータだけから分散を推定するわけですがその推定値として分散の期待値を求めます。それが不偏分散で式の上からはnで割るかn-1で割るかの違いになります。 どちらを用いるのが適切か?ですが、統計の世界では上記の理由により不偏分散を用います。ただ業界によりどちらが適切か変わるケースがあります。 老婆心ながら。ツールを用いて計算する場合には中で何をどうやって計算しているかを認識する必要があります。学生のレポートなら良いですが、論文として投稿するものに関しては気をつけたほうが良いですよ。
- goma_2000
- ベストアンサー率48% (62/129)
サイエンス系(理学部)で実験データを取り扱う際には良く行なうようです。 思いつく理由として 1)元データが数値だった ヒストグラムを作成する段階で離散化しているので元の数値の標準偏差を計算した場合とはことなります。 2)標準偏差の計算に不偏分散を用いている 不偏分散と分散の違いはnで割るかn-1で割るかです。 といったところでしょうか。 あまり参考にならないかな・・・
- solla
- ベストアンサー率59% (45/76)
> ・データから度数分布表を作ってヒストグラムを描きそれをガウスフィットして… のような方法は聞いたことがありません。統計的な根拠は無いように思います。 一方、標準偏差の定義の式は母標準偏差の統計的な推定量として、きちんとした根拠を持っています。
補足
ヒストグラムの方は統計的な根拠はないのですね。 それではなぜヒストグラムというものを作るのでしょうか? わからなくなってしまいました。 もしよろしければ教えて下さると幸いです
補足
2)のところで普偏分散と分散について書いてくださいましたが、この場合はどちらの分散を用いるのが適切なのでしょうか。 その理由も教えて下さると幸いです。