- ベストアンサー
分散について
分散とは確率論において、確率変数の2次の中心化モーメントの事で、確率変数の分布が期待値からどれだけばらけているかを示す値. ということは分かるのですが,これは分散が減れば期待値に近づくということでいいんですか? 私は計測した加速度データに含まれるノイズの低減プログラムを作りデータの分散を0.008減らすことができました. これは0.008m/s^2程度ノイズを減らすし計測データの真値に近づくことができたということでよいのでしょうか? 教えてください.
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> 分散が減れば期待値に近づく > 計測データの真値に近づくことができた という表現に、まだ何か言葉が足りないようで、スッキリしないものを感じます。 要するに、データを取ることによって得られる母平均や母分散の推定値の精度を上げたいということでしょう。そのために、データの測定誤差を小さくすることに成功した、ということですね。 データの測定誤差を小さくすることによって、母平均や母分散の推定精度は、間違いなく向上します。 しかし、測定方法の改良によって母分散が小さくなる、というものではないので、ご注意ください。ただし、あなたの考えているモデルが、母分散がゼロであり、データのバラツキの要因がすべて測定誤差にある、というものであれば、話は別です。この点は、まず、モデルをキチンと整理してかかってください。 「真値」という言い方は、母分散がゼロの場合の表現であり、ふつうは「母平均」というほうが間違いないと思います。当然、データの平均値をもって「母平均の推定値」とするわけですが、その誤差は、測定誤差が小さければそれなりに小さくなるはずです。 このへんの用語の意味と使い方をよくわきまえると、本質が見えてくるはずです。
その他の回答 (1)
- sanori
- ベストアンサー率48% (5664/11798)
>>> 分散とは確率論において、確率変数の2次の中心化モーメントの事で、確率変数の分布が期待値からどれだけばらけているかを示す値. ということは分かるのですが, Wikipedia と同じ文章ですね。(笑) データの分散を0.008減らすことができました ・・・ これは0.008m/s^2程度ノイズを減らすし計測データの真値に近づくことができたということでよいのでしょうか? ノイズがあるという条件での期待値というものが、 ノイズを減らしたときの期待値というものに、取って代わられた、 ということです。 ノイズの低減によって、期待値が真の平均値に近づく、というのは、一見、当たり前のことのようですけれども、 例えば、 そのノイズ低減の手法が、個々のデータ全体的にを押し上げたり押し下げたりする、 という副作用のある手法だとすると、 分散は小さくなるけれども、データの平均値が、かえって真の平均値から 遠ざかることになる場合があります。 P.S. >>> これは分散が減れば期待値に近づくということでいいんですか? 「期待値が期待値に近づく」というのは、変です。 なお、 「計測データの真値」というのも、変です。