- ベストアンサー
分散の精度について
分散s^2の式を s^2=(1/n)Σ(x-<x>)^2・・・・・(1) s^2=(1/n)Σx^2-<x>^2・・・・・(2) n:データの数,x:各データ,<x>:データの平均 のようにしたとき,式(1)と式(2)出の計算結果に関して,同じ分散の式なのに精度が違っていて,式(1)のほうが精度がいいそうです.この理由を教えていただきたいです.お願いします.
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
まず最初に確認ですが、この2式は数学的には同じことを表しています。 そこは理解されてますね。 s^2=(1/n)Σ(x-<x>)^2・・・・・(1) =(1/n)Σ(x^2-2x<x>+<x>^2) =(1/n)Σx^2-2<x>(1/n)Σx+n(1/n)<x>^2 ここで<x>=(1/n)Σx より =(1/n)Σx^2-2<x>^2+<x>^2 =(1/n)Σx^2-<x>^2 で(2)の式になります。 では、違いが出てくるとしたら数字を丸めたときの誤差の違いですね。 例えば平均をどこかで四捨五入して本来の値<x>に対して 誤差εが出ているとします。 X=<x>+ε です。これを2つの式に代入して真の値との誤差を求めてみます。 (1)より s^2=(1/n)Σ(x-X)^2 =(1/n)Σ(x-<x>-ε)^2 =(1/n)Σ(x^2+<x>^2+ε^2-2x<x>-2xε+2<x>ε) ここで真の値は(1/n)Σ(x^2+<x>^2-2x<x>)ですので誤差E1は E1=(1/n)Σ(ε^2-2xε+2<x>ε) =ε^2-2<x>ε+2<x>ε =ε^2 (2)より s^2=(1/n)Σx^2-X^2 =(1/n)Σx^2-(<x>+ε)^2 =(1/n)Σx^2-(<x>^2+ε^2+2<x>ε) 真の値は(1/n)Σx^2-<x>^2ですから誤差E2は E2=-ε^2-2<x>ε 今、<x> >> ε は明らかですので |E2|≒|2<x>ε|>>ε^2(=E1) よって式(2)の誤差E2は式(1)の誤差E1より大きいのです。
その他の回答 (1)
- ymmasayan
- ベストアンサー率30% (2593/8599)
数式的には全く同じですが計算上は丸め誤差が付きまといます。 非常に近い数字の引き算を先にやると有効数字の桁数が非常に小さくなります。 これを「桁落ち」↓と言います。対策は引き算を最後にやるように計算過程を変更することです。 この場合がまさにそうです。
お礼
御礼が遅くなって,大変すみません. 数値計算などで出てくる誤差の話だったのですね.ありがとうございました.
お礼
お礼が遅くなって,大変すみません. わざわざ式で誘導までしてもらって,大変助かります. ありがとうございました.