ベストアンサー

分散の精度について

2006/07/21 13:05

分散s^2の式を　s^2=(1/n)Σ(x-<x>)^2・・・・・(1) 　s^2=(1/n)Σx^2-<x>^2・・・・・(2) 　　n:データの数，x:各データ，<x>:データの平均のようにしたとき，式(1)と式(2)出の計算結果に関して，同じ分散の式なのに精度が違っていて，式(1)のほうが精度がいいそうです．この理由を教えていただきたいです．お願いします．

inaikarada
お礼率87% (35/40)

数学・算数
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

age_momo
ベストアンサー率52% (327/622)

2006/07/21 14:06 回答No.2

まず最初に確認ですが、この2式は数学的には同じことを表しています。そこは理解されてますね。 s^2=(1/n)Σ(x-<x>)^2・・・・・(1) =(1/n)Σ(x^2-2x<x>+<x>^2) =(1/n)Σx^2-2<x>(1/n)Σx+n(1/n)<x>^2 ここで<x>=(1/n)Σx　より =(1/n)Σx^2-2<x>^2+<x>^2 =(1/n)Σx^2-<x>^2 で(2)の式になります。では、違いが出てくるとしたら数字を丸めたときの誤差の違いですね。例えば平均をどこかで四捨五入して本来の値<x>に対して誤差εが出ているとします。 X=<x>+ε です。これを2つの式に代入して真の値との誤差を求めてみます。 (1)より s^2=(1/n)Σ(x-X)^2 =(1/n)Σ(x-<x>-ε)^2 =(1/n)Σ(x^2+<x>^2+ε^2-2x<x>-2xε+2<x>ε) ここで真の値は(1/n)Σ(x^2+<x>^2-2x<x>)ですので誤差E1は E1=(1/n)Σ(ε^2-2xε+2<x>ε) =ε^2-2<x>ε+2<x>ε =ε^2 (2)より s^2=(1/n)Σx^2-X^2 =(1/n)Σx^2-(<x>+ε)^2 =(1/n)Σx^2-(<x>^2+ε^2+2<x>ε) 真の値は(1/n)Σx^2-<x>^2ですから誤差E2は E2=-ε^2-2<x>ε 今、<x> ＞＞ ε　は明らかですので |E2|≒|2<x>ε|＞＞ε^2(=E1) よって式(2)の誤差E2は式(1)の誤差E1より大きいのです。

質問者