- ベストアンサー
最小二乗法は、なぜ「二乗」なのでしょうか?
最小二乗法は、なぜ「二乗」なのでしょうか? 多くの参考書には 「残差をそのまま足し合わせると 正負が打ち消しあってしまうため、二乗する。」 と書かれているのですが、 それでは4乗や6乗ではいけないのでしょうか? 個人的には、統計の正規分布と 何か関わりがあるのかと思っているのですが・・・。 それとも、ただ単に 「2乗が一番計算しやすいから」という事なのでしょうか?
- みんなの回答 (6)
- 専門家の回答
みんなが選んだベストアンサー
残差の4乗で比較すると、4乗で効いてくるために残差の大きいものにひきずられてしまいます。 例えば測定値がほぼ理論曲線通りで1点だけ異常値が出て残差が大きくなってしまったような場合、測定値から理論曲線を求めることを考えると、残差の2乗を使うよりも残差の4乗を使う方が異常値にひきずられて本来の理論曲線から外れてしまいます。6乗ではなお顕著ですね。 残差の絶対値を使えばよいのですが、前の方のご指摘のように計算が大変なので、2乗を使っているのだと思います。
その他の回答 (5)
- eatern27
- ベストアンサー率55% (635/1135)
http://ja.wikipedia.org/wiki/%E3%82%AC%E3%82%A6%E3%82%B9%EF%BC%9D%E3%83%9E%E3%83%AB%E3%82%B3%E3%83%95%E3%81%AE%E5%AE%9A%E7%90%86 という事が背景にはあるんだ、という事を知りたいのでしょうかね。 要するに、いくつかの仮定の元では、最小2乗法による推定値が「もっともよい」推定値となるという事です。
誤差が最小になるように近似するわけですよね。 でも、 >残差をそのまま足し合わせると >正負が打ち消しあってしまう ため、誤差の二乗和で評価するんですね。 二乗和が最小になるなら、4乗和も6乗和も最小になりますね。 誤差の二乗和が最小になるようにする、っていうだけの話で、 この段階では統計は関係ないと思います。
- incd
- ベストアンサー率44% (41/92)
ずばり計算しやすいからでしょう。 その他、そうして得られた推計値が良い性質を持つというのもあると思います。 二乗でなくて、たとえば絶対値を取るという推計値もあります(ただし、計算は困難)。 なぜ分散の定義は平均からの乖離の二乗の期待値なのか? というのとその疑問は本質的に同じことです。ばらつき具合を表す1つの方法が二乗することだということです。 ちなみに「距離」も「分散」もすべて「二乗」から派生しているものなので、根本的な答えとはいえないように思います。 >>個人的には、統計の正規分布と 何か関わりがあるのかと思っているのですが・・・。 もっと突き詰めていけばそうかもしれません。そこまで深い話はちょっと分かりません。
- ymmasayan
- ベストアンサー率30% (2593/8599)
ピタゴラスの定理 うーん? 一応、誤差の分散の推定値は残差の平方和 という所から来ています。↓ かなり理論的ですよ。
- sanfran_
- ベストアンサー率75% (6/8)
回帰式をグラフに描いて眺めれば分かるように 距離、仮にcとすると、そのx成分(a)とy成分(b)とは、 ピタゴラスの定理により a^2 + b^2 = c^2 と、表されるね。 そこから、最小2乗法は来ています。