• ベストアンサー

回帰分析  最小二乗法の直線

質問ですが 最小二乗法の直線はどうして残差dの二乗和が最小になる直線なのですか? 信頼区間がナントカ・・・みたいな? 数学には詳しくないので簡単に教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.3

こんばんは。 >>>最小二乗法の直線はどうして残差dの二乗和が最小になる直線なのですか? それは「日本国籍の人は、なぜ日本人なのですか?」と同様の質問です。 残差dの二乗和を最小にすることを最小二乗法と呼びます。 >>>信頼区間がナントカ・・・みたいな? よく知りませんが、とにかく、最小二乗法を行う上では何も関係ありません。 >>>数学には詳しくないので簡単に教えてください。 一言で言えば、 y=ax+b にデータを当てはめて、 残差 = axn + b - yn として、両辺を2乗して、それを全データについて足して、 aやbで偏微分(微分の一種)を行って、 偏微分の結果がゼロ(極小、つまり、最小二乗) となるように、a、bを決めるということです。 以下は、お暇でしたら読んでください。 ---------------------------------------------------- XYデータがn個あるとします。 (x1,y1)、(x2,y2)、(x3,y3)、・・・、(xn-1,yn-1)、(xn,yn) 上記を、y=ax+b すなわち、0=ax+b-y に当てはめるとします。 1個目のデータの残差 ε1 は、 ε1 = ax1+b-y1 2個目のデータの残差 ε2 は、 ε2 = ax2+b-y2 ・・・ n個目のデータの残差 ε2 は、 εn = axn+b-yn 各々両辺を2乗して、 ε1^2 = (ax1+b-y1)^2 ε2^2 = (ax2+b-y2)^2 ・・・ εn^2 = (axn+b-yn)^2 左辺同士、右辺同士を、上から下まで全部足して、 Σ[k=1→n]εk = Σ[k=1→n](axk+b-yk)^2 ここで、右辺を偏微分します。 xk、yk はデータ、すなわち定数。 逆に、a、bが未知数です。 aで偏微分したもの = 0 bで偏微分したもの = 0 という条件から、a、bが求まります。 ご参考になりましたら。

kazu4psp
質問者

お礼

ありがとうございます!

その他の回答 (2)

noname#227064
noname#227064
回答No.2

一言で言えば、ある条件下では、最小二乗法によるパラメータの推定が最もバラツキが小さく偏りのない方法だからです。 (ガウス・マルコフの定理 http://ja.wikipedia.org/wiki/%E3%82%AC%E3%82%A6%E3%82%B9%EF%BC%9D%E3%83%9E%E3%83%AB%E3%82%B3%E3%83%95%E3%81%AE%E5%AE%9A%E7%90%86) 残差の絶対値の和だと絶対値というのが扱いにくいですし、残差の3乗や4乗の和では計算が面倒です。

kazu4psp
質問者

お礼

ありがとうございます!

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

> 最小二乗法の直線はどうして残差dの二乗和が最小になる直線なのですか? というより、残差dの二乗和が最小になるようにa,bを決めるのです。 a,bを2変数として連立偏微分方程式を立てこれら(偏微分方程式)がいずれも0になるようにa,bを決めます。

kazu4psp
質問者

お礼

ありがとうございます!