●次ぎの2つが前提にある。1つは測定し記録されたデータ群です。
1つの属性に属するデータ(x)のそれぞれに対応するデータ群(y)。(x1、y1)、(x2、y2)、(x3、y3)、・・・
●2つ目がそれに対する、数学でいう「関数」、それは数式で表されるものを普通は考えている。、1次式-直線、2次式-放物線,円、双曲線、3次式、サインカーブ、LOGカーブ、スプライン関数カーブ、サイクロイド曲線などなんでもいいのですが。
●そこで、データ分布がどの数式によく当てはまりそうかは、扱う人が理性と経験で判断する。そこで1つの式を選択し、具体的に式を決める係数をa,b,c・・と置いて式を取りあえず決める。y=ax^2+bx+cなど。
●その後その式にx1、x2、・・・を入れて計算したf(x1)、f(x2)・・
とy1、y2.y3・・・の差の2乗の和を考える。2乗するのは、大なるとき
と小なるときが打ち消さないようにするため。
S=(y1-f(x1))^2+(y2-f(x2))^2+・・・・
●Sが一番小さくなるようにa,b,c,・・・を決める。
それは多元1次方程式をとくことに帰する。最小二乗法という。
●この結果決まった式で表される直・曲線を近似曲線という。(式の当てはめ)。
正確には統計学の本を見てください。
お礼
ありがとうございました。