- ベストアンサー
偏相関から偏回帰係数を導出する方法と参考文献
- 本記事では、偏相関から偏回帰係数を導出する方法について解説します。
- Yを応答とし、X1,X2,...,Xpを説明変数とした場合の偏回帰係数の求め方を詳しく説明します。
- さらに、偏回帰係数についての議論が載っている参考文献も紹介します。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
平均や分散で議論なさってますが、その元になる個々のサンプルを考えれば話が明快になりますんで、XjとYのk番目のサンプルをそれぞれX[k,j], Y[k] (k=1,2,…,N)としましょう。 さて、 > 応答と説明変数が下記の構造で表せる という曖昧な文言が一体どういう意味なのか、がポイントです。 もしそれが、「bは最小二乗法の意味での解である」つまり「残差e[k]の二乗和Eが最小になるようなb」ということであるなら f(b)[k] = Σ{j=1~p}(X[k,j]b_j) とおくと e[k] = Y[k] - f(b)[k] E = Σ{k=1~N}(e[k])^2 であり、Eを最小にするb_j (j=1~p)は、連立方程式 ∂E/∂b[i] = 0 (i=1~p) を解けば得られます。これは(実際に微分してみれば分かる通り) Σ{j=1~p} ((Σ{k=1~N}(X[k,i]X[k,j])) b_j ) = Σ{k=1~N}(X[i,k]Y[k]) (i=1~p) という連立方程式です。行列で書くなら A b = c ここに Aはp×pの正方対称行列、bとcはp次元の縦ベクトルで、 A[i,j] = Σ{k=1~N}(X[k,i]X[k,j]) b[i] = b_i c[i] = Σ{k=1~N}(X[k,i]Y[k]) であり、これを「線形最小二乗法の正規方程式」と言います。その解はもちろん b = (A^(-1)) c です。 以上の準備をした上で、さらに相関rijおよびqiをサンプルから計算する方法を具体的な式として書いてみれば、Σ{k=1~N}(X[k,i]X[k,j]) とrij、Σ{k=1~N}(X[i,k]Y[k])とqiが対応しているということが直ちにお分かりになるでしょう。たとえば Σ{k=1~N}((X[k,i]-mi)(X[k,j])-mj)) = A[i,j] - (N mi mj) ですから、rijからA[i,j]が計算できる訳です。
お礼
御礼が遅くなり申し訳ありません。ご丁寧にありがとうございました。 ご教示いただきましたことをもとに勉強を進めたいと思います。 ありがとうございました。