- ベストアンサー
回帰直線の変数xとyを入替えた場合の傾き
数学の知識に乏しい者です。 回帰直線の傾きについて質問があります。 2変数での回帰直線の傾きにおいて、変数を入替えた場合の傾きは、入替え前の傾きの逆数になるのではないかと思うのですが、Excelで計算したらそのようになりません。 例えば・・・ (1,3)、(2,5.2)、(3,6.6)、(4,10.5)、(5,12)という座標の回帰直線の傾きは、 SLOPE関数を用いると2.33になります。 一方、変数xとyを入替えた場合の回帰直線の傾きは0.419125…となり、2.33の逆数である0.429185…と一致しません。 「傾きが逆数になる」という私の考えが間違っているのか、Excelの誤差なのか、どうなのでしょうか。 よろしくお願いします。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
生物学の知識に乏しい学生です。専門は統計です。 答えから言うと誤差が影響しているのは間違いではないのですが、Excelの誤差というのではなく、回帰式自体の問題です。 ご存知だと思いますが、回帰式は Y=aX+b+e(aは傾き、bは切片、Xは説明変数、Yは目的変数、eは誤差) で求められますが、XとYを入れ替えて傾きが逆数になるのは誤差が無いときだけです。 X=(1/a)Y +(1/b)ですね。 誤差が無いというのは、座標が全て直線状に乗っている場合です。もしそうでないなら、回帰直線は全体の誤差の一番少なくなるように計算されます。 Xを全て正しい値として、Yの予測値を求めた場合の誤差と Yを全て正しい値として、Xの予測値を求めた場合の誤差では前提が違います。 まぁ、近い値は出ますが、それは回帰式というもの自体の特性によるものでExcelによるものではないと思います。
その他の回答 (4)
- stojkovic
- ベストアンサー率39% (9/23)
10数年前の数学の得意者です。 どの程度の精度での回答を要するのか分かりませんが、 1次回帰(Y=aX+b)ですと、 大まかに==逆数と考えて、的は外してません。 厳密に==多少の数値の違いが生じます。 Excelの誤差なのかというと、誤差とも言えますし、定義の違いによる差とも、言えます(曖昧な感じがするでしょうが、文字だけではこの程度で、ご勘弁を)。 #3さんの回帰式自体の問題とうのが妥当でしょう。 また、定義は#1さんの書かれているとおりで、途中式から偏微分した結果から、aとb(Y=aX+b)が算出されます。 ご参考になれば。 (最近は、回帰分析使うことありませんので、一般人です。)
既にある内容とほぼ同趣旨です。一応.私は生物系学卒で卒論で分散分析を1ヶ月かけてそろばんで行って卒業した人間(昔は教授よりも詳しかった)ですが.最近の話題には疎いので一般人としています。 「回帰線」を求める前提条件を考えましょう。 1.2.3.4.5 という点(水準)に対応する 3,5.2,6.6,10.5,12 という点が存在することになります。回帰線では.水準の誤差は0であることが必要です。しかし.対応する点については正規分布を示す誤差の存在が認められています。 ということで.逆関数が存在しません。
- wolv
- ベストアンサー率37% (376/1001)
追加: 質問文の考え方にあわせて記述するなら、 No1の回答の例は、 どちらも傾き0であり、確かに逆数にはなっていません。
- wolv
- ベストアンサー率37% (376/1001)
逆数になる、というほうが間違っています。 n個のデータセット (x1,y1),(x2,y2),…,(xn,yn) があって、回帰直線 Y = a X + b を求めた場合、もちろん、 Yi = a xi + b の値とyiの値は違うものになります。 ある関数、確か、 Σ(Yi-yi)^2 (^2は2乗の意味です。) を考え、この値が最小になるように、 回帰直線のa,bを決めるわけです。 x,yを入れ替えた場合は、結局、元の変数の Σ(Xi-xi)^2 を最小にするようにパラメーターを決めるわけですが、 これは違う操作になります。 わかりやすい例を考えてみましょう。 (0,0)(0,2)(2,0)(2,2)というデータを考えると、 回帰直線は (0,1),(1,1)を通る直線、つまり y=1 となります。一方、 xとyを入れ替え、回帰直線を計算し、またもとに戻すと、 x=1 がその回帰直線になります。