- ベストアンサー
回帰の説明変数について
- 回帰式で用いる説明変数の一部を変更して期待値を算出することについて疑問があります。
- 時系列回帰において、推定期間を用いて回帰式を作成し、期待値を算出しています。
- 説明変数を加工して期待値を算出することに問題はないのでしょうか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
回帰式は、値を予想するためのものであって、根拠は不要だと考えています。すなわち、当たったもの勝ち。とくに、時系列で、横軸が時間の場合は、その根拠、すなわち、その時点で何が生じ、それが原因か、どの程度影響しているかの説明は困難でしょう。困難でないのなら、「株で失敗」なんぞはありえません。 >回帰式で用いた説明変数を加工して、期待値を算出することには問題はないのでしょうか? どのような式を想定しようが、その人の勝手でしょう。一次式は説明できる場合もありますが、y=a+bx1+cx2の式で、cはxの2乗すなわちx2については2次だと想いますが、「何故2次なのか」と訊かれても応えられないでしょう。しかも、その係数がcになる根拠なんぞはまず、説明できません。すなわち、結果オーライなのです。 「この式の方がよく的中する」と言われれば、説明を求めても無駄ですし(普通経験であって、合理的な根拠は無い)、誰も反論できません。ですから、問題は無いではなく、問題にできません。 y=a+bx1+cx2とy=a+bx1+c(x2+x3)については、注をつけることができます。ただし、説明変数がx一つで、x2はx^2、x3はx^3というxk高次式での回帰の場合です。 一般的には、xの次数を多くすればするほど、的中率は上がります(決定係数が大きくなる、これが1.00だと100%的中)。ですからこのような変形はあり得ます。ただ2次と3次の係数を同じにする制限が無いのなら(あるとは想えませんが)、y=a+bx1+cx2+dx3の方が的中率は高くなります。 y=a+bx1+cx2がxの高次式ではなく、説明変数がx1とx2の2つあるということなら、重回帰分析になるので、解釈は変わってきます。この場合、どのようにするかは、マニュアル的なものがあります。すなわち、危険率が小さくなるような説明変数を採用して、回帰式に入れます。 繰り返しになりますが、回帰式は予測値が的中すれば勝ち、「当たるが勝ち」です。加工した方が予想値が当たるのなら、なんら問題ありません。「なぜ」という疑問に答える必要はありません。
その他の回答 (1)
- kgu-2
- ベストアンサー率49% (787/1592)
>「こちらの方がより適合度が高いから」という回答で質問者を納得させることは難しいでしょうが 「難しいでしょうが」は、タイプミスでは。というのは、回帰式については、この返答は、最も正当なものです。こちらの方が適合度が高い、すなわちフィットする、と主張すれば、実際にデータを入力して試して誤りを発見しない限り、誰も反論できません。 話を原則にもどすと、一次回帰、指数回帰、べき乗回帰・・・、のどれを選択するかは研究者の勝手です。そのとき、なぜ指数回帰の方がフィットしやすいのか、なんぞは、「相関係数が高い」くらいの返事しかできず、これは、同じことについて表現を変えただけです。回帰式の場合は、説明不要です。 相関と回帰は、一緒にでてくるので同一視されていますが、別物と考えています。回帰式は、当たったもの勝ち(株の予想)で説明不要。 一方、相関は因果関係の証明に用います。この場合は、説明が必要で、時間性、密接性、普遍性、特異性、そして最も厄介な合理性を全て説明できなければなりません。さもないと、とんでもない結論になります。 例えば、世界の各国の新聞の売り上げと一人当たりの食糧の消費量の関係を想定してみます。新聞の売り上げと食料には、因果関係はありません。しかし、相関係数は高いのです。これを擬相関、すなわち見かけ上の相関と言います。 一方、私が総合商社の社員。その国で食糧を売りたい。一人当たりの消費量が分からない場合(実際にはありませんが、あくまでも事例)、新聞の売り上げとの回帰式から、どれくらい食糧を消費するか予想でき、商売の成功に役立つかもしれません。すなわち、説明不要。予想が当たれば勝ち、ではないでしょうか。
お礼
再度、ご回答いただき誠にありがとうございます。 私自身、相関と回帰の役割の違いをしっかりと理解できていなかったようです。 各国の新聞の売り上げと一人当たりの食糧の消費量の例はたいへんわかりやすく、理解の一助となりました。
お礼
ご回答ありがとうございます。 >回帰式は予測値が的中すれば勝ち、「当たるが勝ち」です。 この考え方を初めて聞きました。 こうなると回帰に関しては何でもありなのですね。 学会などで質問されたときに「こちらの方がより適合度が高いから」 という回答で質問者を納得させることは難しいでしょうが、 統計学(計量経済)としては問題ないとディフェンスできるようで安心しました。 今後ともよろしくお願いいたします。