- 締切済み
2つのデータセットの関連性を知る指標
あるデータセットの将来の値を予想したいと思っています(時系列のデータ)。予想するための値は、データセットを構成しているであろう他の指標から作成します。 例えば、将来のGDPを予想するために、消費関連の指標や、企業の設備投資データなどを用いて、「次期はGDP成長率が○○%」といった具体的な予測数値を算出します。 そこで、どのデータセット(モデルから作成したデータ列)が最も説明力が高いと呼べるのか、その判断指標について質問させていただきます。 単に相関係数を見ても、両者の水準間の違いが反映できません。例えば、添付の画像をご覧ください。 系列1は予想値、系列2のデータを実測値とします。 左側は相関が1で回帰線45度、ばっちり予測できていそうな気がしますが、水準が違うので、具体的な数値予測としてはいまいちです。特に私のケースでは水準の違いが説明できません。 右側は無相関ですが、平均は同じなので、水準は合っている。ただしデータ予測としてはあまり意味がない。 上記のようなケースを包括して、一つの指標で判断することは出来ますか? 水準が違うと、その説明をすることが出来ないため、モデルの説明力がない可能性があります。 両者の差の2乗和を取るといった方法も考えましたが、何か他に指標があればご教授いただければ幸いです。よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
図を見ることができないのですが、 経済を目的にならば、株、為替、などは、経済分野の人が予測しているが、まあ当たらない。というより、短期の推定は困難だが、長期の推定は可能。 >左側は相関が1で回帰線45度、ばっちり予測できていそうな気がしますが、水準が違うので、具体的な数値予測としてはいまいちです 相関なら、相関係数と考えましたが、45度と書いてあるので、回帰係数のことでしょうか。それなら、1であることは、推定値が実測値と一致することとは、全く関係ありません。 相関係数が1なら、推定値は(私は占い師でも預言者でもないので、予想はあまりつかいません)狂わないハズ。 >右側は無相関ですが、平均は同じなので、水準は合っている。。 「水準」というのが、意味不明。文章からは、見当違いのことを言っているように感じる。 統計学で「水準」で浮かぶのは有意差の水準。後学のために、「水準」の意味を教えて下さい > 私のケース これは何か、理解できません。経済予測、というのなら、自称専門家が山ほどいて、株価の予想に泥まみれ。世間も振り回されています。 真面目の方のようなので回答しましたが、気になることを3つ。 科学、特に理系では、用語は厳密に使用します。間違った用語では、混乱し、真意が伝わりません。 相関分析と回帰分析は、分けて考えた方が分かりやすい。パソコンでは同時に出せますが。 相関については、専門家でも、その解釈を間違っている場合を多々見かけます。ご質問は、回帰分析のような気がするので、いらぬお世話かもしれませんが、相関をキチンと理解しておかないと、擬相関だったりして、騙されます。