- ベストアンサー
対象の値を推測するときのパラメータの選別方法
数学初心者です。 現在Rを使って数学を勉強しています。 複数のパラメータ(推測対象データと無関係なデータも含む)から対象データを推定したいとき、 どんなパラメータを使えばよいか悩んだとします。 こういうとき、どんな方法を使用してパラメータを選別すればよいのでしょうか?
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
数学と言うより、統計学のほうが良いと思うのですが、(R言語もお使いのようですし) 推定には、推定したい項目(目的変数)の数値に関連するのは、測定された項目(説明変数)のどれなのか、 説明変数1つと目的変数の相関係数が高い場合には、 とりあえず目的変数と各説明変数の相関係数を全部算出してみて、横軸に説明変数、縦軸に目的変数、でプロットしたときに、どこかの1データが離れたところにあるせいで相関係数が高いだけのものはそれは除去し、近似した直線にまんべんなくデータがプロットされている項目こそが、近似できる範囲が広い「本命」と言えます。 説明変数1つだけでは目的変数を推定できなくても、近似直線との差を埋めることができる、「第2の説明変数」「第3の説明変数」・・・を見つけるのが「多変量解析」で、 分散分析によって説明変数として有力なもの(F値が高いもの)を順に、近似多項式に盛り込むことで、重回帰分析による近似式を得ることができます。 主成分分析も同様に、重回帰式を得るためにどの説明変数を用いるか、説明変数n個のn次元空間でどのような直線にそって分布しているデータが多いか、という観点で活用できます。
お礼
大変参考になりました。 よく読み返して勉強させていただきます。