• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:計量経済分析の質問(説明変数の欠損によるサンプル数)

計量経済分析のデータ欠損によるサンプル数の問題と処理方法

このQ&Aのポイント
  • 計量経済分析において、データ欠損によるサンプル数の問題が発生しました。
  • 具体的には、回帰分析の説明変数である「年齢」に欠損があるため、サンプル数が減少してしまい、データの効率的な利用ができない状況です。
  • 欠損している「年齢」については、他の情報が揃っている場合には、不完全ながらもデータを利用することができます。

質問者が選んだベストアンサー

  • ベストアンサー
  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

欠測値に適当な値を代入して完全データにする、という手法があることはありますが、あまりにmissingが多すぎるので個人的には勧めたくはないですね。 missing data regressionなどというキーワードを使うといろいろ出てきます。 参考URLも見てください。Multiple Imputationは最近はSASのような統計ソフトでも実装されている手法で、その意味では多重代入法は実用化されていると考えても良いとは思いますが、欠測がランダムであるか、など事前の検討は欠かせません。 MCAR (Missing Completely At Random), MAR (Missing At Random) などの言葉もキーにして調べると良いと思います。

参考URL:
http://en.wikipedia.org/wiki/Imputation_(statistics)