• 締切済み

判別分析やってます。 説明変数の数って目的変数の数より少なくしますよね

判別分析やってます。 説明変数の数って目的変数の数より少なくしますよね? 例えば目的変数が100こだったら、説明変数は何個まで判別モデルに使用できるのでしょうか?

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 説明変数の数って目的変数の数より少なくしますよね? 目的変数と説明変数を逆に解釈しているかもしれません。判別分析というのは、目的変数(従属変数、応答変数)がグループを表す変数(1つだけ)で、それを説明する変数(説明変数、独立変数を1つないしは複数個)を定めるというものです。モデル式でかけば   目的変数 = 説明変数1 + 説明変数2 + ... ということです。 > 例えば目的変数が100こだったら、説明変数は何個まで判別モデルに使用できるのでしょうか? こういう問いに対して一義的な回答はありません。研究主体やサンプルサイズによって適当な説明変数の数というものが決まってくるものであって、「いくつまでなら可」といったように決められるものではないからです。 ただ説明変数が100個というのは現実的にありえないですね(^_^;) 10個でも解釈的に無茶かもしれません。

microso
質問者

補足

ありゃ~、質問文まちがってましたm(_ _)mモウシワケナイ 目的変数1種類(2値) 標本数100こ のような場合の説明変数の数の上限が知りたかったのです。 重回帰分析等の場合は適当な変数選択法を用いて標本数5つ以上に説明変数1つの割合を上限にしないと、経験的に過剰適合に陥る確率が高くなります。 線形判別分析も同じようなことになるんでないかとは思うのですが、例えば目的変数が2値の場合、少ない方を基準にするとかのルールがありそうなものだなっと思って質問させていただきました。 なにとぞよろしくです。

関連するQ&A