- 締切済み
判別分析における説明変量と的中率の関係
判別分析における説明変量と的中率の関係について質問です。 いま、線形判別関数で判別分析を行っています。 ウイルクスのΛ統計量による検定を行い、判別に寄与してない説明変量を除き、判別分析を行った場合の判別的中率は、寄与していない説明変量を含んだ場合の判別的中率を上回ることはあるのでしょうか? よろしくお願いします。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- backs
- ベストアンサー率50% (410/818)
> 結論、的中率の上下は有り得るんですね。 そういうことになります。ちょっと余計なことをペラペラとしゃべりすぎました、、、
- backs
- ベストアンサー率50% (410/818)
> でも上がる場合と下がる場合があるんですよ。。 最初に作った判別式(的中率=80%) Y = a * X1 + b * X2 + c * X3 説明変量X3が不要だったので除いた判別式(的中率=90%) Y' = a' * X1' + b' * X2' といった場合もあれば,逆に 最初に作った判別式(的中率=80%) Y = a * X1 + b * X2 + c * X3 説明変量X3が不要だったので除いた判別式(的中率=60%) Y' = a' * X1' + b' * X2' ということもあります。単純に的中率が高いということは良い判別関数が得られたということですが,前者の場合は取り除いた説明変数が本当に必要なかったということですね。一方で後者の場合は取り除いた説明変数が本当は判別するために必要な変数だった可能性があるということでもあります。 重回帰分析でも判別分析でも変数の選択には試行錯誤が必要ですし,判別分析においては判別的中率のみで判断するのは好ましいことではないということでもあります。ウィルクスのΛの値がどの程度かによって,その変数を削除するかどうかというのは難しい問題ですからね。
- backs
- ベストアンサー率50% (410/818)
私の考えているものと異なるとまずいので,念のため聞いておきたいのですが,TD-Zさんのいうところの「判別的中率」というのは,判別か正しいかどうかの数(判別の一致数)をサンプルサイズ(データ数)で割って100倍したもののことでよいのでしょうか? (判別的中率) = (判別の一致数) / (サンプルサイズ) * 100
お礼
backsさん、たびたびありがとうございます。 はい、そうです。正しく判別された数をサンプル数で割ったものです。
- backs
- ベストアンサー率50% (410/818)
寄与していないと考えられる変数を除いたのですよね?それならば,判別的中率が上がっても可笑しくないでしょう。むしろ,余計な変数を削除して判別的中率が下がったら意味がないですよね。 それとも私が的外れな回答をしているのでしょうか、、、
お礼
backsさん、返答ありがとうございます。 言われてみればそうですよねぇ。 でも上がる場合と下がる場合があるんですよ。。
お礼
backsさん毎度ありがとうございます。 難しいところですね。。結論、的中率の上下は有り得るんですね。