- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ロジスティック回帰モデルでの多変量の外れ値の検討法)
ロジスティック回帰モデルでの多変量の外れ値の検討法
このQ&Aのポイント
- ロジスティック回帰モデルを使って多変量データをモデル化する際、外れ値の検討方法についての質問です。
- SPSSやエクセル統計分析のソフトを使用してモデル化を行った結果、変数の有意性は確認できましたが、モデルの適合度が低いため、外れ値の影響を疑っています。
- 重回帰分析では標準化残差を用いて外れ値を判定することが一般的ですが、ロジスティック回帰分析でも同じ方法が使えるのか質問しています。また、詳しい情報があれば教えて欲しいとも述べています。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
> モデルが適合していないことがわかり、元の生データに外れ値が含まれていると考えております。 異常値の除去は荒業で、余程の理由が示せなければ、自分にとって都合の悪い事実をなかったことにしているのと同じです。目的は論文の刊行であって現象の解明ではない、と思われてもしかたがないです。 だから正常値と異常値を外的な基準で区別できないなら、頑健推定を考えるべきです。つまり、データを疑う前にモデルを疑うのが常道です。 それでも除去を考慮したければ、たとえば ↓ が参考になるかと。 http://stats.stackexchange.com/questions/175/how-should-outliers-be-dealt-with-in-linear-regression-analysis
お礼
どうもありがとうございます。