- 締切済み
重回帰分析の説明変数の対数化について
重回帰分析を行っています。説明変数の対数化の必要性ついて教えてください。先生によると、説明変数を対数化し、正規分布に近づけることで、残差を正規に近づける効果があると聞いたのですが。。。ここで質問なのですが、たとえば臨床検査値をそのまま説明変数としてステップワイズにかけても選択されないのに、対数化すると有意な因子として選択されるとします。この対数化された検査値の解釈の仕方なのですが、臨床現場での生かすとしたら、「対数化された臨床検査値が目的変数に影響を与える」という意味になるのでしょうか。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- ur2c
- ベストアンサー率63% (264/416)
> 説明変数を対数化し、正規分布に近づけることで、残差を正規に近づける効果があると聞いたのですが 普通の重回帰分析なら、説明変数を対数化するなら目的変数も対数化しなければならないはずです。ですから、上の説明はへんなように私には聞こえます。 > この対数化された検査値の解釈の仕方なのですが、臨床現場での生かすとしたら、「対数化された臨床検査値が目的変数に影響を与える」という意味になるのでしょうか。 データをそのまま使うか対数をとるかは、検査値が目的変数に対して加法的に効くと考えるか乗法的に効くと考えるかで決めます。ですから「臨床検査値が乗法的に目的変数に影響を与える」と解釈します。 たとえば目的変数が発症後の生存期間で検査値が喫煙量と飲酒量だとします。喫煙が生存を平均1年短縮する効果があり、飲酒が生存を平均半年短縮する効果があるとします。喫煙と飲酒の両方をする人の生存は平均 1.5 年短縮するのか、それとも両方の効果が相乗的に重なって非線形に平均 2 年くらいも短縮してしまうのか、ということです。
- kgu-2
- ベストアンサー率49% (787/1592)
先生に訊いた方が確実。 最近の学生は、「こうしろ」と教えると、そのまんま。『何故』と訊きにくる学生を待っています。たぶん。 それに、文字よりも、図での説明の方が分かりやすい。ここでは、図で示すことが困難。 重回帰分析は、単回帰分析の延長です。単回帰分析では、直線回帰より対数に変換した対数回帰の方が決定係数が大きい、すなわち当てはまりやすい場合がある。その場合は、説明変数を対数にすると、当てはまりやすい、すなわち、妥当な式になる、なんぞの説明で分りますか。 なぜ対数回帰になるのか、直線ではないのか、については散々考えましたが、分りません。今のところそういうものだとしか。 指数回帰や高次式の回帰なんぞになると、式の説明は、私には困難を通り越して、頭の中が混乱します。
お礼
お返事があおsくなてたいへんもうしわけりません。丁寧なご指導、ありがとうございました^^
補足
お礼が遅くなって申し訳ありません。大変わかりやすくご指導いただきまして、ありがとうございました^^