- ベストアンサー
統計 やはり以前の質問に疑問が・・・
以前、重回帰分析についての従属変数と目的変数との関係について、疑問に思い、以下のような質問をしました。↓ 【重回帰分析の目的変数が、(A+B+C+D)というものとします。 A~Dは、数量データです。 説明変数にAやBなどが入っていたら、それはダメですか? 説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?】 答えとしては、【してもよい】と受け止めました。 しかし、独立変数が従属変数の一部だと関係が強すぎてこれはやってはダメと考えるべきだという人もいます。(一応統計のできる人が言ってました) そういわれたら、そう思います。YにA、B、C、Dなどは関連しているので、重回帰分析の独立変数にA、B、C、Dは使用してはダメだということです。 ・・・結局、何が正しいのかよくわかりません。もしよかったら、考えなど教えてください。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> しかし、独立変数が従属変数の一部だと関係が強すぎて > これはやってはダメと考えるべきだという人もいます。 独立変数が従属変数の一部⇒独立変数と従属変数の関係が強い、とは必ずしもなりませんし、そもそも従属変数と独立変数の関係が強すぎると回帰分析をやってはいけないなど、そんなことはありません。 例えば、関係性のわからない変数XとZがあったとします。回帰分析の結果R2=0.9であることがわかりました。「これは関係が強すぎるから回帰分析をやってはいけない」と言って回帰分析の結果をなかったことにしますか?仮にそうしたとしたら、今度は「回帰分析をやってはいけない」と判断した根拠がなくなります。それではまたXとZの関係性を調べるために回帰分析を…。 大いなる自己矛盾に陥ることになりますね(笑)。 従属変数が独立変数を含む複数の変数の和として構成されることがわかっている場合を考えます。 Y=A+B+C+D であるとき、YをA,Bで回帰したとします。 Y=αA+βB+γ+ε (α,β,γは回帰パラメータ、εは誤差) ですから、 A+B+C+D=αA+βB+γ+ε C+D=(α-1)A+(β-1)B+γ+ε となります。つまりY'=C+DとしてY'をAとBで回帰したときの回帰パラメータをα'、β'、γ'とすれば、 α'=α-1 β'=β-1 γ'=γ という関係が成り立ちます。Y'はAもBも含みませんので問題ないはずですが、YをA,Bで回帰するのはこれと同等なのです。即ちYが独立変数(今の例ではAとB)の一部を含んでいても、残りの部分(今の例ではCとD)との関係が不明なのですから、回帰分析を行うことは問題ありません。初めからY'を従属変数にすべきという考えもあるかもしれませんが、それはどちらでもいいことです。要は変数としてYとY'のどちらが実際上の意味を持つか、ということで決まると思います。 蛇足ですが、従属変数を線形和として構成する全ての変数を独立変数にした場合(今の例ではA,B,C,D全てを独立変数にした場合)はR2=1となって、これはもちろん回帰をする意味がありません。上述した「残りの部分」がなくなることに因ります。
その他の回答 (1)
- backs
- ベストアンサー率50% (410/818)
> 独立変数が従属変数の一部だと関係が強すぎてこれはやってはダメと考えるべきだという人もいます。 こういう考え方も正しいです。 > ・・・結局、何が正しいのかよくわかりません。 一言でいってしまえば「得られたデータによる」ということで,その場の状況ごとに最も適切なモデルを考えなければいけないのです。統計学は数学の一分野ですが,a⇒bといったようにやり方が一定に定まっているわけではないのです。 最も適した方法を考えるのは分析者自身であって,それを導き出せるかどうかは分析者の技量(経験)に委ねられるのです。
お礼
いつもありがとうございます。なんだか難しくなってきました。 自分の考えを整理します。 独立変数に関して、例えばt検定などして有意性が確認された項目は独立変数の候補として採用するべきだと考える。 有意性がないものは独立変数にしないほうがいい。といったところかなあ? 例えば、Y=(A+B+C+D)の場合、Eという2群に分かれた独立変数がありもしA~D全てにt検定で有意差がなかったら個別にA~Dは投入すべきでない。しかし、逆にA~D全てに有意性がみとめられた場合などは個別に独立変数に採用してもよい。といった考えであっているのでしょうか? というか、論文などのコンセプチャルフレームワークの段階で予想しながら従属変数と独立変数を決めて、コンファウンディングしそうな因子も独立変数として設定する。といったところかなあ?
お礼
回答ありがとうございます。参考になりました。僕は勉強不足なので一度文献で調べて確認してみます。