• 締切済み

重回帰分析で偏回帰係数を全て正の値にする方法はありますか?

はじめまして。 現在、複数のエリアのエネルギー消費量と、そのエリアに内包される施設の面積との関係を調査しています。 例として ・エリアA:消費量100MJ 商業施設 a m2、病院 b m2、飲食店舗 c m2、事務所 d m2 ・エリアB:消費量360MJ 商業施設 e m2、病院 f m2、飲食店舗 g m2、事務所 h m2 ・エリアC:消費量600MJ 商業施設 i m2、病院 j m2、飲食店舗 k m2 ・エリアD:消費量492MJ 商業施設 l m2、病院 m m2、飲食店舗 n m2、事務所 o m2 のようなものになります。 そのうえで、施設の用途別に単位面積あたりのエネルギー消費量を重回帰分析によって予測する事を考えたのですが、偏回帰係数が負の値を取ってしまうものが多く出てしまい、困っています。 それぞれの独立変数の係数を全て正の値にする方法はないでしょうか? 使用しているソフトは EXCEL SPSS11.5J for windows です。 稚拙な内容で申し訳ありませんが、よろしくお願いします。

みんなの回答

回答No.4

 念のため、多重共線性のチェックはしましたか? 共線性(VIF)の値が10を超えてはいないでしょうね。 時間がかかりますが、総当たり法でも変数選択は可能です。 ただし、スクリプトの実行が必要ですが。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

No2です。  重回帰分析の落とし穴は、No1の方が書いておられる様に、多重共線性の問題のようです。統計学のテキストなどには、この問題に触れていますが、悲しいことに解決法については、述べていません。述べていても、Xの項目として、適当なものを選べ、くらいです。しかし、どうすれば適当なものを選べるのか、については読んだことはありません。そこで行き詰ってしまいました。「適当」という言葉で分かった気分にはなれるのですが、実際には何にも出来ません。  私の場合は、重回帰分析は止めて、全て単回帰分析にし、その中で回帰係数の最も高いものを選んでいます。このばあい、バイアスが問題になりますが。  重回帰分析も、バイアスの問題です。バイアスのかかっているものを除去するしかありません。その除去には、実際の経験しかないと考えています。私の場合、医師が正なのに、看護師が負になるのはおかしいという判断は、経験から来ているからです。  ですから、単回帰分析をして、その最も強いものを残して、あとは変数を増やしたり減らしたりするのが現実な解決法では。  一人当たりエネルギー消費に関しては、世界の各国をみると、その国のGNPと強い相関があります。ちなみに、日本人は、アフリカの住民の1000倍程度消費しています。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>偏回帰係数が負の値を取ってしまうものが多く出てしまい、困っています。  ありません。回帰係数が負であれば、負の相関があるわけですから、正にすると事実を捻じ曲げることになります。  データーを全て統計ソフトにブチ込んで、パソコンで計算させると、正になるハズのものが負になってでてきます。  私の場合は、平均寿命の重回帰分析で、人口1000人当たりの医師の数は正の回帰係数に、看護師の数は負の回帰係数になった経験があります。看護師の数は減らした方が良い、という結論はありえないので、行き詰まりした。  同様の結果であれば、続きを書きますので、

kahase
質問者

補足

ご回答ありがとうございます。 私のほうでも、同じように 飲食店舗の係数が負になり、飲食店舗を増やせば増やしただけ そのエリアは発電してしまうというように結果づけられてしまい、 それはおかしいだろ、と思い、係数を正にする方法がないだろうかと考え、質問させていただきました。 是非続きをお聞かせ願えるでしょうか?よろしくお願いします。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

重回帰分析において,「これをすれば偏回帰係数の値をすべてプラスにできる」という方法はないと思います(私が知らないだけでホントはあるのかもしれませんが)。 まず,基本的なこととして消費量や施設の面積などといった単位の違うものは基準化(標準化)してから分析する必要があります。後は説明変数の選択を誤るとよろしくない結果が出る場合もあります(いわゆる多重共線性の問題)。 回帰分析は変数の選択が重要で,これを怠ると間違いなく無意味な数値が出てきます。

kahase
質問者

お礼

ご回答ありがとうございます。 説明変数は多くしすぎない事がコツだ、というような事が多変量解析のテキストにも書いてあったのですが、 全体の消費量を構成するものとして、いくらかの用途を省いてしまうのはちょっと目的にそぐわなくて困っていました。 やはり多すぎるとダメなんですね。。。

関連するQ&A