• ベストアンサー

回帰分析について

どうか教えてください 回帰分析をする際のデータに、 成長率(%)を使っても良いのですか? 例えば GDP成長率(%)=労働力人口成長率(%)+民間投資額成長率(%) などといった感じです。 教科書を見ていると、 単位が%のデータで回帰分析をしている 箇所が見当たらないので疑問に思いました。 どうか教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • solla
  • ベストアンサー率59% (45/76)
回答No.3

比率データであっても、説明変数と目的変数の間に線形性を仮定できる範囲(レンジ)でなら可能です。もちろん誤差の独立性、等分散性といった回帰分析における前提を満たさなければならないのは通常の数値データを扱うときと一緒です。 ただし、ご質問の場合は時系列データですので説明変数に時間を入れておかないと、時間的変化による見かけ上の相関が生じてしまいます。そして重回帰分析において説明変数に時間を入れるということは目的変数が時間について線形、つまり単調に増加するか減少するか、とすることになります。その仮定が成り立つような時間的範囲なら線形回帰でも構わないと思いますが、一般には成長率のようなデータは周期性をもって変動するのではないかと思われますので、その場合には線形回帰は適切ではなく、時系列分析をする必要があります。AR モデル、ARMA モデル、ARIMA モデルといったものを調べてください。計量経済学のテキストなどに載っていると思います。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

その他の回答 (4)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

>GDP成長率(%)=労働力人口成長率(%)+民間投資額成長率(%) 仮説として、GDPの成長率は、GDP成長率(%)=労働力人口(労働人口?)成長率(%)+民間投資額成長率(%)で説明したい、ということなら、可能です。  方法としては、単回帰ではなく、重回帰分析でないと無理。すなわち、エクセルを単純には使えない(未確認:おそらくアドインソフトが必要)。  また、多重共線性のチェックが必要。すなわち、労働力人口成長率(%)と民間投資額成長率との間に、相関が無いことが前提になります。実際には、相関係数が0.4以下なら、OKと訊いたことはあります。 日本については成立しても、他の国にあてはまらい場合もあるので、結果の解釈には注意が必要です。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

noname#21649
noname#21649
回答No.4

>良いのですか? だめです。回帰分析では.基準となる点(通常X軸方向の値)の誤差を認めていませんから。また.基準となる点に対して与えられた点(通常Y軸方向の値)は平均値を持ち正規分布であることが必要です。 誤差が存在するような場合には「相関分析」を使います。 相関分析の場合には.それぞれの点を表すベクトル(二次元として,a(x,y)として).角軸方向の値(xとかyとか)がそれぞれ.正規分布となっていることが必要です。 %指標の場合に正規分布にならないために.相関分析が使えない場合があります。 実際には.これら条件を満たしていると仮定して計算し.残差がこの条件に適応しているかを調べて.適応しているならば使います。適応していなければ.計算自体が無意味ですから.分析が失敗したことになります。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

理論的に式が立つ事を見込めるのなら、十分、回帰分析できますよ。 ただし、質問者さんが例で書かれているのは単回帰ではなく y=ax_1+bx_2+c の式に回帰する重回帰分析だと思いますが。それだけに必要なデータ数も多いと思います。 >教科書を見ていると、 >単位が%のデータで回帰分析をしている >箇所が見当たらないので疑問に思いました。 一般に十分関係が見込める式として身長と体重のような分かりやすい例が無いので教科書に出てこないだけじゃないでしょうか。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

  • sunasearch
  • ベストアンサー率35% (632/1788)
回答No.1

どうやって、%のデータで回帰分析を行うのですか? (x1,y1),(x2,y2),(x3,y3),...というたくさんのデータをもとに行うのが、回帰分析なので、 %にした時点で、たくさんのデータの平均(xの平均やyの平均)として、値が1つに要約されてしまっていますよね?

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

ottotto54
質問者

補足

全てのデータの平均を使うのではなくて、 前々年から前年への増加率の 時系列データを使います。 例えば経済成長率です。 経済成長率は%表示ですが、 毎年発表されますから。