• ベストアンサー

ダミー変数について

重回帰モデルのダミー変数について類似の質問も読んでみたんですが、初心者なので分かり易く教えて頂けたら嬉しいです。 よく男性と女性で0と1を使ったりしますが、 例えば文学部4年までを、1年・2年・3年・4年生の4つで調べたい場合に教科書を読むと、「2つ以上のカテゴリーが存在する場合にもダミー変数を用いることができる。これは想像を絶するよりもずっと扱いが難しく、必要な場合には専門書を参照するべきである。」と書かれてました。(なので1年と4年の2つで調べようかと思うんですが。) 何がどう難しくなるのか、統計は苦手なので、できるだけ分かり易く教えて頂けたら嬉しいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

たぶん、そのように書かれていたのは「昔の教科書」だからではないでしょうかね。すくなくとも今ではコンピュータが普及しているので簡単にできます(というか、当たり前のように使われています)。それで、何が難しいのかというと、要するに計算が面倒ということですね(^_^;) 統計解析システム(例えばRとか)ではダミー変数を作成しなくても、1学年=1、2学年=2、3学年=3、4学年=4といったように整数値で表現した場合であっても、それがカテゴリカル型の変数であることを指定してあげれば、通常の重回帰分析のように分析できます。 # これは学年を表すデータベクトル > gakunen <- c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4) > gakunen <- as.factor(gakunen) # カテゴリカル型の変数として指定 # 身長データ > shincyo <- c(160, 167, 159, 171, 173, 168, 180, 173, 169, 181, 179, 170) > result <- lm(shincyo ~ gakunen) # 身長を学年で説明するモデル > summary(result) # 結果の表示 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 162.000 2.749 58.936 7.63e-12 *** gakunen2 8.667 3.887 2.229 0.05634 . gakunen3 12.000 3.887 3.087 0.01496 * gakunen4 14.667 3.887 3.773 0.00544 **

koinukura
質問者

お礼

さっそくのお返事ありがとうございます。 大変参考になりました。 この度は本当に助かりました。ありがとうございます

関連するQ&A