重回帰分析と分散分析の結果が違う
次のようなRのコードを書きました。
x1~x7は因子で、1がなし2がありだと思ってください。
最後のxがデータです。これが大きい程よいと言う意味だと思ってください。
data <- data.frame(
x1 = c("1","1","1","1","2","2","2","2"),
x2 = c("1","1","2","2","1","1","2","2"),
x3 = c("1","1","2","2","2","2","1","1"),
x4 = c("1","2","1","2","1","2","1","2"),
x5 = c("1","2","1","2","2","1","2","1"),
x6 = c("1","2","2","1","1","2","2","1"),
x7 = c("1","2","2","1","2","1","1","2"),
x = c(35,48,21,38,50,43,31,22)
)
data
colnames(data) <-c("B","C","B:C","D","B:D","A","7","x")
data
summary(aov(x ~ A+B+C+D+B:C+B:D,data=data))
summary(lm(x ~ A+B+C+D+B:C+B:D,data=data))
結果としましては、
分散分析では因子C以外は有意差がないという結論を出しており、
重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。
重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。
なぜこのようなことになったのか心当たりがある方ご教授ください。
よろしくお願いします。
お礼
回答ありがあとうございます。毎度助かります。 サンプルサイズに関してはA、B、C群に分けた場合は一つの群に200を確保することは困難です。ある群は50あるかどうか・・・(全数で500程度) 因子分析は、全数でしても問題ないかなという考えの疑問は消えました。ありがとうございます。 SD法のプロフィール曲線そのものが、20項目すべての形容詞の平均点を結んだ線なので、1つの群の特徴がこれであらわせるからですね。そして、全数の因子分析でカテゴリー化した因子のなかで、その群の特徴もみることができるから、やはりOKだと思いました。 あと、アドバイスどおり一応、3群にわけて因子分析もやってみます。 (この場合はサンプルサイズが足りないので、どのような結果になるかわかりませんが、ものの数分で入力・結果を解釈することが可能ですから。) どうもありがとうございました。backs様のおかげでだいぶ助かりました。