重回帰分析と分散分析の結果が違う
次のようなRのコードを書きました。
x1~x7は因子で、1がなし2がありだと思ってください。
最後のxがデータです。これが大きい程よいと言う意味だと思ってください。
data <- data.frame(
x1 = c("1","1","1","1","2","2","2","2"),
x2 = c("1","1","2","2","1","1","2","2"),
x3 = c("1","1","2","2","2","2","1","1"),
x4 = c("1","2","1","2","1","2","1","2"),
x5 = c("1","2","1","2","2","1","2","1"),
x6 = c("1","2","2","1","1","2","2","1"),
x7 = c("1","2","2","1","2","1","1","2"),
x = c(35,48,21,38,50,43,31,22)
)
data
colnames(data) <-c("B","C","B:C","D","B:D","A","7","x")
data
summary(aov(x ~ A+B+C+D+B:C+B:D,data=data))
summary(lm(x ~ A+B+C+D+B:C+B:D,data=data))
結果としましては、
分散分析では因子C以外は有意差がないという結論を出しており、
重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。
重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。
なぜこのようなことになったのか心当たりがある方ご教授ください。
よろしくお願いします。
補足
回答頂き有難うございます。今回、学習意欲を研修への参加率から判断したいと思っています。私が腑に落ちない所を補足させていただくと、100人いる部署で参加率50%にするには50人の参加が必要ですが、2人しかいない部署では1人参加すると50%です。私が悩むのは1人の重みが違うという所です。極端に言うと100人の部署がいる看護師さんから「あちらは2人しかいないのに同じ50%の参加率で比較されてもおかしいでしょう。」と言われそうで・・。大元の数が違うのに参加人数だけで判断して部署別の学習意欲を判断することがおかしくないかとかいう所で悩んでいるので質問させていただきました。このことを踏まえても算出通りでいいのでしょうか?