- 締切済み
ダミー変数の意味
ダミー変数についてお伺いいたします。 以下のようにダミー変数を入れた場合、x(k),x(k+1)の回帰係数が0 という仮説は、それぞれどのような意味があるのでしょうか? <高校の入学試験の点数について> x(k) x(k+1) 一般入試 1 1 推薦入学 1 0 内部進学 0 0 宜しくお願いいたします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- goma_2000
- ベストアンサー率48% (62/129)
x(k)、x(k+1)の回帰係数が0だった場合に、通常の回帰ではその変数が有意ではないと解釈するが、ダミー変数化しているという事は、変数が効いていないとは解釈できないのので、ではどう解釈するのか?ということでよろしいでしょうか。 このデータでは、x(k)の回帰係数が0ということは、推薦入学と内部進学の差がない(一般入試とは違う)ということで、x(k+1)の回帰係数が0という事は一般入試と推薦入学の差がない(内部進学とは違う)ということになります。 なので、変数としては有意だが、その自由度(?)というのは3つではなく2つになるということでしょう。
- backs
- ベストアンサー率50% (410/818)
Aさんは一般入試で受験し、試験成績は80とする。 Bさんは推薦入試で受験し、試験成績は60とする。 Cさんは内部進学で受験し、試験成績は70とする。 試験成績を目的変数Y、受験方法を説明変数としてダミー変数を用いて回帰分析をする場合を考える。 [受験者][一般入試][推薦入試][内部進学][試験成績] [Aさん][1][0][0][80] [Bさん][0][1][0][60] [Cさん][0][0][1][70] ダミー変数を導入する場合、分析には任意の列データを削除して行いますが、おそらく質問者さんのいう > 回帰係数が0という仮説 というのは、削除した任意の列データの変数の回帰係数を0とするということでしょう。例えば、一般入試の列データを削除した場合は一般入試で受験した生徒の点数を0(基準)として考えるということです。 もし仮に Y = 0*(一般入試) + 2.35*(推薦入試) + 1.60*(内部進学) という回帰式が求められたのなら、削除した列(=一般入試)の変数よりも推薦入試は2倍ほど試験成績が高かっただろうと判断できるわけです。 まだ私が勘違いしているかもしれないので、誰か他の方、フォローをお願いします。
- backs
- ベストアンサー率50% (410/818)
> x(k),x(k+1)の回帰係数が0 x(k)とかx(k+1)というのは何なのですか? 私は提示されているデータも何を表しているのか察することができませんでした。もう少し丁寧に状況を説明してもらえるとありがたいですね(単に私の理解力不足なのでしょうが)。
補足
2つともダミー変数です。 例えば、x(k),x(k+1)=(1,0)(0,1)(0,0)のとき、 それぞれの回帰係数は内部進学を基にして、一般入試、推薦入学の学生の平均点がどれほど高いか(あるいは低いか)をあらわしています。