- 締切済み
回帰分析の結果
統計を初めたばかりの初心者です。どなたか以下の結果が、どのような意味になるかを教えてください。excelを使用しました。 概要 重相関R/0.700574993 重決定R2/ 0.490805321 補正R2/0.482592503 標準誤差/ 2.7494336 観測数/64 分散分析表 自由度 / 変動 / 分散 / 観測された分散比 / 有意 F 回帰 1 451.7556225 451.7556225 59.76089527 1.16E-10 残差 62 468.6818775 7.559385121 合計 63 920.4375 切片・P-値/0.724068654 X値1・P-値/1.16186E-10 特に切片・P-値とX値・P-値の意味が少し分かりません。 よろしくお願いします。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- s_nak
- ベストアンサー率55% (269/487)
回帰分析で「因果関係を判別する」というのはかなりいい加減な表現です。回帰式に対して、理論的に因果関係が設定できる場合に限り、そのように表現する場合もあります。 回帰分析では、関係があることを否定できないという形で判定します。 これを強引に「因果関係があると言える」など表現する場合もありますが、それは論文発表などで皆そうでないと分かっているものの慣用的にそう表現しているといった要素が強いです。 正確に言えば、回帰分析で見ているのは、あくまで相関関係です。 それから、回帰分析によって説明変数が最良不変推定量(BLUE)になるための条件があります。それらを勉強した方がよいです。 参考書として 縄田和満「Excelによる回帰分析入門」朝倉書店 を挙げておきます。 yamapi2008さんが用いられているような質的な非連続の変数を扱うのに、単純な回帰分析は向きません。 p値に関しては、正確に言えば、 統計的な有意水準5%と設定した場合、p値が0.05未満なら、その説明変数が「統計的に有意である」または、「相関関係を棄却できない」と表現します。 説明変数の対になるのは目的変数もしくは被説明変数で、従属変数の対になるのは独立変数なので、ひとつの回帰式の説明に、説明変数と従属変数の両方を用いるのは間違ってます。
- kgu-2
- ベストアンサー率49% (787/1592)
指導教員がおられるのに、横から口出しするのは研究者のマナーに反します。私の研究室の学生に、横からアレコレ言われると、『良く指導してくれた』なんぞお礼言える人格者ではありませんので。 というわけで、以下、独り言。 >ですので僕は、ある分野における都道府県別の行政機関の管理能力(0~100点で5点きざみ)とその達成度(1~12点で1点きざみ)を用いました。 普通の散布図で、回帰式を計算し、というのなら、達成度の3点は達成度1点の3倍でなけければ、方法論的に間違いでしょう。 検定法なら、順位差検定が一般的です。順位相関係数の単語も聞きますが、やったことが無いので。 >相関係数は、0.700574993で、かなり相関あるという結果が出ましたが、これからp値を計算するというのはどのような意味でしょうか? 単相関の場合は、有意差のレベル(p値に相当)5%または1%をクリアする相関係数の表が、統計学の教科書に載っています。それは、データ数によります。例えば、危険率5%だと、データ数が10ときは相関係数が0.576以上必要ですが、60だと0.25あればクリアできるようです。、64の表は持っていません。t検定をするようですが、数学的な証明をする能力はないので、その表を素直に信じています。 >EXCELの結果表には表示されていないということでしょうか? 相関係数は、エクセルのグラフの近似式の決定係数の平方根を用いて計算しています。エクセルの関数のTTESTやFFTSTのように、危険率p値がセルに表示されると楽なのですが。たぶん出来ないと。 >おそらく他に有意な説明変数があるのかもしれませんが 決定係数が0.49だと、これ以上の有力な説明変数は、無いでしょう。数学的な可能性は残っていますが、現実的には、無いと断言できます。 x軸の項目が、y軸の項目に、最も影響する、と記述されていても、私が審査員なら認めます。理由は、指導教員に訊いてください。 もっとも、私が指導教員なら、「そんな知識をどこで仕入れた」と訊き、「インターネット」なら、追放処分ですが。というのも、間違った書き込みも少なくないからです。誤った知識で、学生などと議論すると、「こんなことが書いてある」とそればかりを信じて、こちらのいうことに耳を貸してくれません。 というわけで、あくまで独り言です。
- kgu-2
- ベストアンサー率49% (787/1592)
>大学のレポート 課題に対する解答は、ここの規定では禁止されています。また、大学なら指導者がいるので、回答しないことにしています。ただ、統計をやらざるをえなくなって、専門用語が理解できず、のたうちまわった頃を思い出すので。 >達成度(1~12点) ここの数値は、気になります。30円は、10円の3倍です。この3点は、1点の3倍と想定できますか。そうでないと、回帰分析の前提に違反なのですが。 >目的は因果関係を特定すること これは、論文でも間違っている例を多く見かけます。5要件とか7要件、9要件と人によって違いますが、私は5要件で判定しています(重松逸造「易学とは何か」講談社)。 また、その判定も、本の説明では分かるようには書いてある感じがしますが、実際には判断に困ります。例えば、普遍性性については、同じ現象が他の集団でも認められること、いいかえれば現象に普遍性があること、と記述されています。普遍性の文字が繰り返されているだけです。これで初心者が判断できるとは思えないのです。繰り返しになりますが、因果関係の判断は、専門家でも間違うことを頭においていてください。 >(1)重決定R2(2)有意F(3)P-値 これば、順番が違っていて、回帰式が有意であるか判定は、 1) 相関係数を計算する 2) 相関係数からp値を計算する 3) p値が0.05未満なら、有意差有り、と判定します。 >切片・P-値とX値・P-値の意味が少し分かりません。 x値のp値は、マイナス10乗のオーダーなので、有意でしょう。切片は、回帰式は少し斜めにすると切片は動きやすいので、有意差を示すので難しいのでは。この解釈に自信はありません。 データ数が64もあれば、かなりバラバラでも、有意になります。データ数が増えるほど『これでは』と感じても、有意差は出てきます。 因果関係の判定手順は、 1) 相関係数から、有意であると判定 2) 5要件を全て満たしている、少なくとも反していない、ことを示す。 で、私は行っています。 因果関係の強弱は、決定係数に依存するとのこと。数学的に証明できるようですが、私には理解不能です。提出する大学の先生に訊いて下さい。 それにしても、初心者に重回帰分析、そして、因果関係を要求するとは信じられません。この場合、説明変数が1つにしか見えないので単回帰の印象がありますが、本当に重回帰分析なら、最も厄介な問題は、多重共線性です。 超一流大学の学生相手に、『自分で勉強せよ』と言いたいのなら、別ですが・・・。
- bigorange9
- ベストアンサー率75% (171/227)
相関係数、決定係数、分散分析表など、まず基本的な用語の定義だけでも長くなります。また、それぞれ数式展開を理解しないと全然分かりません。ちょっとひねった問題ですぐまた分からなくなります。 統計学の質問掲示板と用語集の便利なサイトを貼っておきますので参考にしてください。
お礼
bigorange9さん ご回答ありがとうございます。HPを早速拝見いたしました。基本的な用語をしっかりと覚えたいと思います。ありがとうございました。
- kgu-2
- ベストアンサー率49% (787/1592)
>統計を初めたばかりの初心者です 統計は、やってから、「どうすれば・・・」という問いかけは、初心者の誤り。電車の切符を買って(ソフトを使って)、その駅に降り(数字を出す)、「私は何しに来たのでしょう」という質問と同じです。といっても、統計は習うより慣れろが、未だに初心者の私の方針なので、それほど目くじらを立てることも無いのですが。 初心者といいながら、重相関分析は、荷が重過ぎます。双葉マークのベンツは見かけません。単相関からするべきです。 重相関の文字を散見できますが、xの値は、x値1だけ。回帰も1だけ。x2が無いと、重相関では無いのですが。 1) 重相関なのか単相関なのか。 2) 因果関係を示したいのか、単に予想したいのか。 3) 個人の趣味なのか、大学などの研究なのか、 を書き込んでください。
お礼
kgu-2さん、ご回答ありがとうございます。とりあえず、EXCELを使って簡単な回帰分析を始めたばかりです。 内容は大学のレポートで、目的は因果関係を特定することです。説明変数(管理能力0~100点)は1つの単回帰分析で、従属変数は達成度(1~12点)です。分散分析表は少し省略してしまいましたが、以下が完全な内容になります。 ●切片 係数/標準誤差/t/P-値/下限95%/上限95%/下限95.0%/上限 95.0% -0.388659185/1.095950393/-0.354632096/0.724068654/-2.579432783/1.802114414/-2.579432783/1.802114414 ●X 値 係数/標準誤差/t/P-値/下限95%/上限95%/下限95.0%/上限 95.0% 1/0.126040193/0.016304238/7.730517141/1.16186E-10/0.093448485/0.1586319/0.093448485/0.1586319 本を読みながら少しずつ取り組んでおりますが、EXCELの結果で回帰分析の当てはまりのよさがまだよく理解できておりません。 (1)重決定R2 (2)有意F (3)P-値 の3つが重要な指標だということを少し覚えました。 (2)の結果は有意だという意味かと思いますが、(3)は少し分かりません。 たとえば、切片・P-値/0.724068654は、有意水準72%でしか帰無仮説を棄却できないという意味になるでしょうか?また、これは回帰分析の結果、因果関係がないという意味になるでしょうか? お手数をおかけいたしますが、よろしくお願いいたします。
お礼
kgu-2さん、ご回答ありがとうございました。 おそらく他に有意な説明変数があるのかもしれませんが、とりあえず説明変数は1つの単回帰をすることを課題として出されました。データは自分の関心のあるものを用いてもよいとのことでした。ですので僕は、ある分野における都道府県別の行政機関の管理能力(0~100点で5点きざみ)とその達成度(1~12点で1点きざみ)を用いました。 >(1)重決定R2(2)有意F(3)P-値 これば、順番が違っていて、回帰式が有意であるか判定は、 1) 相関係数を計算する 2) 相関係数からp値を計算する 3) p値が0.05未満なら、有意差有り、と判定します。 相関係数は、0.700574993で、かなり相関あるという結果が出ましたが、これからp値を計算するというのはどのような意味でしょうか?EXCELの結果表には表示されていないということでしょうか? >切片・P-値とX値・P-値の意味が少し分かりません。 x値のp値は、マイナス10乗のオーダーなので、有意でしょう。切片は、回帰式は少し斜めにすると切片は動きやすいので、有意差を示すので難しいのでは。この解釈に自信はありません。 この点はよく理解できました。ありがとうございます。切片については、無視してもよい指摘しているテキストもあるので、この点はもう少し自分で調べてみます。 >因果関係の判定手順は、 1) 相関係数から、有意であると判定 2) 5要件を全て満たしている、少なくとも反していない、ことを示す。 で、私は行っています。 因果関係の強弱は、決定係数に依存するとのこと。数学的に証明できるようですが、私には理解不能です。提出する大学の先生に訊いて下さい。 この点も了解いたしました。さっそく「易学とは何か」を読んで見たいと思います。 またお時間がありましたお気づきの点をご指摘いただければ幸いです。