- ベストアンサー
回帰分析です
ある論文を読まされています. 論文の中で回帰分析が用いられているのですが,「被説明変数が5%水準で有意に正」であるとなっているのですが,被説明変数名とサンプル数,AdjR2,B-P.het.test,F-statisticしか書かれていません. 説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005)だとは教わったのですが… 一体,被説明変数が5%水準で有意と何で判断してるのでしょう? 教えて下さい!
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
下の回答の補足です。 F(1,n-p-1) のp, n は p:変数の数 n:サンプル数 です。
その他の回答 (5)
- selfer
- ベストアンサー率76% (104/136)
重回帰分析の結果を 1)その変数が有効であるかの判定,どの程度有効であるかの指標 2)採用した変数全体のモデルが有効であるかの判定,どの程度有効であるかの指標 という観点でみるならば 有効かの判定 有効度の指標 変数レベル t値(確率) 標準偏回帰係数(β) 全体レベル F値(確率) 重相関係数(R),重決定係数(R2) とまとめることができます. さて,ここで問題になっているのは,説明変数の有効判定において「t値」が掲載されておらず,「確率」のみが直接掲載されていること,そのことが疑問に感じられているのでしょう. 勿論t値やF値が掲載されていた方がよいのですが,読者にとって重要なのは,その変数が結局有意水準レベルで有意であるかどうかの「結果」です. 確かにt値やF値,及び自由度が掲載されていれば,それらの数値から「○○%で有意であるかの判定」を自分で行うことができます(例えば,|t値|≧2,というのも自分で行う判定法の一種ですね).しかし,更に重要なのは,「結局」有意であったかどうか,その一点さえ載せておけばいいわけです. 具体的にt値=2.1,あるいはt値=10.3であったとしても,有意であったかどうかさえわかれば一応事足りるわけです.そのため,論文には,最小限の情報として確率,あるいは,有意判定の結果だけを載せており,その途中経過であるt値の数値を論文執筆者が載せていないだけなのです.
お礼
ありがとうございます. 端的且つ分かり易い説明で助かりました.
回帰係数の検定はt検定ですが、t分布とF分布の関係からF統計量で検定することもできます。提示されているF統計量に対して |F|>= F(1,n-p-1) なら回帰係数が0という仮説が棄却できる(つまりその説明変数を使う意味があると考えられる)。 > ただ、説明変数が8つもある、というのは多すぎる > のではという感じです。というのは、 何が影響す >るのか全体像がぼけるからです。 (略) >説明変数を3つもとれば、被説明 変数の変動の80% >以上は説明できるでしょうし、 経済などの場合では、少数の変数では寄与率が高くならないことはしばしばあります。 また、目的が少数の説明変数で予測することでなく、説明力の強さ(要因分析)であれば単純に変数選択で少数の説明変数で説明するのは本来の目的にかなってません。 #したがって、説明変数が8個はおかしくなくて、 #有意となった変数は説明力がほとんどないと判断します。 > 経済学の論文なのでサンプル数やR2の扱いは > 医療の統計とは異なるかもしれませんが. R^2などは領域には関係ありません。
お礼
なるほど,そう見ることも出きるのですか. しかし変数n,pは何でしょう?
- kgu-2
- ベストアンサー率49% (787/1592)
重回帰分析では、どの説明変数を取り入れるかの判定をF検定でします。ですから、方法論としては、間違っていないという印象を受けます。その判断が正しいか否かは、筆者と論文の審査員を信じざるを得ないと思います。その過程を論文に書いても、冗長になるだけですから、書かないのではないでしょうか。 ただ、説明変数が8つもある、というのは多すぎるのではという感じです。というのは、何が影響するのか全体像がぼけるからです。何も考えずに、データをパソコンにぶち込んで力任せに無理やりやった、としか想えません。説明変数を3つもとれば、被説明変数の変動の80%以上は説明できるでしょうし、出来ないようでは解釈・説明が苦しいと想います。 それとも、単に予想が出来れば良いというものでしょうか。 エクセルではやったことはありませんが、統計ソフトだと、F値が出てきて、その値から、有意差が5%以下ならその説明変数を捨て、次のを入れたりして、回帰式を決めます。 その根拠は、私にはブラックボックスで、理解できていません。説明書に従ってやった経験はあります。平均寿命の説明変数として、医師数と看護婦数を取ると、看護婦数は少ない方が良い、というとんでもない結果がでて、「多重共線性」というやっかいなものにぶち当たりました。 >説明変数のT-statisticが|2|以上なら5%有意 これは、読んだことがありません。サンプル数によって有意差は影響されるので、正しいとは思えません。 ご自身で重回帰分析をなさったことがありますか。もしもまだでしたら、練習問題を統計ソフトを利用してなさるのが近道かと思いますが。 ほとんどお役に立たずにすみません。
補足
もしかして私の読み間違えのような気がしてきました. 被説明変数にT-staticsって無くてあたり前ではないですか? 説明変数には無くてはならないですが. B-P.het.testの値は被説明変数の個所に書かれていて,T-statisticは説明変数の個所に書かれています. これで問題ないんですよね. ちなみに説明変数が8つあってF-statisticは40以上,AdjR2も約0.9です. 経済学の論文なのでサンプル数やR2の扱いは医療の統計とは異なるかもしれませんが. サンプル数で有意さが影響されるという事は勉強になりました.
- kgu-2
- ベストアンサー率49% (787/1592)
回帰分析とあるですが、単回帰ですか、それとも重回帰分析ですか。 単回帰分析は、サンプル数と相関係数から、t検定で有意差を検定します。 説明変数が複数の重回帰分析では、その説明変数を取り入れるか捨てるかの判定を、F検定でしていたような記憶があります。それには、増加法、減少法、増減法の3つがあったように、おぼろげに・・・。 重回帰分析は、解釈が難しいので、やらないことにしています。 >AdjR2,B-P.het.test,F-statistic この部分が訳せれば、OKということでしょうか。 AdjR2は、標準化した相関係数(R2だったら、決定係数) B-P.het.testは、Back-Progressだったら、増減法 F-statisticは、F検定をした、というのが想像です。当たるも八卦、というところで、占いにしてすみません。 >説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005) ここも分かりません。これも、重回帰分析の話でしょうか。
補足
重回帰分析です. 説明変数は8あります. AdjR2はEXCELを使った場合,「自由度調整済みR2」と表示されるヤツですね. F-statisticはF値. B-P.het.testはBreusch-Pagan検定らしいのですが… >説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005) は説明変数のT値が絶対値で2以上ならP値で0.05以下と見なす事が出来るという意味です. (0.005は0.05の誤りでした)
- 0shiete
- ベストアンサー率30% (148/492)
下記参考URLをごらんください。 疑問に思っていらっしゃることはこういうことではないですか?
補足
残念ながら違います. T-statisticsが分かっていれば困らないのですが,サンプル数,AdjR2,B-P.het.test,F-statisticしか無いから困ってるのです(T-T)
お礼
ご丁寧にありがとうございます. F-値から間接的に有意さが判定できるのですね. 勉強になりました.
補足
皆さん,ご丁寧にありがとうございました. ポイントは2名様にしか発行できないので,ポイントが付かなかった方は御不満でしょうがご勘弁ください. また,次回によろしくお願いします.