- ベストアンサー
回帰式のR2が高くない場合の考え方について
- 回帰式のR2が高くない場合、予測の信頼性が低くなる可能性があります。
- この場合、Aが上がればBも上がるという関係になり、過去の傾向と異なる結果を予測することがあります。
- 統計的な解析においては、R2が高いほど予測の正確性が高まります。R2が低い場合は、他の要素や変数が影響を与えている可能性があります。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
一般的に、4つのデータで回帰式、というのは、検量線のときだけでしょう。 なにより、データ数が4でr2=0.645だと、「相関に有意差が無い」と結論されます。すなわち、統計学的には、関係を証明できない=関係があるとは言えない式に、87を代入して、云々カンヌン論究するのは誤りです。 成立していない回帰式を使って、それに関して論究しても救いようが無い、とまでは書きませんが。 >この場合、これまでの「Aが下がればBが上がる」という関係と違い「Aが上がればBが上がる」という結果になってしまいます。 回帰式に、あらたな数値をxに代入(挿入)すれば、r=1.000で無い限り、yの値はずれます。全体では、上にズレタリ、下になったりするのは、当然です。1点だけで、「結果が逆になった」なんぞは、近視眼的。 >この様になるのは、「R2が0.645と高くないことに因る。」といっても良いのでしょうか? R2が0.645なら、「強い相関が見られた」と統計学的には表現するのが正しい。高くないという認識は、間違っています。 予想した値からズレルノハ、r=1.000でないから。0.999でもズレマス。ただ。ズレは0.6より小さいでしょうが。 ズレを小さくするには、適正な回帰式を選択することによって可能です。この場合、指数回帰を選べば、ズレを小さくできるハズ。ただ、回帰式は、モデルですから、そのモデルは直線になる、という根拠があれば、直線回帰しか選べませんが。 回帰分析、相関分析は、有名大学の教員でも、噴飯ものの論文を見かけます。最近は、パソコンで簡単に計算できるので、多変量解析さえ、初心者が手を出せます。 表面だけ、数値だけでなく、因果関係について、洞察力を養って下さい。
その他の回答 (4)
- genshisyounen
- ベストアンサー率73% (38/52)
No.2の回答ですが、もう1箇所誤りがありました。2行目の >Y=-1.6443X+231.57 の式で、Aに87を代入すると、・・・ ↓ Y=-1.6443X+231.57 の式で、Xに87を代入すると、・・・ でした。 「統計解析のはなし(日科技連)」という本に、母集団の相関係数を区間推定するグラフ(95%信頼区間)が載っています。 これを見ると、元データ(標本)が4個で、その相関係数が-0.8の場合、母集団の相関係数の区間推定値は、おおよそ-0.98~+0.5になっています。 これは、95%の確からしさで、相関係数が-0.98~+0.5の間に入っているということで、かなり幅があって、4個のデータによる相関係数があまり当てにならないことがわかります。 4個のデータから計算した結果では負の相関でしたが、母集団は正の相関かもしれませんし、まったく相関がない可能性もあります。 データ数が50になると、区間推定値はおおよそ-0.88~-0.72になり、ぐっと狭まって、標本による相関係数の信頼性が増すことがわかります。 相関分析ではデータ数がある程度多いほうが望ましいですが、実際はデータ数が少なくても割り切って、相関分析で算出した回帰式を使う場合もあります。
- genshisyounen
- ベストアンサー率73% (38/52)
No.2の回答ですが、1箇所訂正します。 この場合の相関係数は -0.803になります。
- genshisyounen
- ベストアンサー率73% (38/52)
計算を間違えていますよ。 Y=-1.6443X+231.57 の式で、Aに87を代入すると、y(B)は88.5になります。 また、Aが87、Bが91.8だとしても、なぜ、「『Aが上がればBが上がる』という結果になってしまいます」と言われているのかがわかりません。 A=87、B=91.8というデータを元データと比較すると、 A B 100 70 Aが下がって(100→87)、Bが上がっている(70→91.8) 80 114 Aが上がって(80→87)、Bが下がっている(114→91.8) 81 95 Aが上がって(81→87)、Bが下がっている(95→91.8) 84 80 Aが上がって(84→87)、Bが上がっている(80→91.8) R2が0.645であれば、相関係数は0.803であり、相関は良好と言えると思います。 ※相関係数の強弱を判断する目安 0.8≦|r| →強い相関あり 0.6≦|r|<0.8 →相関あり 0.4≦|r|<0.6 →弱い相関あり |r|<0.4 →ほとんど相関なし 元データの数が4と少ないのが問題で、かなりの誤差を含んでいると思われます(相関係数を区間推定する方法もありますが)。
- hashioogi
- ベストアンサー率25% (102/404)
お礼
ご回答ありがとうございました。 確かにそうですね。絵で見ると、大きく外れているだけで、全体的には逆相関ですね。大変参考になりました。