• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:回帰式のR2が高くない場合の考え方について)

回帰式のR2が高くない場合の考え方について

このQ&Aのポイント
  • 回帰式のR2が高くない場合、予測の信頼性が低くなる可能性があります。
  • この場合、Aが上がればBも上がるという関係になり、過去の傾向と異なる結果を予測することがあります。
  • 統計的な解析においては、R2が高いほど予測の正確性が高まります。R2が低い場合は、他の要素や変数が影響を与えている可能性があります。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

 一般的に、4つのデータで回帰式、というのは、検量線のときだけでしょう。 なにより、データ数が4でr2=0.645だと、「相関に有意差が無い」と結論されます。すなわち、統計学的には、関係を証明できない=関係があるとは言えない式に、87を代入して、云々カンヌン論究するのは誤りです。  成立していない回帰式を使って、それに関して論究しても救いようが無い、とまでは書きませんが。 >この場合、これまでの「Aが下がればBが上がる」という関係と違い「Aが上がればBが上がる」という結果になってしまいます。  回帰式に、あらたな数値をxに代入(挿入)すれば、r=1.000で無い限り、yの値はずれます。全体では、上にズレタリ、下になったりするのは、当然です。1点だけで、「結果が逆になった」なんぞは、近視眼的。 >この様になるのは、「R2が0.645と高くないことに因る。」といっても良いのでしょうか?  R2が0.645なら、「強い相関が見られた」と統計学的には表現するのが正しい。高くないという認識は、間違っています。  予想した値からズレルノハ、r=1.000でないから。0.999でもズレマス。ただ。ズレは0.6より小さいでしょうが。  ズレを小さくするには、適正な回帰式を選択することによって可能です。この場合、指数回帰を選べば、ズレを小さくできるハズ。ただ、回帰式は、モデルですから、そのモデルは直線になる、という根拠があれば、直線回帰しか選べませんが。  回帰分析、相関分析は、有名大学の教員でも、噴飯ものの論文を見かけます。最近は、パソコンで簡単に計算できるので、多変量解析さえ、初心者が手を出せます。  表面だけ、数値だけでなく、因果関係について、洞察力を養って下さい。

その他の回答 (4)

回答No.4

No.2の回答ですが、もう1箇所誤りがありました。2行目の >Y=-1.6443X+231.57 の式で、Aに87を代入すると、・・・ ↓ Y=-1.6443X+231.57 の式で、Xに87を代入すると、・・・ でした。 「統計解析のはなし(日科技連)」という本に、母集団の相関係数を区間推定するグラフ(95%信頼区間)が載っています。 これを見ると、元データ(標本)が4個で、その相関係数が-0.8の場合、母集団の相関係数の区間推定値は、おおよそ-0.98~+0.5になっています。 これは、95%の確からしさで、相関係数が-0.98~+0.5の間に入っているということで、かなり幅があって、4個のデータによる相関係数があまり当てにならないことがわかります。 4個のデータから計算した結果では負の相関でしたが、母集団は正の相関かもしれませんし、まったく相関がない可能性もあります。 データ数が50になると、区間推定値はおおよそ-0.88~-0.72になり、ぐっと狭まって、標本による相関係数の信頼性が増すことがわかります。 相関分析ではデータ数がある程度多いほうが望ましいですが、実際はデータ数が少なくても割り切って、相関分析で算出した回帰式を使う場合もあります。

回答No.3

No.2の回答ですが、1箇所訂正します。 この場合の相関係数は -0.803になります。

回答No.2

計算を間違えていますよ。 Y=-1.6443X+231.57 の式で、Aに87を代入すると、y(B)は88.5になります。 また、Aが87、Bが91.8だとしても、なぜ、「『Aが上がればBが上がる』という結果になってしまいます」と言われているのかがわかりません。 A=87、B=91.8というデータを元データと比較すると、 A  B 100 70  Aが下がって(100→87)、Bが上がっている(70→91.8) 80  114 Aが上がって(80→87)、Bが下がっている(114→91.8) 81  95  Aが上がって(81→87)、Bが下がっている(95→91.8) 84  80  Aが上がって(84→87)、Bが上がっている(80→91.8) R2が0.645であれば、相関係数は0.803であり、相関は良好と言えると思います。 ※相関係数の強弱を判断する目安 0.8≦|r| →強い相関あり 0.6≦|r|<0.8 →相関あり 0.4≦|r|<0.6 →弱い相関あり |r|<0.4 →ほとんど相関なし 元データの数が4と少ないのが問題で、かなりの誤差を含んでいると思われます(相関係数を区間推定する方法もありますが)。

  • hashioogi
  • ベストアンサー率25% (102/404)
回答No.1

データが回帰直線から大きく外れているからそういう結果になるだけの話ではないでしょうか? 図からわかるように、データの全体の傾向も、回帰式もxが大きくなればyは小さくなるようになっていますけど。

bambu3340
質問者

お礼

ご回答ありがとうございました。 確かにそうですね。絵で見ると、大きく外れているだけで、全体的には逆相関ですね。大変参考になりました。

関連するQ&A