- ベストアンサー
回帰曲線の有意性
あるクラスで生徒の1ヶ月の勉強時間合計とテストの点数について調査し、グラフにしたところ対数関数に近似することができました。エクセルを使って、近似式と決定係数を出しています。 この決定係数が有意であるかどうかを検定したいのですが、どのようにすればよいでしょうか。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
おっしゃるところの「決定係数が有意」とは何のことか、はっきりしません。有意性を問題にするのは「○○と##は無相関だ」などの帰無仮説を検定する場合であり、帰無仮説を棄却した場合に、その棄却という判断が誤っている確率を計算するんです。 もし「xとyの間には、 y = a log(x) + b + 誤差 という関係があり、 誤差の分布は□□分布に従う筈だ」と考える理論的根拠があって回帰分析を行った場合には、パラメータa, bの信頼性範囲を計算します。 しかし、ご質問の場合、テストの作り方(テスト問題の揃え方)によって、曲線が変わるでしょう。たとえば、もっと難しい問題が多いテストなら、あるいは、もっと易しい問題が多いテストなら、散布図の形が(「概ね右上がりである」ということは同じだろうけど)かなり変わるに違いありません。つまり、単に「今回のテストでは、散布図がたまたま対数のグラフに似た形になった」というだけに過ぎません。対数関数を使って回帰することには何ら根拠がないのです。この場合、点数の代わりに順位を手がかりにして相関を分析する(ノンパラメトリックな)方法が適切でしょう。 「テストの作り方」の影響を消すためによく行われるのは、テストの点数xを単調増加関数z=f(x)で変換するというやり方で、ただしf(x)は、zの分布が標準正規分布φ(z)になるような関数です。 点数の累積分布のヒストグラム p(x) = (点数がx以下である人数)/(全体の人数) を作って、これと累積正規分布 q(z) = ∫[t=-∞~z] φ(t) dt の逆関数invQとを組み合わせて f(x) = invQ(p(x)) が作れます。 こうして出したzの値が、いわゆる「偏差値」です。もちろん、(正規分布を仮定する根拠なんかないのだから)偏差値そのものも順位としての情報しか持っていません。 ついでながら、一つの注意点は、「勉強時間の長さが原因、テストの点数が結果」というような因果関係は、ご質問の調査では証明できないということです。因果関係が逆(「普段テストの点数が低いんで、勉強やる気が出ない」)だとか、勉強時間と点数の両方に共通の別の原因がある(「テストの点数に一喜一憂し勉強しろとうるさく言う親もいれば、放任主義で無関心の親もいる。前者では生徒がテストを真剣に受けるのでミスが少ないが、後者では生徒がテストを真剣に受けない」)ということかも知れないからです。
お礼
わかりやすく教えていただき、ありがとうございます。 大変参考になりました。