- ベストアンサー
統計の問題で・・・
2つの母平均を比較する時に「独立サンプル」か「対応のあるデータ」かの区別が重要 とありますが、 ・違いは何か ・相関係数を計算する意味があるのはどちらか ・帰無仮説を棄却しやすいんはどちらか について解説して頂きたいのですが。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
帰無仮説を棄却しやすいのは、対応のあるデータです。 対応があるというには、同一人について、使用前と使用後を比較するような場合ですから、対応のある場合というのは限られます。ある学年のA組とB組の差をみつけたい、というのは対象外です。 >独立サンプル」か「対応のあるデータ」かの区別が重要 かなり微妙な表現です。というのも、私自身は、さして重要だとは思いません。「対応のあるデータ」を「対応のないもの」として検定するのは、支障ありません。ただ、帰無仮説をやや棄却しにくいので、統計的に意味のある論文がやや書きにくいかもしれない、ということです。 母平均の比較をするときに、片側検定でも良いときに、両側検定をするのと同じ理由です。 しかし、「対応のないもの」を「対応のあるもの」として、計算するのは、明らかに間違いです。 母平均を比較するのは、両集団に差があるか否かを検定します。正確に表現すれば、「差が無い、というか説を捨てると、誤りである可能性が95%以上、または99%以上(p<0,01の場合)あるので、差があると考えよう」ということ、すなわち、差があることを証明することが目的です。 相関係数を計算するのは、例えば、身長と体重のように、両者に関連があるかどうかを検定します。 相関係数は、簡単に計算できますが、最も難しいのは、その解釈です。その証拠に、相関係数を計算してある論文で、その説明があるものはほとんどありません。 こんなのは、どうでしょうか。世界の各国について、横軸の人口千人当たりのテレビの台数をとり、縦軸にその国の平均寿命をとります。これを対数回帰で計算すれば、相関係数は、0.8を超えますので、強い正の相関が見られます。ここまでは、誰でも同じ結果です。 この結果は、「テレビ番組には、栄養や医学の番組が多く、それを見ることによって健康に気をつけるので長生きするようになる」との説明もできます。間違いが分かりますか。 有名大学の研究者の論文でも、計算はともかく、解釈は間違っているとしか思えないものも見かけます。 「独立サンプル」というのは、聞いたことがありません。
お礼
わかりやすい説明をどうもありがとうございました。いまいち問題の意図がわからなかったのですが、なかなかに理解が深まりました。