統計・社会調査報告書の読み方(相関、重回帰、残差)
現在、政府統計の調査報告書を読んでいます。統計は初心者なので、文章での分析結果の後に出てくる統計の結果表示の表す数値を、どう評価していいのかが分かりません。rやnというアルファベットの意味自体は調べれば分かるのですが、それをどう評価すべきなのか、理解できないということです。文章のみを信じるのも方法ですが、読むからには内容を理解したいと思います。恐縮ですが、初心者なので以下の具体的な文章を例にとって説明(回答)していただけると大変ありがたいです。
ちなみに、「(社会)調査報告書の読み方」のようなテキストを探したのですが見当たらず、現在は、青木氏やhttp://aoki2.si.gunma-u.ac.jp/FlowChart/Tutorial.html中澤氏http://phi.med.gunma-u.ac.jp/oldlec/social_stat.html、その他を参照にしていますが、自ら分析・検定するわけではないので、報告書の「読み方」に必要な知識を得たいと思っています。
例1 「回答率と被害率との関係はないことが判明した(r=0.04;n=28)」
質問:rが相関係数で、中程度から弱い正の関連があり、nがある程度大きくないとrが大きくても相関関係があるとはいえないことは分かるが、n=標本数が28ということは、どう評価すべきか?またnが他の数値だった場合どうか?
例2 「3つの予測因子を組み合わせることにより、被害率の差異の3分の1を説明できる(重回帰係数は0.50)」
質問:3分の1を説明できるならば、0.50ではなく、0.30ではないか?そもそも、上記で「重回帰係数」という言葉は、「重決定係数(R2)」と同じか?英語で言うと、R-Squareで、Multiple Regression Coefficientとは違う?その辺にも混乱があるのかもしれません。
例3 「Χ2(2)=34.510, p=0.000」
質問:カッコ内は、調整済み残差ですが、この場合、(2)をどう評価すればいいか?また、有意差があるというためには、p値だけ示せばいいと思うのですが、X2の数値(34.510)を出す意味は何か?ちなみに、当該例は、犯罪被害経験の有無と世帯人数の関係を見た検定結果ですが、p値は同様で、34.510が、19.659だった場合どう理解できるか?
長くてすみませんが、分かる方には情報があった方が説明しやすいと思いますので具体例を挙げました。どうかよろしくお願いします。
お礼
なるほど、丁寧なご解説で大変良く分かりました。 確かに、すこし勉強不足です。これから勉強致します。ありがとうございました。