- ベストアンサー
相関係数について
相関係数(ピアソンの積率相関係数)のp値とは何ですか? 文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
心理か教育関係の学生さんですか? そうだと仮定してあなたが文献解釈に困らない程度のザックリとした説明をします。 まず、相関係数とは、ある2つの事象が相互にどの程度の相関関係を持っているかを示す値だということ、そして、これは-1<α<1の間の値で算出されることは知っていますね。 で、通常、この値が1(または-1)に近いほど、2つの事象には「相関関係がある」と言うわけですが、実はこれだけではデータとしてはダメなのです。ここにp値が出てきます。 p値は「仮に2つの事象が本当はぜーんぜん無関係だとした場合でも、このような相関係数が得られる【確率】はどのくらいあるか」という認定をする数字です。 つまり、2つの事象が、本当は無関係なんだけど、何らかの偶然で高い相関係数が出てしまう場合だってあり得ますよね。それを考慮して下さい、ということです。 例えば、AとBという2つの事象について積率相関係数を求めました。0.85だったとしましょう。 「おおお、両者には強い相関関係があるんだ!」とやってしまいますよね。でも「ちょっと待ったぁ! p値はいくつだい?」と尋ねられます。 p値=0.17だったとしましょう。 そうすると、「AとBの2つが本当は無関係なんだけど、何らかの偶然(とか、データの偏りなど)によって、0.85という相関係数が出てしまう確率が0.17(17%)ありますよ」ということになるのです。 通常p値が0.05(95%以下の有意性)を超えた場合にはそのデータは採用しません。つまりあまりにも偶然が介在する余地が多すぎるからです。さっきの例で言えば、AとBの2つの事象が無関係でも、相関係数が0.85と出てしまう確率が17%もあるとしたら、そんなデータで何かものを言うのはおっかないですよね。 初心者が混乱するのは、p値が大きくなる=データの有意性が小さくなる、という関係であるにもかかわらず、「有意確率」という表現が使われるためです。 まぁ、「文献に出てきた相関係数の怪しさの度合い」を示していると思っていれば、とりあえず文献を読む程度なら良いでしょう。だからp値は小さいほど良いデータなのです。
その他の回答 (3)
- dunnett
- ベストアンサー率24% (16/66)
計算された相関係数がゼロではないという確率です. 計算された相関係数の有意水準です.
お礼
回答ありがとうございます。 知識が全然ないので、参考URLなどを見ながら、これから勉強していきたいと思います。
- hukuponlog
- ベストアンサー率52% (791/1499)
>どういう本などを読めば良いでしょうか? >統計学の本はあるのですが… まず初めに断っておきますが、私は統計学の研究者ではありません。自分の研究のために統計分析を利用している人間です。だから、これから書くことはあくまでも「統計を利用する立場」からの学習方法です。統計学の先生達から怒られそうだからな(笑) まず統計学の本を読むのは止めましょう。統計の先生達の間違いは、初学者に専門的な統計理論が必要だと思いこんでいるところです。大部分の人間にとって、統計の意義は「現実のデータから有用な情報を引き出す」ことにあります。それができれば、ややこしい理屈は、後回しでも構わないはずだし、それができるからこそ背景の理論を学ぼうとする意欲も生まれるのだと思う。 私が学生に勧めているのは「ソフトを買え」ということです。有名どころではSPSS、SAS、JMPなんかがあります。(これらのソフトを使って分析しておけば論文としては信用が得られます)安いソフトではありませんが、勉強ですから頑張って下さい。アカデミック版もあります。 さて、購入したソフトにはデモデータと解説、マニュアルが付いてきます。実際にデモデータを見ながら解説を読み、分からないところをマニュアルやヘルプで調べる。次にこれらの統計処理ソフトは実践的な解説本が数多く出版されていますから、自分の分野や関心に応じて、そうした本を購入することをお勧めします。(生協に行けばいくらでもあります) 今、手元を見たら、「SPSSによるアンケートの調査・集計・解析」なんていう本がありました (^_^;) で、ある程度理解ができたところで統計学の本に戻りましょう。笑い話ですが、ある学会で「そのデータはどのようにして出てきたのだ」という質問に対して「パソコンに聞いてくれ」と答えて顰蹙を買ったという実話があります。ソフトが使えるようになってきたら、次はやはり背景となる理論を学んでおかなくてはなりませんね。 もっとも、あなたが卒論が書ければそれで良いのだ、ということであればソフトを使いこなす程度で十分です。
お礼
重ね重ね、ありがとうございます。 実践から学んでいけば良いのですよね。自分の卒研をまとめる上でも必要になると思うので、できれば理論まで勉強したいと思います! 色々と、本当にありがとうございました。
- hukuponlog
- ベストアンサー率52% (791/1499)
>栄養学部の学生です。「心理や教育関係と仮定 >して」お答えしていただいたようなのですが、 >解釈する上で何かしら違いがあるのでしょうか…? 人文系と社会科学系ではデータの採り方(実験・調査の手法)が違います。また、論文でのデータの取り扱い方も全然違います。まぁ、ピアソンの積率相関係数程度だったら、どの分野でもたいした違いは無いと思いますが統計の手法もやっぱり違うのです。(私は理工系は全然素人ですが、やはり違うのではないでしょうか) そんなわけで、一応分野を確認したのです。栄養学部ということであれば、先述の説明で良いでしょう。ただし、これは本当にザックリした説明で厳密に言えばたくさんの間違いを含んでいます。たぶんこれからSPSS辺りを使う機会も増えるでしょうから、マニュアルと解説書をよく読むことです。
お礼
ありがとうございます。 今の私のレベルなら、ざっくりとした内容がつかめていれば良いので、大丈夫だと思います^^; 今後、もっと深く勉強していかなければならないと思うのですが、どういう本などを読めば良いでしょうか?統計学の本はあるのですが…
お礼
分かりやすいお答えをありがとうございます。 >心理か教育関係の学生さんですか? 栄養学部の学生です。「心理や教育関係と仮定して」お答えしていただいたようなのですが、解釈する上で何かしら違いがあるのでしょうか…?