- ベストアンサー
相関係数0.876 0.991 危険率1%で有意とは?
全く統計の知識がありません。 実験データで、相関係数0.876 0.991 危険率1%で有意とはどういう意味でしょうか? 過去の質問を読みなんとなく危険率の意味は分かるのですが、相関係数と一緒にされると全く分かりません。詳しい方教えてください。 相関係数が0.8以上で1に近いから、危険率が1%ということなのでしょうか? また、y=2.4x-0.15が成り立ち(右上りの直線に近い)、相関係数が0.991で危険率1%で有意というのも分かる方教えて下さい。 なぜこの式で相関係数が0.991になるのでしょうか? すみません、分かる方お願いします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは。統計的検定とは何かを簡単に説明します。 「危険率」「有意」ということを理解するためには,「母集団」と「標本」の関係を理解する必要があります。 質問者さんは,今回,「相関分析」に関する統計法をされていますが,その相関係数は○○人のデータという「(比較的)小数データ」で分析をしているはずです。しかし,統計解析法とは,本来,実際に分析対象としている小数データ「標本データ」ではなく,その背後にある,本当に調べたい「母集団データ」について,あれこれと考える分析の道具なのです。 例えば,日本の大学生の特徴はどのようなものかを考える場合,(本当に調べた)母集団は「日本の大学生」となります。しかし実際に,日本の大学生全員のデータを取ることなどほとんど不可能です。そこで,分析をする人が比較的データ収集をできる「○○大学の大学生△△人」からデータを取ることになります(ただし,○○大学は日本の大学の平均的特徴を持っていると仮定します)。この「○○大学の大学生△△人」が「標本集団」となります。 さて,この標本集団で★★の特徴があると分析結果が得られたとします。この標本集団は,日本の大学生の平均的特徴を有していると仮定しましたので,この★★の特徴は,この標本集団だけではなく,日本の大学生の平均的特徴であると,結論を一般化しても良いと「推測してもよいと思われます」。しかし,本当に,このように「結論を一般化してもよいかどうか」はかなり大きな問題です。ひょっとすると,仮定が間違っていて,実は,この○○大学は日本の大学の中でもすごく変わっている(平均的ではない)とするならば,このような一般化は不適切になるわけです。 そう,この「標本集団における結論を,母集団に一般化して良いかどうか」の判断こそが,統計的検定と呼ばれるものなのです(実際には,「標本集団における『差がある』or『相関がある』という結論が一般化できるかどうか」という「○○がある」型の結論の一般化可能性なのですが)。そして,母集団がどのようなものか分かっていないので,その推論も間違う可能性も当然あります。そこで,「『間違う可能性○○%という条件付きで』,一般化して良いかどうか」の判断ということになります。 > 相関係数が0.991で危険率1%で有意 標本集団では「0.991」という非常に高い相関関係が見られています。そして,この標本における結論「相関がある」が母集団でも一般化できるかどうかを有意性検定で調べた結果,「間違う可能性(危険率)1%」という条件付きだが,一般化しても良い(=有意)である,という解読ができます。 なお。回帰直線「y=2.4x-0.15」の「2.4」は回帰係数と呼ばれる数値ですが,この回帰係数と相関係数は密接な関係があります。データを標準化(平均0,標準偏差1に変換したもの)を使って回帰係数を求めると,「2.4」ではなく,「0.991」になります。しかし,この辺の理屈を知りたいならば,回帰直線の数学的な意味を理解しなければなりません。
その他の回答 (3)
- backs
- ベストアンサー率50% (410/818)
要するに「その相関係数は統計学的な観点から考察して正しいものですよ」ということ。 危険率1%ということは「100回やったら1回は間違える」ということ。だから0.876という相関係数について「母相関係数が0である」という検定を行ったら、100回に1回は誤った検定結果がでるかもしれないということです。 「誤った判断をしてしまうという危険がある」 だから、危険率というわけです。
- Ishiwara
- ベストアンサー率24% (462/1914)
「相関係数」「危険率」「回帰線の傾き」の3つは、密接にリンクしているものではなく、それぞれ独立に大きくなったり小さくなったりします。 (1) 相関係数は、回帰線の近くにどれだけデータが密集しているかを示しますが、同じ密集度でもデータ数が多ければ、危険率が小さく(相関ありと言える確実性が高く)なります。極端なことを言えば、データが2点しかなければ、残差ゼロ(完全密集状態)で回帰直線に乗っていますから、相関係数は、最高の1(または-1)になります。しかし、わずかに2点では、有意であるとは言えないので、有意水準は低く(危険率は高く)なります。 (2) 回帰線の傾きは、他の2つとは無関係と思っていいでしょう。傾きが急だから相関が強いとか有意であるとかは言えません。傾きは、グラフの書き方でどうにでもなります。また、仮に、目盛りが同じであっても、特性Aと特性Bは、傾きが急でも、密集度が低くて低相関、特性Bと特性Cは、傾きが緩やかでも、密集度が高くて高相関ということは、いくらでもあります。
- rabbit_cat
- ベストアンサー率40% (829/2062)
>相関係数0.876 0.991 危険率1%で有意とはどういう意味でしょうか? いまいち、意味不明です。もうちょっと、何か追加の文言はありませんでしたか? 0.876 0.991てのは、[0.876, 0.991](範囲)ってことですか? そもそも、ここで危険率を定義するときに想定している帰無仮説はなんですか?相関がないこと?or母相関係数が[0.876, 0.991]の範囲外にあること? >また、y=2.4x-0.15が成り立ち(右上りの直線に近い)、相関係数が0.991で危険率1%で有意というのも分かる方教えて下さい。 この式からは相関係数が0.991になるなんてことはわかりません。相関係数は、直線の傾き(ここでいう2.4とか)とはまったく無関係の概念なので。別の方法で相関係数を求めたのでしょう。
補足
分かりづらくてすみません。 資料A,B(以下A,B)を対象に薬品☆と△の定量値との相関を検討し、A,Bそれぞれの相関係数が0.876 0.991 で、危険率1%で有意な相関を認めた。と書いてあります。 文献が、かなり省略されていてこれくらいしか情報がありません。 あと、y=2.4x-0.15が成り立ち(右上りの直線に近い)、相関係数が0.991で危険率1%で有意 で相関係数が0,995の間違いでした。 この式は無視してくださって結構ですので、「相関係数が0.991で危険率1%で有意」のような相関係数と危険率の関係が分かるのであれば教えて下さい。