- ベストアンサー
量的データの独立性について
質的2変数の独立性は(χ2乗分布を使った)独立性の検定が可能かと思いますが,量的2変数の独立性について検定する方法はあるのでしょうか? (無相関の検定しかできない,あるいは量的データをカテゴリ別に分けて質的データにするような方法しかありませんでしょうか?). ご存知の方,ご教授願いいたします.
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは.いまいちどのレベルでのお悩みなのかわかりませんが,試しに回答してみます. データ解析法の目的は大雑把には「差異を調べる」と「類似性を調べる」に二分類できます.質的二変数の場合,具体的には以下のような手法を用います. 差異の統計法:χ2検定(いわゆる「独立性の検定」) 類似の統計法:連関係数の分析 ただし,連関係数が計算上「χ2値」を用いるために,質的データ分析の場合においては,χ2検定も連関係数の分析も,実は同じことを調べていることになります. さて,「独立性の検定」という言葉はなかなか難しいです.狭義では,質的データ分析における「ある変数内の複数カテゴリ間の比に有意差があるかどうか」という固有名詞を意味しております.対して広義では,「そもそも独立性とは何か?」という問題から,広範囲の手法をカバーせざるを得ません. 要するに,「独立性の検定」の持つ意味が広すぎる,ということになります. 「無相関の検定」という言葉を書かれていることから,「独立性=相関的な関連性がない」と捉えるのであれば,ピアソンの積率相関係数に関する一連の統計手法が使えます.無相関の検定もこの一種です.あるいは偏相関係数や,回帰係数を初めとして,多変量解析も使うことができるでしょう. あるいは,「独立性=ある変数のカテゴリともう一方の変数の数値との関連性がない」という意味で捉えると,t検定,分散分析なども広い意味では独立性の検定に含まれてしまいます. 「量的データの独立性を調べる統計手法を教えてくれ」と言われても,回答者側としては「それじゃあ,統計法を教えてくれ,と言われるようなもので漠然としすぎている」と思ってしまいます.そのため,回答が付きにくいのでしょう. もう少し,具体的に何を調べたいかを教えて下されば,適切な回答も付くのではないでしょうか?
補足
ご回答ありがとうございます! 確かにおっしゃるように「独立性」という意味が曖昧ですね. 「独立性=相関的な関連性がない」と捉えることも出来ると思いますが,「独立=同時分布が周辺分布の積に等しい」という定義と検定方法との関連が,私にとって明確に理解できていなかったようです. そもそも,質的2変数(クロス表)では「独立性の検定」があるのに,量的2変数(散布図)では「無相関の検定(ピアソンの積率相関係数など)」しか統計のテキストに載っていない点が私の疑問だったのですが,その後調べてみて,ピアソンの積率相関係数だと同時分布が2変数正規分布に従っていることを仮定しているので,無相関=独立,すなわち無相関の検定は独立性の検定を含んでいると考えて良いと解釈したのですが,この考え方は正しいでしょうか?あるいは2変数正規分布に従っていない場合には,ピアソンの積率相関係数を用いることは不適切なのでしょうか? 度々申し訳ありませんが,ご教授お願いいたします.