- ベストアンサー
カイ二乗検定とマクネマー検定について
例えば、肺がんの発生と喫煙の関係の研究をするために、ケースコントロール研究をする場合、ケースとコントロールを性や年齢でマッチングした場合は、ピアソンにカイ二乗検定を使用できないのはなぜなのでしょうか? 清書にそのような時はマクネマー検定を使うのがのぞましいとあるのですが・・・・ 統計学の知識が少なく、その理由がわかりません。 よろしければ、教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
基本的にはPearsonのχ2検定は行側と列側に対応のない場合、McNemar検定は対応のある場合に用いられる方法だからということですが、なぜ対応のない場合の方法を、形式的には適用できるのに、そのまま用いてはいけないかということについてお話します。 ケースコントロール研究においてマッチングを行った場合、マッチング要因が交絡要因になっていると(実際においては程度の差はあれほとんどそうだと思いますが)マッチングを考慮しない解析では結果にバイアスが生じる事が知られています。これはケースコントロール研究の場合、コントロール群における暴露割合が対象集団における暴露割合を表すと考えることに起因します。マッチングを行うとマッチング要因が対象集団の分布とは異なったものになってしまうのです。極端な例では、暴露要因と完全に相関する要因、即ち暴露要因そのものでマッチングを行い、マッチングを考慮しないで解析すると暴露要因のオッズ比の推定値は必ず1になります。逆に暴露要因と全く相関のない要因でマッチングを行った場合はバイアスは生じません。 このような理由から、ケースコントロール研究ではマッチングを行った場合は必ずマッチングを考慮した解析を行うべきとされます。一般的には層別解析のMantel-Haenszel法が応用され、1:1マッチングの場合は結果的にMcNemar検定と同一になりますので、できればMantel-Haenszel法を学習された方が応用が利くかと思います。 念のため申し上げると、ご質問の内容とχ2分布の適用可能性は関係ありません。検定したい帰無仮説(今の場合は対応のあるデータの暴露要因に関するオッズ比が1に等しいという)、に応じた検定統計量を用いなければならないということです。その統計量がどのような分布に従うかはまた別の問題になります。Pearsonのχ2検定、McNemar検定、Mantel-Haenszel法のいずれも検定統計量が帰無仮説の下で近似的にχ2分布に従うことを利用していますし、最近の統計ソフトではχ2近似を用いずに直接確率や経験分布関数といった方法を用いてP値を求めることもできるようになっているものもあります。
その他の回答 (2)
- selfer
- ベストアンサー率76% (104/136)
こんにちは. データを解析するために,様々な手法が開発されています.そのため,データ解析を行うためには,多くの手法の中から適切な手法を選択する必要があります. 質問者さんの疑問は,手法を使い分けるための重要な基準の一つである「対応の有無」に関するものですね.質問文では「対応あり」を「マッチング」と表現されています. 現在では数多くの手法が開発され,比較的様々な場面でも適切な手法が用意されています.そのため,普段は意識できないのですが,本来,統計の手法は「対応なし(非マッチング)」にほとんど限定されていました. 統計手法においては,「○○という結論は△△%で……」という確率の形で何らかの結論を提出することができます.この確率を求めるためには「××確率分布」なるものを利用するのですが,多くの分布は「独立(対応なし)」を前提にして開発されています.対応ありの分布は,計算が複雑なためです. χ2検定というのは,χ2分布を利用する統計手法ですが,このχ2分布も「独立性」を前提にしています.このため,χ2検定は「独立/対応なし」データの分析に対して使われるのが基本となり,対応ありデータには【そのままでは】使えないわけです. さて,独立データに対するデータ分析法はともかくとして,非独立データに対しても何らかの分析を行いたいという要望がでてきました.しかし,非独立性(対応あり)に基づく確率分布は,計算が非常に困難です.理論的にはそのような確率分布を算出することは出来るのかもしれませんが,そのような方法は非効率的なので,現在ある「独立性」の確率分布を「何らかの修正」を行い,対応あり(マッチング)のデータ分析を開発することになりました.修正式にはいろいろあるのですが,その一種として「マクニマー検定」が挙げられます. 簡単に言えば,確率分布は独立性が本来の姿であり,χ2検定はその分布を比較的素朴に利用した検定法,マクニマー検定はその分布に修正を行った非独立的な検定法といえると思います.
お礼
なるほど。よく分かりました。ありがとうございました。
- Ideasforlife
- ベストアンサー率40% (63/155)
分野のバックグランドがないので、よくわかりませんが... カイ2乗検定を適用するための、分布の仮定を満たさないんじゃないですか?というか、これは、対応関係のある事象における比率を問題にするのだと思いますので、マクネマー検定がいいということでしょう。
お礼
どうもありがとうございました。また何かありましたら教えてください。
お礼
よく分かりました。ありがとうございます。