- 締切済み
カイ二乗検定の両側片側の選択、少数例の対応
SPSSを利用しています。 カイ二乗検定について教えてください。 変数1のYesNoにより、変数2のYesNoが変わると想定しています。 変数1「広告をよく見る」でYesなら、変数2「広告を見て○○を買ったことがある」でYes、のような感じです。 (1)この場合、変数1でYesなら変数2でYesになる可能性が高いので 片側検定でよいのでしょうか。 もし変数1が「新聞をよく見る」の場合は、新聞を見るからといって広告を見て○○を買う可能性が高いとはいえないので、両側検定になるのでしょうか。 正直、両側・片側の概念がよく分かりません。 (2)少数例のセルがあるときはどうすればよいのでしょうか? 補正をやるらしいのですが・・・ 以上2つの質問のいずれでもよいので お分かりの方教えていただけると助かります。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- backs
- ベストアンサー率50% (410/818)
> すみません、OKWaveからの「回答があった」とのメールがなぜか昨日届きまして、せっかくご回答頂いたのに気づいておりませんでした。 なぜか私のところにも回答の補足がありましたメールが来ていなかったです。だからかなり放置してしまいました(もう問題が解決していたらゴメンナサイ)。 > 私が確認したい仮説は、「商品を買った人は買わなかった人に比べ、広告を見た人の比率が高い」ということです。 これは2*2分割表の独立性の検定ですね。行が広告を見たか見ないか(=A要因),列が購入・非購入(=B要因)です(ex.広告を見て購入した人数=90)。 [90][15] [30][60] これをRという無料の統計ソフトで行うと, カイ自乗値 = 53.9873, 自由度 = 1, p値 = 2.018e-13(限りなく0に近いということです) となります。 この結果として,「A要因とB要因は互いに独立である」という帰無仮説を棄却できるので,最終的に「商品を購入したお客さんは広告を商品を購入していないお客さんに比べて多く見ている」といえるわけです。 余談ですが,統計学においてあまりパーセントスタイルは好みません。比率(あるいは百分率)を表す場合は0.60987のように小数点で表します。
- backs
- ベストアンサー率50% (410/818)
2*2分割表であれば片側検定も可能です。両側検定は2変数の関連を確かめるためのものだとしたら,片側検定は関連の方向性を確かめたいときに用います。例えば広告を見て商品を購入した度数をP1,広告を見ないで商品を購入した度数をP2とします。ここで対立仮説H0:P1>P2(あるいはP1<P2)を採用したい場合には片側検定をするということですね。 少数例がある場合はフィッシャーの直接法(Fisher's exact test)を適用するのです。それともイェーツの補正のことでしょうか? いずれにしても 「心理学のためのデータ解析テクニカルブック」北大路書房 という本にかかれています。
補足
すみません、OKWaveからの「回答があった」とのメールがなぜか昨日届きまして、せっかくご回答頂いたのに気づいておりませんでした。 以下、初心者につきかなりとんちんかんなことを書いているかもしれませんが・・・ 知人に聞いていた話は、「カイ二乗検定で分かるのは『2変数に関連がないとはいえない』ということだけ。どういう関連があるかはクロス表を見て解釈する」というものでした。 しかしbacksさんのお話だと、両側で「関連がある」かが分かり、片側で「方向性」が分かるということなので、まずここから私の理解が間違っていたのかもしれません。 backsさんの例で説明します。 変数1:広告。見たか否か。変数2:購買。商品を買ったか否か。 クロス表の行・列・計の度数比率は次のようだったとします(数字は適当です)。 買った 買わなかった 合計 広告を見た A広告の% 60% 40% 100% B購買% 30% 10% 20% 広告を見ていない C広告の% 20% 80% 100% D購買の% 70% 90% 80% 合計 広告の% 40% 60% 購買の% 100% 100% 私が確認したい仮説は、「商品を買った人は買わなかった人に比べ、広告を見た人の比率が高い」ということです。 そこで、両側検定で有意だと確認されたら、クロス表を見て仮説の正しさを確認しておりました。具体的には 変数2(購買)の人数比率は40%と60%。だがBは30%と10%だし、Dは70%と90%。つまり「見た&買った」と「見ていない&買っていない」のセルの比率が高まっている。だから変数1と2の関連の方向性はこのとおりとなる という考え方をしておりました。間違っていますか? なお、SPSSでは片側は「Fisherの直接法」というところしか表示されません。片側検定の場合は、少数例でなくてもここを見るという理解でいいでしょうか? いろいろ分からないことだらけですみません。
お礼
補足への新たな回答が得られませんでしたが、自分なりに解決できたので回答を締め切ります。 「方向性はクロス表で解釈」という私の認識は 間違っていなかったようです。 ただ、一方向のみを想定する場合は片側、そうでない場合は両側ということでした。 例によると、「広告をを見た・製品を買った」という方向性のみを考慮するなら片側、 これにに加えて「見ない・買わない」という方向性も考慮したい場合は両側のようです。 あと、イェーツの補正はSPSSにちゃんと表示されていました。2×2のクロス表の場合は自動で表示してくれるそうです。 なんだか自分で回答をつけるということになり、また100%正しいという自信もありませんが・・・ とりあえず、backsさん有難うございました。
補足
早速のご回答ありがとうございます。 > あまりパーセントスタイルは好みません 知りませんでした(そのくらい初心者です)。ありがとうございます。 p値が0.05以下なので > 「A要因とB要因は互いに独立である」という帰無仮説を棄却できる ここまでは分かります。 私が分からなかったことは、では「どのように独立でない」と言えるのかという方向性の話でして。 質問前の自分の考え(1)では、 「両側検定でp値が有意ならクロス表を見て解釈。 この場合は広告見た&購入の度数と、広告見ない&非購入の度数が期待度数より多いので、この方向性が確認される」 というものでした。 ですが、前回の質問へのbacksさんのご回答では (2)「両側では独立でないということが分かるだけ。方向性は片側検定で確認」ということでしたよね? (1)と(2)はどちらも同じ方向性を見ていると思うのですが、 クロス表で解釈するのと、片側検定の値が有意かどうかで確認するのと、どちらが正しいかという質問でした。 なお、(2)の場合、片側検定のp値はSPSSでは「Fisherの直接法」という行にしか表示されません。ここを見るということでよろしいでしょうか? あと、少数例の話はFisherの直接法というのがあるらしいのは分かりました。それと別に、2×2のクロス表だとイェーツの補正をしたほうがいいらしいのですね。今回は2×2なのでこの補正をした方がよいのでしょうが、もしSPSSでの補正のやり方をご存知なら教えていただけると助かります(参考文献が今すぐ手に入らないのです)。