• ベストアンサー

カイ二乗結果の見方 SPSS

今、例としてタバコを吸う人、吸わない人に分けています。 吸う人105人(期待度数102.5残差2.5)、吸わない人100人(期待度数102.5残差-2.5) 検定統計量の表を見ると タバコをすうかどうか カイ二条 .122a 自由度 1 漸近有意確率 .727 と出てきたのですが、この結果の見方が分かりません。 タバコを吸う人のほうが多いというのはなんとなく分かりますが、 残差に-がついているのはどういう意味かとか 検定統計量の表の見方とかが分かりません。 どなたかこんな初心者に分かりやすく教えてくれる人いますか キーワード 統計学 数学 心理学 SPSS 名義尺度 χ2乗

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.5

> 数字だけで見ると、半々ですけど、 > それが統計的に見ると、 > いつでもそういう結果が出るわけではないということも分かりました。 「そういう結果」とはどういう結果のことを言っているのかはわかりませんが、ご質問の事例ですと帰無仮説が棄却されず、「タバコを吸う人の割合は1/2ではない」ということが言えないので、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるとも違うとも言えない(わからない)」というような言い方しか出来ないということです。 検定の結果としては、帰無仮説が棄却されるかされないかのどちらかで、帰無仮説が棄却されれば対立仮説が支持され、棄却されなければどちらが正しいかはわからないというだけなのです。

pahonen
質問者

お礼

ありがとうございました。 仮説が棄却されなかった場合、はっきりとした結果は得られなかったが、 仮説が支持されなかったという結果だけが分かり、 それだけのことしか、それ以上のことは何も言えないということですね。 で、これは論文に書いてもいいんですよね。

その他の回答 (4)

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.4

>結果が論外ということは、 >結局これはデータとして使えないということでしょうか。   そのとおりです。使ってはいけないのです。ところが平気で使っちゃっている例が何と多いことか (>_<)   統計処理では答えは行列式がゼロにならない限り、答えが必ず出て来るのです。でもその答えが使えるかどうかが別問題だということを知らない人が多すぎるのです。

pahonen
質問者

お礼

コメントありがとうございます。 データとして使えないということは分かりました。 quaestioさんが言っていますように、 仮説は支持されなかったというような形で使用することはできますよね?

noname#227064
noname#227064
回答No.3

ANo.2の 「この検定は、1標本の比率の差の検定で、それのカイ二乗分布近似を利用した検定を行っております。」 を 「この検定は、母比率の検定で、それのカイ二乗分布近似を利用した検定を行っております。」 に訂正します。

noname#227064
noname#227064
回答No.2

> どなたかこんな初心者に分かりやすく教えてくれる人いますか 入門書等で検定の基本位は勉強するか、身近な統計に詳しい人に教えてもらうことをお勧めしますが、簡単に説明してみましょう。 > 吸う人105人(期待度数102.5残差2.5)、吸わない人100人(期待度数102.5残差-2.5) 母集団のタバコを吸う人と吸わない人の割合に差がないとすると、母集団から無作為に205人選ぶと、205/2は吸う人で残りが吸わない人になるというのが期待度数のことで、実際に得られた度数105と100から期待度数の102.5を引いた値が残差となります。 > タバコをすうかどうか > カイ二条 .122a > 自由度 1 > 漸近有意確率 .727 この検定は、1標本の比率の差の検定で、それのカイ二乗分布近似を利用した検定を行っております。 帰無仮説は「タバコを吸う人の割合は1/2である」で対立仮説は「タバコを吸う人の割合は1/2ではない」としています。 カイ二乗の数値は、 (105-102.5)^2/102.5+(100-102.5)^2/102.5 = 0.122 で求められますが、帰無仮説が正しい場合にはこのカイ二乗の数値は極端に大きな値にはなりません。 (期待値ピッタリの値が得られれば0になります。もっとも度数なのでピッタリの数値になることはありませんが) もしここで大きいカイ二乗の数値が得られた場合、「タバコを吸う人の割合は1/2である」というより、「タバコを吸う人の割合は1/2ではない」という仮説の方が確かなように思われます。 とはいえ、どの程度大きければ「タバコを吸う人の割合は1/2ではない」と言っていいのかがわかりません。 そこで、帰無仮説が正しいと仮定したときに5%しか起きないこと(極端に大きなカイ二乗の数値)が起きたら、仮説が間違っていたと結論付けることにします。 (この5%という値は有意水準と呼ばれますが、場合によっては1%や10%に設定することもあります) 帰無仮説が正しい場合で、それぞれの期待度数が5以上であれば、このカイ二乗の数値は近似的に自由度1のカイ二乗分布に従う確率変数となることがわかっています。 自由度1のカイ二乗分布において、3.841459以上の値をとる確率が5%なので、今回の例は滅多に起きないことが起きたわけではありません。 従って、帰無仮説すなわち「タバコを吸う人の割合は1/2である」が間違いとは言えません。 (正しいとも言っていないことに注意してください) 0.727という数値は、自由度1のカイ二乗分布で0122以上の値をとる確率が0.727ということです。 これが5% = 0.05よりも大きいので滅多に起きないことが起きたわけではないことがわかります。 結論としては、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるかどうかはわからない」等になります。

pahonen
質問者

お礼

詳しい解説ありがとうございます。 なんとなく?は分かりました。 数字だけで見ると、半々ですけど、 それが統計的に見ると、 いつでもそういう結果が出るわけではないということも分かりました。 もしここで大きいカイ二乗の数値が得られた場合、「タバコを吸う人の割合は1/2である」というより、「タバコを吸う人の割合は1/2ではない」という仮説の方が確かなように思われます。 ↑確かにこの方がいいかもしれませんね。 どのような結果が出たとしても、それはそれで、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるかどうかはわからない」などというように、締めくくることができるということですね。 本当は、仮説が支持されたという結論で締めくくることができればよいですが、予想外の結果がでたとしたら出たで、しっかりと結果を書くことが大事という事ですよね?

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.1

 有意確率はデータから得た結果が信頼に値するものかどうかを現わす尺度です。通常は90%以下では仮説却下、つまり得た結果を使用するのは危険ということになります。厳しいときには95%をボーダーラインにすることもあります。それが73%というのは通常の常識では結果が論外ということです。たとえば、回帰直線を作って検査したとすると、その直線は使用してはいけないということになります。  統計データから推論するときにはこの検定をやることが極めて重要で、往々にしてこれを省略し、とんでもない結論を堂々と発表している論文を度々見かけるのは嘆かわしいことです。わかりやすい例を挙げると、平均値というのはどんなデータでも簡単に計算できます。しかしそれが使えるか使えないかを検討し、信頼性があるという保証を得てからその平均値を使わなければならないということです。

pahonen
質問者

お礼

よく分からないのですが、 結果が論外ということは、 結局これはデータとして使えないということでしょうか。 使えないとしたら結果の欄になんてかけばいいのでしょうか 仮説が却下されましたと書くのでしょうか すいません、よく分かってなくて