• ベストアンサー

カイ二乗と期待値

統計の事がよくわかりません・・・ カイ二乗検定をするようにと言われて、下のところまでたどり着いたのですが、 期待値を計算できません・・・ どなたか教えていただけないでしょうか? ※すでに、今の段階で間違っているかもせんが。。。。 観測値  一致・不一致  計 A      6   15   21 B      10   8   18 計      16  23   39 期待値   一致・不一致 計 A       ?   ?    21 B       ?    ?   18 計      16   23    39 よろしくお願いいたします

質問者が選んだベストアンサー

  • ベストアンサー
  • orrorin
  • ベストアンサー率65% (88/134)
回答No.6

補足を追っていてやっと意味がわかりました。 >書きながら思ったのですが、カイ二乗と分散分析は別のものを検定していることになるような気がしてきました。 おっしゃる通り、別のものを検定しています。 カイ二乗検定は被験者の属性(学校や性別)によって自己評価の正確性が異なるかを検討しています。 一方、分散分析は性別によってストレス値に違いがあるかを検討しています。 性別による一要因分散分析をして、仮にストレス値に男女差が出たとします。 しかし、そのことと自己評価の正確性を直接結びつけることはできません。 性別を媒介にした説明(たとえば「男性は自己評価が不正確な人が多く、またストレスを感じにくい」)はありえますが、直接的には両者を関連付ける説明(「ストレスを感じにくい人は自己評価が不正確」)はできません。 >AB、CDをカイ二乗の検定と、分散分析の両方をしても意味があるのでしょうか?? これは検討したい仮説がどうなっているかによります。 検定はすべて仮説を検討するための手段ですから、そういう仮説がきちんと立てられているなら意味がありますし、そうでないならやっても仕方がありません。

go00000
質問者

お礼

ありがとうございました☆☆☆ なんとなく、何のためにどのような統計をすればいいのかが見えてきたような気がします。 後はすらすらと、発表の時に説明できればいいのですが^^: プリントアウトして、しっかり咀嚼します。 本当にありがとうございました★

その他の回答 (5)

noname#227064
noname#227064
回答No.5

ANo.4補足 > 母集団ACの不一致のストレス値と、母集団ACの一致のストレス値の分散分析を検定するという流れになりますか??  次にストレス値の分散分析をするというのがわかりません。 有意であったということは、一致と不一致の割合がAとBで異なるということがわかっただけです。 (AとBで一致と不一致の割合に差があるのかないかを検定した場合) ストレス値の話はどう関係してくるのでしょうか? ひょっとすると、カイ二乗検定以外の方法が良いのかもしれませんが、どういうデータがあるのか分からないので断定はできません。 > ちなみに、カイ二乗で「違いがあるのかどうかわかりませんでした」となると、その後にどのような検定をしても意味がないということでよろしいでしょうか??? 意味がないか、あったとしても検定の多重性が問題になります。

go00000
質問者

お礼

ありがとうございました

go00000
質問者

補足

いつもありがとうございます。後少しお聞きしてよろしいでしょうか?ごめんどうであれば、スルーして頂いて構いません。 例えば、A(小学生)B(中学生)に対して、自分の学力程度を聞く。客観的な成績と比較して、自分の学力程度が、一致しているか不一致かを、カイ二乗で検定する。ABで差がでなかったので、同じ被験者を男(C)女(D)で分けて、カイ二乗で検定する。そうすると、「割合に差がある」という結果が出たので、CDのストレス値(質問紙か算出)の得点を分散分析します。   書きながら思ったのですが、カイ二乗と分散分析は別のものを検定していることになるような気がしてきました。。。 AB、CDをカイ二乗の検定と、分散分析の両方をしても意味があるのでしょうか??それとも、何か違う方法はあるのでしょうか??  考えると、やはり頭が混乱してきます。。。。よろしくお願いいたします。

noname#227064
noname#227064
回答No.4

> どこまでが前者の部分か、どこからが後者の部分か分かりません・・・ 前者:母集団のA-一致、A-不一致、B-一致、B-不一致の割合が全部同じかどうかを検定 後者:A:Bの割合と一致:不一致の割合が独立かどうか、つまり例えばA:Bの割合は一致のときと不一致のときで異なるのかどうかを検定 統計ソフトRで質問の例を有意水準5%で検定してみると、前者が Chi-squared test for given probabilities data: x X-squared = 4.5897, df = 3, p-value = 0.2044 で帰無仮説を棄却できず、後者も Pearson's Chi-squared test with Yates' continuity correction data: matrix(x, ncol = 2) X-squared = 1.9082, df = 1, p-value = 0.1672 で帰無仮説を棄却できませんでした。 わかりやすく言えば、どちらの検定だったとしても「違いがあるのかどうかわかりませんでした」ということです。 > 違うパターンで、カイ二乗検定で有意差が出たのですが、その場合、その後の検定どのような検定になるのでしょうか? 違うパターンというのが何を意味するかにもよりますが、おそらくは残差分析をすることになると思います。

go00000
質問者

お礼

ありがとうございました

go00000
質問者

補足

早々に回答して頂きありがとうございました。適合度と独立性の違いが分かりました! >違うパターン・・・    かなりの説明不足で申し訳ありません。(違う数値・違う母集団、例えば母集団AC)カイ二乗検定で有意差がでた場合、「違いがあることが分かった」となると、母集団ACの不一致のストレス値と、母集団ACの一致のストレス値の分散分析を検定するという流れになりますか?? ちなみに、カイ二乗で「違いがあるのかどうかわかりませんでした」となると、その後にどのような検定をしても意味がないということでよろしいでしょうか??? 何度も申し訳ありません。よろしくお願いいたします。

noname#227064
noname#227064
回答No.3

母集団のA-一致、A-不一致、B-一致、B-不一致の割合が全部同じかどうかを検定したいのであれば、ANo.1に書かれているように全て9.75にしてOKです。 A:Bの割合と一致:不一致の割合が独立かどうか、つまり例えばA:Bの割合は一致のときと不一致のときで異なるのかどうかを検定したいのであれば、行と列の和が観測値と同じにならなければいけません。 前者は適合度の検定で、後者は独立性の検定となります。

go00000
質問者

補足

おお・・・。また、何か分からないことが出てきました。 どこまでが前者の部分か、どこからが後者の部分か分かりません・・・ 後、今回の数値では、有意差が出ませんでした。 SPSSの操作でカイ二乗検定にかけることができました^^ 有意差がでなかったという事は、それで終わりなのでしょうか。 違うパターンで、カイ二乗検定で有意差が出たのですが、その場合、その後の検定どのような検定になるのでしょうか?分散分析とかでしょうか?? 違う質問になり申し訳ありませんが、続きが知りたいです。。。。 よろしくお願いいたします。

  • orrorin
  • ベストアンサー率65% (88/134)
回答No.2

>縦と横の合計が合わないのですが・・・ そもそも、カイ二乗検定ではそのような合計は使いません。 繰り返しますが、必要なのはクロス表のセルごとの期待値と実際の観測値だけです。 全体の合計(今回は39)を帰無仮説に従って振り分けたものが、期待値になります。 そして、多くの場合帰無仮説は「セルごとに特別な偏りはない」となりますので、期待値はすべて同じ、すなわち全体の合計をセル数で割ったものになります。 ですから、本来計算する必要もないのですが、仮に期待値の縦横の合計が観測値と違っていても問題ありませんし、逆に合計が一致していてもパターンが違えばそれは有意な差として検定に引っかかります。 こちらのベストアンサーが、具体例もあってわかりやすいかと思います。 http://okwave.jp/qa/q937856.html

go00000
質問者

お礼

人のやっている計算に当てはめていたので、基本がなっておりませんでした^^: 紹介して頂いた具体例も分かりやすかったです。 ありがとうございました。 なんとなく理解ができました。人に説明するまでに至りませんが・・・ 統計を理解できる人がうらやましいです☆

  • orrorin
  • ベストアンサー率65% (88/134)
回答No.1

カイ二乗検定では、各セルの数値が、普通に考えて得られるであろう値になっているかどうかを検討します。 じゃあ普通とは何かってことですが、一般にはシンプルにセルの数で等分すればOKです。 4つセルがあるので、何もなければ各セルには全体の25%の9.75が期待値として入ります。 そしてこの9.75と実際の観測値を比較するのがカイ二乗検定です。 なお、もし比率についての事前情報があれば(たとえば、利き手のように偏りがある基準で群分けをしていた場合)、それに応じて期待値を修正します。

go00000
質問者

お礼

ありがとうございました

go00000
質問者

補足

ありがとうございます。 すごくシンプルなんですね。 私の理解不足であろうと思いますが、各セルに9.75が期待値として入るのであれば、 期待値   一致・不一致     計 A       9.75   9.75    21 B       9.75   9.75    18 計      16    23     39 縦と横の合計が合わないのですが・・・ もしくは、期待値の縦横の合計は、観測値と違っていいのでしょうか? 比率の事前情報に関しては、「認識の一致不一致」客観的認知と主体的認知のズレをみています。 よろしくお願いいたします。 もうすぐ中間発表会があり焦っています。焦るとうわべの理解ですっ飛ばしそうですが、どうにも理解力が乏しくて。。。。

関連するQ&A