- 締切済み
2群間の比較
2群間比較で教えて下さい。1年間分のA施設に入所したヒトの数と風邪の治療回数(延べ)の月別データを取得しました。その翌年から、入所したヒトには全員乾布摩擦をしてもらい、同じように入所人数と治療回数の月別データを取得します。比較したいのは平均治療回数(治療回数/入所人数)に差があるかどうかです。入所するヒトの年齢は一定で、A施設には毎月複数のヒトが入所してきて、その数は特に規則的なものではありません。 (延べ治療回数とありますが、月に何回も風邪をひくようなヒトはいない、と思われるかも知れませんが、これは例なのでご了解下さい) このような差を検定する場合にはどのような方法が適切ですか。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
ANo.4 > もし,あくまで符号検定するなら,回答No3のような単純な符号検定でなく,Wilcoxonの符号付順位和検定をするべきでしょう。 符号検定が検出力の高い検定方法ではないことをわかってはいましたが、平均治療回数の分布についてなにもわからないためあえて符号検定としたのです(正規性はともかくとして、等分散性は満たしているのでしょうか)。 カイ二乗検定の使用の是非については、ANo.4を読んでから考えてみたものの > 治療回数の母比率= 40/52 = 0.769 からして求める意味がわからないので、明白と言われても理解できません。 > 治療回数 人数 > 1年目10 5 > 2年目30 7 > 合計 40 12 1年目は10人治療を受け、5人は治療を受けなかったというようなデータなら理解できるのですが、10は治療回数で、5は入所人数の意味ですよね。
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
回答No3は検定法を誤解しているような気がします。 >その母比率はなにを意味していますか? この質問自体が変ですね。 カイ二乗検定で母比率とは,全体数に対する,それぞれの項目の比になります。 治療回数 人数 1年目10 5 2年目30 7 合計 40 12 全合計が52なので, 治療回数の母比率= 40/52 = 0.769 は明白です。 >月に同じ人が複数回風邪をひくという極端な場合、入所人数を超えますよね。 >とてもカイ二乗検定を使うべき例ではないと考えます。 全く問題ありません。 例えば, 1年目5人で10回 2年目5人で20回 なら,2年目のほうが,一人当り2倍も治療を受けていることを示すからです。 ここで示されたカイ二乗検定は,一人当たりの治療回数(つまり比)の検定であり,十分可能です。 回答No3は何か「比」の意味を勘違いしてるのでは? 何人が治療するか,の問題でなく 一人当たり,何回治療するか,を検定しているのです。 複数回ひいても,何も問題ありません。 >符号検定した方がましのような気がします 全然違います。 単純な符号検定は,差の大きさが考慮されないのです。 例えば, 1.1 1.2 + 1.1 2.5 + と,明らかに,下のほうが差が大きいのに,ともに+と出てしまいます。 このような検定を,「情報が無駄になる検定」と言います。 例えば下記のページに符号検定の解説があります。 http://homepage2.nifty.com/halwin/pairtest.html そこには, 符号検定は、このように測定値の大小、もしくは結果の良否といった質的な情報のみを用いて検定を行っている。そのため、数値自体を用いるt検定に比べ、検定の効率はよくない。もとのデータが質的なものでない場合、特別な理由がない限り、後述のWilcoxonの符号付順位和検定か、前述のt検定を用いるほうがよいだろう。 と,ちゃんと書かれています。 ここで言う,「質的な情報のみを用いて検定」というのが,情報が無駄になる検定の意味です。 もし,あくまで符号検定するなら,回答No3のような単純な符号検定でなく,Wilcoxonの符号付順位和検定をするべきでしょう。 しかし,上述のように,カイ二乗検定できます。
難しそうな質問でしたので回答を控えていたのですが、 気になるところがあったので確認します。 > 観察値治療回数人数 > 1年目10 5 > 2年目30 7 > 期待値11.53846154 3.461538462 > 28.46153846 8.538461538 > > 母比率 0.7692307690.230769231 カイ二乗検定を使って検定をしていますが、その母比率はなにを意味していますか? 入所した人が風邪をひく確率ですか? あなたがしたいのは平均治療回数の比較であって、比率の比較ではないですよね。 述べ治療回数とのことなので、月に同じ人が複数回風邪をひくという極端な場合、入所人数を超えますよね。 とてもカイ二乗検定を使うべき例ではないと考えます。 良い検定方法が思い浮かびませんが、乾布摩擦実施前後の月ごとの平均治療回数について符号検定した方がましのような気がします。 検定例 平均治療回数 月 乾布摩擦実施前 後 1 1.08 0.92 - 2 0.11 1.01 + 3 0.82 0.82 0 4 1.07 1.40 + 5 0.79 0.17 - 6 1.15 0.12 - 7 0.98 0.43 - 8 0.15 0.92 + 9 1.67 0.39 - 10 0.99 1.48 + 11 1.98 1.73 - 12 1.33 1.31 - 帰無仮説は、「1月から12月のそれぞれの平均治療回数は、乾布摩擦の実施前後で変化していない」で、対立仮説は「乾布摩擦実施後の平均治療回数は減少する」で、実際に減少した月を数えると7つありますが、p値が0.27なので有意水準5%では有意差は認められません。
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
期待値も母比率も正解です。 しかし,なぜかchi^2の値が間違いで,したがってpも違います。 chi^2={(各観察値ー期待値)^2/期待値} の総和 です。 治療回数 人数 1年目 0.205 0.684 2年目 0.083 0.277 これらの総和 chi^2=1.249 p=0.26>0.05 有意差なし となります。
お礼
エクセルのセルをまちがって指定していました。ご指摘の通りです。どうもありがとうございました。
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
要するに,比の差を検定したい,ということですね。 だったら,通常は,カイ2乗検定です。 治療回数と人数を年毎に,例えば次のような表にして検定します。 治療回数 人数 1年目 10 5 2年目 30 7 3年間以上の比較もできます。 EXCELでも出来ます。
お礼
ありがとうございます。カイ二乗でいいんですね。勉強になります。上記の例ですが、せっかくなので計算してみました。あってますか? 観察値 治療回数 人数 1年目 10 5 2年目 30 7 期待値 11.53846154 3.461538462 28.46153846 8.538461538 母比率 0.769230769 0.230769231 x2cal=4.589142989 P<0.05
お礼
ありがとうございます。ご指摘の「比率」ですが、なぜ比率にしたのかというと治療数のデータが「延べ」しかないということと、毎月の施設入所人数が不規則であるため「延べ治療数」のみで比較をしても入所人数が異なればその数値に影響がある、と考えていたからです。 符号検定勉強してみます。