- 締切済み
統計解析法の選択について
統計初心者でまだまだ勉強を始めたばかりです。 エクセル統計を購入したのですが、3つの疾病でそれぞれのあるデータ(血液データなどの数値)の平均値の差の検定、 またそのデータを異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい場合、 後者は独立性の検定(χ2検定)でよいのでしょうか。前者に関しては何が最もよいかわかりません。 初歩的な質問で申し訳ありません。周りに相談できる人がいなく質問させていただきました。 よろしくお願い致します。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
>3つの疾病で 疾病どうしの比較に意味がありますか。ガン患者と肝硬変の患者の血圧を比較しても、意味があるとは考えられません(意味があることを明示できれば、りっぱな論文になります)。一つ一つの疾病について比較するのが、一般的です。 統計は、A集団とB集団の2つに絞った方が簡単で、説明もしやすくなります。疾病の場合は、健常者(A集団)と患者(B集団)について比較します。データのある人が、患者かどうか不明なのですか。 健常者と患者との比較なら、データが正規分布をしていると想定できるならt検定、想定できないならF検定が一般的です。これならエクセルでできます(それぞれ関数のTTEST,FTEST)。その他に、U検定も有力な方法です。がエクセルには無いようです。 >そのデータを異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい場合、 解析に意味があるとは思えません。何と何を比較したいのかが不明です。この4群で比較するのなら、解析しないでも、正常者が一番多い、というのは自明でしょう。もっとも、メタボ検診のように、血圧を140だか135だかに下げれば、異常者だらけになりますが。 そもそも、疾病の程度はどのように判別しているのですか。それとどの程度一致するのか、の解析の方が意味があるのでは。 検定は、集団を設定して、それを比較します。疾病だと、健常者と患者でしょう。どの集団とどの集団を検定すれば意味があるのか、をまずお考えください。臨床検査関係の論文か雑誌には、山ほど発表されているハズなので、それに目を通されて、似たものを真似ることから始められることをお勧めします。
- backs
- ベストアンサー率50% (410/818)
基本: どのような実験計画(調査計画)に基づいてデータを得たのかによって、適切な分析手法というものは決まってきます。逆にいえば、適切な解析法を把握せずにデータをとることは、もはや適切な方法を用いてデータを扱うことができないということ(結果として適切な方法を用いることができることもありますが)。 > 3つの疾病でそれぞれのあるデータ(血液データなどの数値)の平均値の差の検定 どのようなデータが得られているのか、それがハッキリしなければ"最もよいか"ということは分かりません。古典的には「k群の平均値の差の検定」として分散分析が用いられますが。 > 異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい 独立性の検定が適切かもしれないし、そうでないかもしれません。ただ、多くの場合は比率の差の検定が行われることもあるということです。 ・どのような尺度水準をもつデータが得られているのか? ・そのデータは連続型なのかカテゴリカル型なのか? ・独立なのか対応ありなのか? ・従属変数は何か、独立変数は何か(どのような変数があるのか)? この辺りをまとめて質問をすると、より的確な回答も得られるかもしれません。
お礼
丁寧なご回答ありがとうございました。 情報の足りない質問で申し訳ありませんでした。 3つの疾病→例えばある地域の心筋梗塞、脳梗塞、閉塞性動脈硬化症。 血液データ→GFR(腎機能)とした場合、それぞれの患者で数値で表せるので間隔尺度データということになり、平均値を検定するのはそれぞれをt検定でだすしかないのでしょうか。 指摘していただいたご回答を参考に勉強します。 ありがとうございました。
お礼
親切なご回答ありがとうございました。 健常者との比較を考えていませんでした。 いくつか論文を読んで勉強します。