- ベストアンサー
統計でこまってます
ある地方に住む,13か国の外国人(属性はバラバラ)の生活行動に関するアンケートをしたのですが,分析方法に迷っています。A国人(200人)とB国人(20人)の主婦の行動の違いをしりたかったので,A国人とB国人から主婦群を抽出して,それぞれの行動の累積変数をT検定してみました。その有意差には意味があるでしょうか? .
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
>有意差には意味があるでしょうか? 無い。 t検定の前提条件を思いだすべし。データを得るときにランダムサンプリングをしたのか、などナド、お望みなら、初めての質問に対して嫌みになるが、問題点を指摘出来そう。 「データを得る前に統計的な処理をする」と、まともな統計の教科書には書いてあるハズ。データがあるので、というのは、順序が逆。
その他の回答 (2)
- kgu-2
- ベストアンサー率49% (787/1592)
No1です。嫌味たらしくなりますが、 >主婦の行動の違いをしりたかったので, 違い、となると、検定という統計処理になります。これは、この場合、A国とB国の2つのグループ(2群)の比較になります。多群となると、多重比較になり、初心者と思える人がやろうとすめるのをこのトピでも読んでいますが、大胆。夏服で冬山に登るようなもの。 >行動の累積変数 なにかを足したのでしょうが、意味がありますか。アンケートの数字は、おそらく順序尺度です。1円を持ったヒトが5人集まれば、5円。悪いが1なら、そんなヒトが5人集まって5、すなわち良い、になるわけではありません。アンケートの数字は足し算しても無意味です。 >アンケート これは、簡単にできるので、と書きたいのですが、あとの統計処理を考えず、いい加減を通り過ぎ、出鱈目にするから、簡単。 まず、統計(検定)で差を出すには、両群の基本的な状況を一致させないと話になりません。性別、年齢、生活環境など。そして、一つの要因だけ相違があれば、原因として、その要因によると考えます。この場合は、国籍ですから、性別、年齢、身体的能力、生活環境、経済状況など、調査項目に影響しそうな要因は、全て同一にする必要があります。 普通は、これを満たすためにランダムサンプリングという方法をとります。そして、アンケートを全て回収する、そして数千人規模でする必要があります。「食物繊維は、ガン予防に有効」という話は、FDA(だったと記憶)が、数十万人規模の調査で「効果は見られない」と判定しました。効果あり、の研究は、せいぜい数百人なので、調査対象に偏り(バイアス)があったハズです。ヒトを対象とした研究は、最小でも各群数百人はないと、相手にされません。質問者は20人ですから、とてもとても。ランダムサンプリングをキチンとしていればOKですが。 以下は、書き込まれていないので、合っているかどうか分かりませんが。 アンケートの回答が、数字に丸をつける場合、1から5だと、3のヒトが多いことが知られています。今では、1から6にすることが多いようです。さらに、この数字は、順序尺度ですから、平均を求めても意味は無いと考えています。t検定は、平均値の差について計算ですので、意味のない平均の差の検定なんぞ噴飯ものです。 調査も、対面の場合と郵送で、結果が違ってきます。特に、回収率は、どちらも100%ではないでしょう。 駄目押しになりますが、アンケートの結果は、その場限りの結果でしかなく、しかも比較するには、信頼できない、ということです。 学生さんか院生さんの気がします。私は、何度も痛い目に合って勉強しました。40年ほとやって、未だに初心者を卒業できたかな、程度です。悪意はありません。精進と工夫、でしょうか。
お礼
くわしく説明してくださって、ありがとうございました。 やはり調査の設計の段階で、もっと時間をかけるべきでした。最後の「アンケートの結果はその場限りの結果でしかなく・・・・」というところは、きびしいごいけんとして真摯にうけとめます。失敗をくりかえして、勉強していかねばと思いました。 最後にランダムサンプリングのことですが、調査の対象者によって非常に難しいです。日本人の場合は、住民基本台帳を利用できますが、外国人はそのような手法ができいないので、外国人を対象とした大規模調査はできない状況です。
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
No1に同意,補足です。 >累積変数 なんのことか不明です。そういう用語はありませんが・・・ 累積度数のこと? 度数のT検定というのも不明です。 T検定は,t検定ですか?たとえ文の先頭でも,大文字にしません。 t検定は平均の差の検定で使われ,累積~の検定には用いられません。 13か国調べたのに,なぜA,Bのt(?)検定でしょうか? 最初から特定の2カ国ずつt検定することは望ましくありません。 それは多重検定の対象です。
お礼
初心者の質問にお答えくださって、ありがとうございました。
お礼
初心者の質問に答えてくださってありがとうございます。ご指摘はごもっともで、今になって反省している次第です。質問中の「累積変数」は「累積平均値」の書き間違いです。 よろしければ、問題の根本を指摘してもらえますか。よろしくお願いします。