- 締切済み
統計で「不明」の扱い方について
よく数表やグラフなどで、アンケートの回収結果から「不明」を含めた形で表しているのを見掛けますが、不明を考慮したうえでグラフはどのように見れば良いのでしょうか? 例えば100人に「この半年間で訪問した観光地先」ということを聞いた場合、1.タイ:42人、2位.香港:37人、3位.その他:10人、不明:11人だとします。これが昨年の結果だと、1位.香港:43人、2位.タイ:42人、その他:10人、不明:5人だとします。 この場合、数字が変わっているのは香港と不明で、香港は43人⇒37人(6人減った)、不明5人⇒11人(6人増えた)、という結果なのですが、これは単純に不明の増えた減ったは考えずに時系列で見て、香港へ行った人が昨年よりも減ったと捕らえるべきなのか、不明に落ちた人の割合が増えたので、香港に行った人が減ったかどうかわからないので、黙認する・・ということが良いのか、データの見方で混乱しているので、教えていただけたらと思います。 長文で申し訳ないですが、よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- hatake333
- ベストアンサー率66% (36/54)
「この半年間で訪問した観光地先」の回答として, 不明というのは不適切な返答ですから,標本の母集団100人から不明者数は除いて割合をとり,比較するのが妥当ではないでしょうか? つまり, 今年の香港の割合 37/(100-11) = 0.415 昨年の香港の割合 43/(100- 5) = 0.452 それで,上の割合が「香港へ行った人が昨年よりも減った」と結論するために 十分な違いが(有意差)があると判断できれば,減ったのでしょう. しかし,少なくとも標本数をもっと増やすべきでしょうし,標本は完全にランダムに選ばれていることが前提です. また,有意差については事前に妥当なものを用意しておかなければなりません.