- 締切済み
区間推定、尤度、検定などを利用して
区間推定、尤度、検定などを利用して 以下の事を求めたいと思っていますが、なかなか求まらずにここ数日間四苦八苦しております。 ####【問題】############################ 今、AさんとBさん2人がいます。 「Aさんは "イケメン" だと思いますか?」という質問を 200人に聞いたら80人が「イケメンだと思う」と回答しました。 次に、それとは別に「Bさんは "イケメン" だと思いますか?」という質問を 32人に聞いたら30人が「イケメンだと思う」と回答しました。 この場合、AさんとBさんはどちらが "イケメン" でしょうか? #################################### 自分の考えた感じだと下記の様になると思うのですが・・・・・ 母集団の中でAさんを "イケメン" と回答する割合はp1、 母集団の中でBさんを "イケメン" と回答する割合はp2だとします。 この場合、p1およびp2は未知なわけですから、サンプルから推測を試みます。 Aさんを "イケメン" と言った人は、 200人中80人いる訳ですから、 この場合、割合は 80/200 = 40% ・・・・・(1) となります。 Bさんを "イケメン" と言った人は 32人中30人いる訳ですから、 この場合、割合は 30/32 = 93.75% ・・・・・(2) となります。 ここで、これらのサンプルからp1、およびp2を区間推定します。 その結果、例えば95%の確率で a < p1 < b c < p2 < d と判断出来た場合、 区間aから区間bまでの間は正規分布になると思います(区間cから区間dまでも同様に正規分布)。 そこで、この2つの正規分布の差の合計値を求め、 その値が大きい方が "イケメン" である。 大体このように考えておりますが、 具体的な "イケメン" らしさというような数値を算出する事はできないでしょうか? 今、自分では出来ずに困っています。 つまり・・・・ Aさんの "イケメン" らしさは θ1、 Bさんの "イケメン" らしさは θ2。 この時、 θ1 > θ2 である。 したがって、Aさんの方がBさんより "イケメン" である。 というような形で判断したいのですが・・・・ 正しい、算出の仕方が判る方いらっしゃいましたら、 是非ともご教授下されば助かります。 よろしくお願い致します。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
目的を明確にするべき。 1)Aさんが、イケメンかどうかを判定したい。Bと比較はしない。 2)AさんとBさんと比較したい。これは簡単で、実際にはおそらく統計学は不要。統計学を適正に使えば、明解。 1)と2)を同時にできるのは、統計の玄人。私のような初心者は、別々にします。 ただ、日本人全体が母集団というなら、そこから200人、32人規模の調査対象者を適切に選択するのは、無理。視聴率調査は、専門家であるにも関わらず、会社によって違った結果もでます。モニターの人数は、もっと多いハズです。すなわち、日本人全体から対象者を適切に選ぶのが難関で、このような小人数の調査では、難しいことは、視聴率あるいは政党支持率調査で明白。 もっと整理をして、ご質問してください。そして、統計の専門家に直接ご相談ください。
- kgu-2
- ベストアンサー率49% (787/1592)
「このデパートは、良いと思うか」の問いを、田舎で一つしかない200人と、東京で32人にしたら、結果を同じように評価するのは、誤りでしょう。田舎の方が有利です。「登山して、パーティーに女性がいると、その女性と親しくなった男性は妬まれる。しかし、下界に降りると、親しならなくて良かった」と思うそうです。無人島で一人暮らしの時に、女性がひとり漂着してきたら贅沢は言えません。 根本的な問題があります。というより、間違いと考えます。 200人は小学生、32人は老人、に質問したとします。「キムタクは、イケメンか」と。これでは、結果は信用できません 調査対象は、同一にする必要があります。 いろいろ方法はあります。 2人の優劣なら、「どちらがイケメン」か、でAかBを選んでもらって、一人でも多い方がイケメン。この例なら、それで十分です。統計学的には、不十分ですが。
補足
> 200人は小学生、32人は老人、に質問したとします。 >「キムタクは、イケメンか」と。これでは、結果は信用できません > 調査対象は、同一にする必要があります。 すいません、質問の内容に不足があったようですね。。。 一応、私の中では調査したい対象は同一のつもりです。 どちらも、日本人全体を母集団と設定しているつもりです。 Aさんに関しては、200人というサンプル数(標本数)で、 Bさんに関しては、32人というサンプル数(標本数)という設定です。 したがって、求めたい値は 母集団の中でAさんをイケメンという人の人数、 母集団の中でBさんをイケメンという人の人数です。