- 締切済み
統計学について教えてください。
みなさん、こんにちは。 現在アメリカの通信大学でビジネスを勉強しており、 統計学のコースを受けているのですがさっぱりわかりません。。。 下記お分かりの方計算方法(手動?エクセル?)を教えて頂けないでしょうか。 質問 A社はハニー味の歯磨きをを開発し、10人に試してもらいました。6名は好きと答え、4名は好きではないという答えでした。また、A社はランダムにその10名から4名にインタビューも実行しました。そのインタビューを受ける4名が、2名は好きと答えた人、残り2名は嫌いと答えた人になる可能性はどれだけありますか。 CompanyA recently developed a new toothpaste flavored with honey. It tested a group of ten people. Six of the group said they liked the new flavor, and the remaining four indicated they definitely did not. Four of the ten are selected to participate in an in-depth interview. What is the probability that of those selected for the in-depth interview two liked the new flavor and two did not?
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- Peechyan
- ベストアンサー率69% (34/49)
あまりにも納得いかなかったので、2項分布が使えなかった理由を調べてみました。 で、分かった事は、母集団のサイズが小さくて、しかも取ったものを元に戻さない(非復元抽出)だと、2項分布が使えなくなって、超幾何分布(hypergeometric distribution)を使わなければならないようです。 だから、もし設問が、「A社はハニー味の歯磨きをを開発し、100人に試してもらいました。60名は好きと答え、40名は好きではないという答えでした。また、A社はランダムにその100名から4名にインタビューも実行しました。そのインタビューを受ける4名が、2名は好きと答えた人、残り2名は嫌いと答えた人になる可能性はどれだけありますか。」だったら、2項分布でよかったのです。4人だったら、標本の4%で、5%に満たないですからね。 私も直感的にですが、一番最初に調査する母集団の数が少なすぎるなぁと思っていたので、設問に問題あるんじゃないかと疑っていたのですが、設問のトラップに見事はまったようです。 以下は、超幾何分布を適用すべきケースについての説明です ========================= Recall that one of the criteria for the binomial distribution is that the probability of success remains the same from trial to trial. Since the probability of success does not remain the same from trial to trial when sampling is from a relatively small population without replacement, the binomial distribution should not be used. Instead, the hypergeometric distribution is applied. Therefore, (1) if a sample is selected from a finite population without replacement and (2) if the size of the sample n is more than 5 percent of the size of the population N, then the hypergeometric distribution is used to determine the probability of a specified number of successes or failures. It is especially appropriate when the size of the population is small. ============================================================= うん。納得納得。
- Peechyan
- ベストアンサー率69% (34/49)
2項分布を使って答えを書いた者なのですが、ネットを検索したら、以下のようなワードの文章を見つけました。それによると、No.2の方の(6C2)(4C2)/(10C4)が正しいようです。 ○ 見つけた文章 ------------------------------------------------- Colgate-Palmolive, Inc., recently developed a new toothpaste flavored with honey. It tested a group of ten people. Six of the group said they liked the new flavor, and the remaining four indicated they definitely did not. Four of the ten are selected to participate in an in-depth interview. What is the probability that of those selected for the in-depth interview two liked the new flavor and two did not? This is a Hypergeometric distribution with N = 10, k = 6, n = 4, x = 2 P(x: N, n, k) = C(k, x) * C(N - k, n - x) / C(N, n)P(2: 10, 4, 6) = C(6, 2) * C(10 - 6, 4 - 2) / C(10, 4) = C(6, 2) * C(4, 2) / C(10, 4) = 15 * 6 / 210 = 3/7 = 0.4286 The probability is 0.4286. ------------------------------------------------- 参考までに、この問題を日本でよくあるタイプの問題に直すと、 箱の中に赤球6個と白球4個の合計10個の玉が入っている。今、箱の中の玉を良くかき混ぜて、同時に4個取り出すとする。この時、赤球2個、白球2個が取り出される確率を求めよ。 (6C2)(4C2)/(10C4)=3/7 が正解になります。 で、ちょっとばかり言い訳させてもらいますと、 (6C2)(4C2)/(10C4)もちらっと思ったんですが、統計学で{好き/嫌い}ということで、2項分布だろうと、若干空気を読んだところもありますといいますか。。 もうひとつ、2項分布ではダメだった理由として、 1) 好き・嫌いの確率が「長年の経験から、事前に分かっている」という条件が付いていない事 2) 元々のサンプルからインタビューを受ける人を抽出した事 が挙げられるのかなと思っています。。 まぁ、私は残念でしたが、取り敢えず解決ですね。今後もめげずに頑張ります。
- alice_44
- ベストアンサー率44% (2109/4759)
統計の問題かねぇ? (6C2)(4C2)/(10C4) でしょ。
- Peechyan
- ベストアンサー率69% (34/49)
まず、この問題のタイプなんですけど、統計学では2項分布(Binominal Distribution)とか、2項確率といわれるジャンルの問題です。平たく言うと、’Yes / No’とか’裏/表’などの二通りの答えの可能性がある場合にこの分布が適用されます。 ■ 手計算 ○ まず、母集団(10人)の中の好き、好きでないの確率を求めます。 ハニーが好きという事象をHとおく。よって、P(H)=6[人]/10[人]=3/5 となる。 ハニーが好きでないという事象をHバーとおく(Hの上に横棒が書いてある)。 P(Hバー)=1-3/5=2/5 ○ 次に、母集団から’ランダムに’選ばれた4人の中での二項確率を求めます。 母集団(10[人])において、P(H)=3/5、P(Hバー)=2/5であるから、 この10名のうちからランダムに4人のサンプルを選ぶと、インタビューを受ける4名が、 2名は好きと答えた人、残り2名は嫌いと答えた人になる可能性は2項分布Bin(4, 3/5)に従う。 よって、P(4人のうち好きと答える人が2人) = 4C2 * (3/5)^2 * (2/5)^4-2 = 6*9/25*4/25=216/625 = 0.3456 * ここで、4C2は、組み合わせを表しており、2項係数とも呼ばれます。 ■ 同じ事をエクセルでやる: エクセルでは、二項分布の計算は、BINOMDIST関数を使います。 P(4人のうち好きと答える人が2人)=BINOMDIST(2,4,0.6,FALSE) 同じ答えが出ました。 なお、関数の書式は、BINOMDIST(成功数、試行回数、成功率、関数形式)となっており、 (1) 成功数:好きと答える人が2人なので、2 (2) 試行回数:サンプル数が4人なので、4 (3) 成功率:ハニーが好きな人の確率 P(H)=3/5=0.6 となります。 (4) 関数形式:Trueとすると、累積確率になるので、この場合はFalseにします。