- ベストアンサー
数学や統計学に詳しい方への質問
- 数学や統計学に詳しい方への質問です。標本抽出実験についての統計学のテキストを読んでいる中でわからない部分があります。
- 質的データをダミー変数を用いて表現し、比率の計算方法や分散の求め方について教えていただきたいです。
- 数式の展開についても理解ができない部分があります。回答をお待ちしています。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
いまXiは1か0しかとらない変数ですよね。 そしてiは1からNで、i番目の人がA政党支持ならXi=1、i番目の人がB政党支持ならXi=0ですね。 ここまでは確認。 さて、話を簡単にするために、人を並び替えてA政党支持者を前半にB政党支持者を後半に並ばせましょう。 つまり、全員が一列に並んだら Xi = {1,1,1,1,1,...,1,0,0,0,...,0} となるわけです。 ただし全体の中でA政党支持者の割合はπ=0.4ですから、先頭からN*π=N*0.4人まで1が並び、その後、N*(1-π)=N*0.6人は0が並びます。 いよいよ実際に分散を計算しましょう。 まず、 σ^2 = (Σ[i=1~N]{(Xi-π)^2})/N これは分散の定義なので納得してもらえますよね。 次にΣの中を具体的に書き並べます。 (Σ[i=1~N]{(Xi-π)^2})/N = (1/N)*( (1-π)^2 + (1-π)^2 + (1-π)^2 + ... + (1-π)^2 + (0-π)^2 + (0-π)^2 + (0-π)^2 + ... + (0-π)^2) (1-π)^2が並んでいるのはA政党支持者の部分で、(0-π)^2が並んでいるのはB政党支持者の部分ですね。 先ほども書いたように、(1-π)^2は先頭からN*π人並んでいると言うことがわかりますか? (1-π)^2をN*π人分足すんだから前半部分の合計は、 N*π*(1-π)^2 となりますね。 同様に、(0-π)^2は後半にN*(1-π)人並んでいますね。 (0-π)^2をN*(1-π)人分足したら後半部分の合計は N*(1-π)*(0-π)^2 となりますね。 これをさきほどの式に当てはめれば、 (Σ[i=1~N]{(Xi-π)^2})/N = (1/N)*( N*π*(1-π)^2 + N*(1-π)*(0-π)^2 ) Nを約分して = π*(1-π)^2 + (1-π)*(0-π)^2 = π*(1-π)^2 + (1-π)*π^2 となるのです。
お礼
なるほど理解できました、すごくわかりやすいです! 確かにA政党支持者の割合はN*π、B政党支持者の割合はN*(1-π)ですよね。シグマの中のA政党支持者、B政党支持者それぞれの合計を求める際にN*π倍(A政党)、N*(1-π)倍(B政党)するという発想は私には思いつきませんでした。いやはや本当にありがとうございます(>_<)