- 締切済み
統計学の信頼区間
現在、日本語でも勉強したことのないsurvey designと統計学の授業を英語で、しかも駆け足で学んでいます。今まで文系で来たので、もう何が何だかわかりません。どなたか以下のことを簡単に教えていただけませんでしょうか。 2009年、ロンドンで8年生を対象とした読解能力調査が実施された。シンプル・ランダム・サンプリングを用いて1000人をサンプルした。全員から回答を得ることができた。このサーベイによって出された平均値の一つがPである。このPは、一日に一時間以上テレビを見る生徒のプロポーションである。そしてこのPの値は0.25である。 1) このPに対する95% confidence interval(信頼区間)を計算し、解釈せよ。 さて、費用削減の為、来年度の調査より、以下の方法をとることにした。 まず、学校をシンプルランダムサンプリングで選別し、その後にそれらの学校の生徒の約5パーセントをシンプル・ランダム・サンプリングでサンプルする。サンプルサイズは2009年度とおなじである。そして、その際の平均値Pが2009年度と同じ0.25になると仮定した場合、信頼区間は昨年度から変化するか否か、説明せよ。 どうぞよろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
「学校をシンプルランダムサンプリング」というのはどの学校も等しく選ばれる可能性があるということですよね。 生徒数に応じて学校を選ぶ確率も変えているのなら信頼区間は変化しないでしょうから、以下無視して構いません。 極端な話、生徒数が7500人で全員一時間以上テレビを見ない生徒ばかりの学校が一校と、生徒数が500人で全員一時間以上テレビを見る生徒ばかりの学校が5校の場合、生徒数の少ない学校の生徒の方が選ばれる可能性が高く、得られる標本比率は生徒数の少ない学校の比率に引きずられると考えます。 恐らく、信頼区間は学校間の生徒数のバラツキや比率のバラツキの影響を受け広がるのではないでしょうか。 具体的にどの程度かと聞かれると困りますが……
まず一つ目について 二項分布の信頼区間について調べてください。 一番簡単な方法は、Pを標本比率、pを母比率、nをサンプルサイズとして P-1.96×√{P(1-P)/n} ≦ p ≦ P+1.96×√{P(1-P)/n} と計算する方法です。 二つ目について 学校間の生徒数や目的の比率に差があると信頼区間は変化すると思います。
お礼
返答が遅くなり申し訳ありませんでした。 ご教示いただいた公式をヒントに教科書を読み進めることができました。 二点目の質問について、もう少しだけ詳細にお教えいただけると幸いです。confidence interval はこのstratifiedでもclusterでもない単なるtwo stage random samplingの結果として、どのように変化するのでしょうか。。。。