- ベストアンサー
推測統計学・・・
レポートで「推測統計の考え方を母平均の区間推定を例にとり説明せよ」という問題が出されました。 まとめようとしたのですが、こんがらがってうまくまとまりません。 どなたかわかりやすく教えていただけないでしょうか? ポイントだけでもいいのでよろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
統計学には大きく分けて記述統計と推測統計の2つがあります。 記述統計は、収集したデータがどんなものであるかを見ようとする技術です。 収集したデータを漫然と眺めても、それらから有用な情報を得ることが難しいので、平均や分散といった指標を使ってデータ全体のおおよその形を見たり、多変量解析を使って見やすい形に宿約したりすることがこれにあたります。 対して推測統計は、収集したデータから母集団の姿を推測しようとする技術です。 これを理解するには、母集団と標本(サンプル)という概念を押えておかないといけません。 母集団は、本当に知りたい対象。でも直接観測ができない、又は困難なものです。 例えば現時点での日本の男子高校生の身長などの規模が大きく全部観測できない集合や、ある人がボールを投げる速さなどの繰り返すことで無限に数が増えてしまう集合などです。後者のようなものは特に無限母集団と言います。 母集団全部を観測するわけにはいかないから、母集団のなかからランダムに(これ重要)標本をとってきて、その標本の形から母集団の形を推測しようというのが推測統計です。ここでいうランダムとは、母集団のすべての要素が等しく選ばれる可能性があるということです。 さて、いまある高校でクラスの男子の身長の平均を知りたかったとします。母集団はクラスの男子ですから、全員計るのは簡単です。その平均をとれば母平均(真の平均)が得られます。これは単に得られたデータの平均なので記述統計の範囲です。次に日本の男子高校生の身長の平均(以後母平均と呼びます)を知りたかったとします。しかし、母平均を調べることは無理なので、日本の男子高校生の代表として自分のクラスの男子のデータを使いましょう。 ここで、クラスの男子の身長の平均(以後標本平均と呼びます)=母平均として良いでしょうか?「んー、大きくは違わないと思うけどイコールとは言えないなァ」と思うでしょう。それが普通の認識です。では「母平均は標本平均±100cmの範囲にある。」と言ったらどうでしょう?いくらなんでもこれなら入りそうですね。でもこんなにデカい範囲で言われたら、いくら正しくてもなんの参考にもなりません。そこで、「母平均は標本平均の±X以内に95%くらいの確率である」という言い方をするのが区間推定です。ここで「±X」は信頼区間、「95%」は信頼度と呼びます。同じ信頼度なら、標本の大きさ(測定する男子生徒の数)が大きいほど信頼区間が狭くなり、厳密な推定が出来ます。(標本の数というと別の意味になるので注意してください) また、標本の大きさが同じでも、信頼度を低くすれば(いい加減な推定でよければ)より狭い範囲で推定することができます。 このように、母集団の真の姿を母集団からの標本から推定し、かつそれがどの程度信頼できるかという情報も併せて提供しようというのが推測統計の考えかただと思います。 手元に文献がないので、自分が理解している範囲です。できればまともな文献なども参考にしてください。
お礼
授業のノートよりわかりやすかったです(^^ ありがとうございました!