統計学、自由度の意味がよくわかりません。
「質問」
自由度の意味がわかりません
「質問の経緯」
統計学の学習をしています。自由度という言葉の意味がよく分からず困っています。
下記はあるウェブサイトからの自由度の説明の引用です
"例えば、サンプルサイズが3のデータから算出された標本平均が5であるとき、1つ目の値と2つ目の値は自由に取ることができます。例えば、4と6とします。すると、3つ目の値は標本平均が5となるようにしなくてはならないので、「5」しか取ることはできません。つまり、自由に値を取れるデータの個数が1つ分減ってしまった(1つ分の情報量を失った)ことになります。したがって、自由度は「3-1=2」となります。"
全体的によくわからないのですが、上記の文章における
>>1つ目の値と2つ目の値は自由に取ることができます
が特に分かりません。例えば日本人の平均身長を標本から統計的推測をしたいとします。
この時、無作為に選んだ人間の身長の平均が標本平均となるはずです。
標本の中の一つ一つのデータについて、この人は平均身長は168で、とかこのひとは170でとか
値をつけることはないはずです。しかし上記の引用した文章においては
まるで標本の中のデータの値を自分で勝手に決めているように思えます。
「質問まとめ」
自由度という言葉の意味がよく分かりません。
特に"1つ目の値と2つ目の値は自由に取ることができます"
という、値を自由に取ることが出来る、という言葉が分かりません。
理解の手助けとなるようなアドバイスなどがあれば教えてほしいです。
お礼
もう誰からもご回答無さそうなので、早いけど締めます。 どうも有難う御座いました。
補足
kyaezawaさんのご紹介のホームページは私も知っています。 ここで訂正お願いしたいのですが、勤労者所帯の平均月収は 551,160円です、10万円も間違えていませんか… 従って年収は660万円余りでしょう。 これに私の見たデータでは、農林魚業も含まれるので、 どちらの統計も当たらずとも遠からず、ではないでしょうか。