- 締切済み
「t分布が自由度に従うのはなぜ?」の説明方法
たびたびお世話になっています。 t分布における「自由度」のうまい(=なるほど、と思えるような)説明方法がなかなか思いつきません。 ものの本で「自由度とは『標本の数から、作業に必要な平均値の数を引いたもの』と考えると汎用性がある」と知り、事実、「値を自由に選べるのは(n-1)個までで、最後のひとつはおのずと決められてしまう。だから我々に与えられた”自由”度は(nー1)である」という説明もなるほど、と思えます。 ただなぜそんな自由度がt分布で出てくるのか?t分布において、値が自由に選べるとか選べないとかはどこでどうからんでくるのか、そこが頭の中でうまく結びつかなくて困っています。 どなたかご教授ください。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- rabbit_cat
- ベストアンサー率40% (829/2062)
うまい説明はわかりませんが。 「計算したらそうなるから」というのが本当のところですが。 しいて言えば、t分布の自由度がn-1になるのは、分散の不偏推定量で、n-1が出てくるからですね。実際、t分布の分布関数を導出する途中で、n-1で割る分散が不偏推定量になっているという性質を使います。 じゃあ、「なんでn-1で割ると不偏推定量になるの?」っていわれると、「計算するとそうなる」としかいえないです。ヒマなら実際に計算してみてください。 http://case.f7.ems.okayama-u.ac.jp/statedu/lispstat-book/node119.html
- selfer
- ベストアンサー率76% (104/136)
こんにちは.とりあえず,ここでいうt分布を,よく使われる「student化されたt分布」だとして話を進めます. また,以下は厳密な説明と言うよりは,イメージ的説明をしています.その点御了承下さい. 御指摘の「t分布において自由度という数値は何を意味するのか?」については,統計法を実務的に勉強されている人は,「理屈はともかくそんなものである」とブラックボックス的に理解するのが第一段階でしょう.質問者さんは,次の段階に進まれているようですね. まず,t分布というのは,「ある数値が確率論的に散らばっているとして,特定の期待値を基準として,どのように散らばっているか」ということを考えるときに使う分布です.言わずもがなですが,分布という道具を持ち出すときには「あるデータは必ず『散らばり』がある」と考えていることになります. さて,分布には,「分布の基準点=期待値」と「数値の散らばり具合=分散」という情報が最重要となります. 例えば,「2」という数値が期待値であるとしても,これを基準としてどのように数値が散らばっていくかで分布の形は異なってきます.分散が「4」に比べて,分散が「9」の時の方が分布が横に広がることになります. t分布における自由度は,この分散と密接に関連があります. z分布 t分布=────────── 自由度aのχ2分布 t分布というものは,上記のようにz分布とχ2分布によって構成されています.さて,注目してもらいたいのは,分母の「自由度aのχ2分布」の部分です.χ2分布というのは「二乗和の分布」といえるもので,自由度が大きくなればなるほど,χ2分布の形が広がっていきます(よくわからなければ,「自由度が大きくなればなるほど,分母部分の数値が大きくなるんだ」と漠然とお考え下さい).一方z分布の方は,自由度に影響されない,いわば定数扱いとなります(実際は確率論的に分布しているわけですが). そうすると,どうなるでしょう? 分子は定数,分母は変数です.不正確ですがイメージとして説明を続けます. 定数/変数(aの関数.ここでは倍数とする) a=1のとき, b/c=b a=2のとき, b/(c×2)=(b/c)×(1/2) a=3のとき, b/(c×3)=(b/c)×(1/3) aが大きくなるほど「定数/変数」の数値は小さくなっていきますね? あくまでも上記の「定数/変数」の例はイメージとして理解してもらいたいわけですが,t分布についても似たようなことになります. すなわち,自由度(aに相当)が大きくなるほど,分母部分(χ2部分)が大きくなり,「分子/分母」の数値が小さくなる.これは,t分布の形状としては「分布の横幅が小さくなる」ということなります.最終的に,aが∞に大きくなる場合は,t分布の形が最も小さくなるわけですが,これはz分布と一致します(自由度∞のt分布=z分布). 話をまとめると,t分布における自由度とは,数値の散らばり具合=分散をどの程度許容するか,という問題であり,形状としては,分布の広がりとして表現されます. 統計学の専門家ではなく,実務統計家の観点からは上記のよう説明できると思います. いずれにしろ,分布の仕組みに言及しなければならないので,「t分布の仕組みがどのようなものか,ちょっと難しめの話をしてもいいか?」を被説明者に確認を取るべきでしょう.