- ベストアンサー
平均値と分散について質問させてください
タイトル通り、期待値と分散について質問させてください。 たとえば、 1,2,3,4,5 という集合があるとします。 これの平均値E(x)は E(x)=(1+2+3+4+5)/5=3 と出ると思います。 また、分散V(x)は V(x)=〔(1+4+9+16+25)/5〕-9=2 となると思います。 平均値3というのは、この集合の中心が3だなぁ、ということが分かるのです。 では分散2という数字。この2はどういう数字なのでしょうか・・・。 分散の意味は「ばらけ具合」というように覚えておりますが、実際数字としてでたときに、その数字が表す「ばらけ具合」はどれくらいのものか分からないのです・・・。 たとえば、特に数字の集合が与えておらず、分散=2です。といわれたときに、これはばらけてるなぁ~。とか、あまりばらけてないなぁ~。とか分かるものなのでしょうか? それとも、平均が3で分散が2とセットで分かったときに「ばらけ具合」が分かるものなのでしょうか・・・。 よろしければ回答をよろしくお願いいたします。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
分散2、だけではばらけているかどうかは分からないですね。 分散は、「期待値からのズレの2乗の期待値」です。 一方、分散のルートをとったものを標準偏差といいますよね。 で、大雑把な話をすれば、標準偏差くらいは期待値からずれそうだな、というイメージではないでしょうか。 厳密とは言いがたいですが、パッと数字を見て考えるという話であれば、一応の目安にはなるのではないかと思います。 例では、標準偏差は約1.4ですから、1.6から4.4の間くらいが出るかなぁ、というように思うわけです。ていうことは、結構バラけていると言えるかもしれませんね。
その他の回答 (4)
- kgu-2
- ベストアンサー率49% (787/1592)
>1,2,3,4,5 という集合があるとします。 このばあいは、集合が正規分布していないので、平均値を出すというのは、やりません。中央値の方が望ましい。もっとも、結果としては、この場合は、同じ3になってしまいますが。 平均値ですが、これは代表値の一つです。集団が正規分布しているときに、意味があります。10人のうち、1人が100万円持ち、他のものは1000円持っているときに、平均値は意味がありません。 正規分布している場合、分散というより、その平方根の標準偏差から、集団の位置が分かります。代表的なものが偏差値で、これは平均値50、標準偏差10の集団です。したがって、偏差値70なら、上から2.5%以内、60なら18%程度というこが分かります。 >あまりばらけてないなぁ~。とか分かるものなのでしょうか? 分散が2とか、3とかだけの情報は、バラつき具合は不明でので意味はありません。分散が同じ2でも、平均値が1000ならバラツキは小さく、平均値が5なら相当大きいでしょう。 これについては、変動係数という指標があります。標準偏差を平均値で割り、100を掛けて%で表します。
- age_momo
- ベストアンサー率52% (327/622)
この質問にはポイントが複数あるように思います。 まず、数学としては >これはばらけてるなぁ~。とか、あまりばらけてないなぁ~。 という感覚はありません。単に期待値が3、分散が2と計算されたという だけのことです。感想が入る余地はありません。 では感想が入るのはいつか? 数学を実際のケースに当てはめて応用した時です。 どう感想が入るか? 何らかの基準(自分の中の)に照らして大きいか小さいかを判断した時です。 例えば 平均1600、分散40000 (ex:1300,1400,1500,1600,1700,1800,1900) これがクラスで成績上位7人の身長平均(mm)と分散とすると これはばらけてるなぁ~と感じるのではないですか? 逆にその人たちの財布の中身(円)とするとあまりばらけてないなぁ~と 感じるのではないでしょうか。 感想はそうして出てくるものだと思いますし、これらの例のように 対象が何かによってその感想も変わってくると思います。 次に >この集合の中心が3だなぁ、ということが分かる これは質問者さんが分布に関して常識的にばらけていると思っているから 出てくるのだと思いますが、例えば 『うちの会社は平均年収が1000万円です』 と言われてももしかしたら99人が100万円で社長が9.01億円得ているかも 知れません。これも平均すると1000万円です。平均を知っても何も 分からないことを示していると思います。 つまり、ある集合がどんな分布に従っているのか、平均と分散がいくつか を知らないと何も分かりませし、数学として扱えません。
- Tacosan
- ベストアンサー率23% (3656/15482)
平均が与えられてもなぁって思います. ・平均3, 分散2 ・平均3000, 分散2 って, よく考えてみると「同じくらいばらけてる」でしょ? で, こいつらよりは ・平均0, 分散20 の方がばらけてると思うでしょ?
- incd
- ベストアンサー率44% (41/92)
No1の回答者ですが、少しだけ補足をさせてください。 標準偏差とは別の指標で、平均偏差というものがありまして、これは「期待値との差の絶対値の期待値」として定義されます。つまり 平均偏差=E[|x_i - E(x)|] これを例に当てはめて見ますと、(2+1+0+1+2)/5=1.2 になり、一般にこれは標準偏差とは一致しません。 自分の書いたばらつきの考え方は、平均偏差の場合によりしっくりくるものだと思います。そういう意味でも、厳密ではないことにご留意ください。
お礼
なるほど、イメージができるようになりました。ありがとうございます