- ベストアンサー
標本分散についての質問です
10個のインゲン豆の長さ(mm)と重さ(g)をはかり、その時の2変数の分散を求めるとき。 求めた後の分散はなにを表すことになるのですか? 単位が違うのでどうしてよいのかわかりません。 教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
> 根本的な質問なんですけど分散を求めたときに出てくる値は平均からのズレなんですよね?!今の問題だったら長さの単位mmの分散が1.02と出たとしたら+1.02mm平均とのズレがあるという考えでいいんでしょうか? いえ、分散は平均からのズレを意味しません。平均を中心にどの程度広がっているかを表しますので、インゲン豆の長さは平均±√1.02の範囲内にある程度入るだろうということがわかります。 インゲン豆の重さの分散も同様。 > でもそしたら共分散の値ってなんなのかわかんなくなって……。 共分散は、その値の正負或いは0かどうかを見るだけにして、値自体にこだわらないほうがよいと思います。 むしろ、相関係数を求める方がよいと思います。 それでも値の意味を知りたいこともあるかと思うので一応説明をしてみますが、わかりにくかったらすみません。 n個のインゲン豆のi番目の豆の重さと長さをそれぞれWi, Li(i=1~n)とします。 平均はそれぞれWm, Lmとします。 重さの分散σW^2は σW^2 = Σ(Wi-Wm)^2/n 長さの分散σL^2は σL^2 = Σ(Li-Lm)^2/n 共分散σWLは σWL = Σ(Wi-Wm)(Li-Lm)/n で求まります。 さて、 σW^2 + σL^2 + 2σWL = Σ(Wi-Wm)^2/n + Σ(Li-Lm)^2/n + 2Σ(Wi-Wm)(Li-Lm)/n = Σ(Wi+Li-Wm-Lm)^2/n となりますが、これは重さと長さを足した値の分散になります。 散布図で考えた場合、プロットした点からW=Lの線へ垂線をおろしたときの交点のW=Lの線上でのばらつきの程度を表します。 したがって、散布図が右肩上がりならW=L上でのばらつきは大きいので共分散も大きく(正に)なり、右肩下がりならW=L上でのばらつきは小さくなるので共分散は小さく(負に)になります。 こんな説明で共分散がどういうものかイメージできたでしょうか?
その他の回答 (2)
> 長さだけの分散や重さだけの分散って何を表わすことになるのですか? この問いは、「2変数の場合に分散は何のばらつきを意味するのか」とういうことで答えます。 違っていたら、また補足してください。 ご存知だとは思いますが、分散はデータがどれだけばらついているかを表す指標で、2変数の場合でも変わりありません。 インゲン豆の例で説明しますと、まず長さ対重さで散布図を描きます。 次に、プロットした点から縦軸と横軸それぞれに垂線をおろします。 縦軸、横軸共に垂線との交点が10個ずつ得られますが、この交点の値から計算した分散が縦軸、横軸の分散となり、それぞれもう一方の軸の値を無視した場合のデータのばらつきとなります。
補足
回答ありがとうございます。 混乱しそうな感じなんですけどなんとかわかったと思います。 根本的な質問なんですけど分散を求めたときに出てくる値は平均からのズレなんですよね?!今の問題だったら長さの単位mmの分散が1.02と出たとしたら+1.02mm平均とのズレがあるという考えでいいんでしょうか? でもそしたら共分散の値ってなんなのかわかんなくなって……。 長々とすいません。回答お願いします。
> 2変数の分散 とは、共分散のことでしょうか? 共分散は二つの変数の値がどう増減するかを表す指標で、 共分散の値が正なら、片方の変数が大きくなるにつれ、もう一方の変数も大きくなる傾向があるということです。 共分散の値が負の値なら、片方の変数が大きくなるにつれ、もう一方の変数が小さくなる傾向があるということです。 > 10個のインゲン豆の長さ(mm)と重さ(g) で共分散を計算したなら、その単位はmm・gになります。 わからない点があれば補足してください。
補足
回答ありがとうございます。 よくわかりました、ありがとうございました。 他の分からない点なんですが、長さだけの分散や重さだけの分散って何を表わすことになるのですか?
お礼
ありがとうございました! 今まで全然わからなかったんですけどようやく理解することができました。 丁寧に教えていただいて本当にありがとうございました。