• 締切済み

平均値の解析法について

統計分析の初心者です。 データがあってもどの方法で解析をすればよいのか途方にくれています。 経年的に追跡しているデータで、平均値まで出しています。 平均値は低いほど良い結果です。 1年目、2年目、3年目と3回分のデータがあるのですが、1年目よりも2年目、2年目よりも3年目、1年目よりも3年目の方が良い結果が出ている(平均値が低くなっている)ことを統計的に解析したいと思っています。 どのような方法があるのか、たくさんあるかもしれませんが、教えていただけませんでしょうか? これからのためにも、なぜそれが良いのかも知りたいと思っています。 周りに相談できる方がいないので、教えてくださる方がいれば助かります。 よろしくお願いします。

みんなの回答

  • aokisika
  • ベストアンサー率57% (1042/1811)
回答No.1

標準偏差を計算してグラフにしてみましょう。 たとえば学力テストの成績が、A組が平均70点で、B組は80点であったとします。 B組の学生の方が優秀な組のように見えますね。でももし、個々の学生の点数が、A組は60点から90点の間に集中していて59点以下は一人もいないのに、B組は0点から100点までいて、平均が80点であったとしたら、どちらの組が優秀なのでしょう? B組は玉石混交、A組は粒がそろっている、と考えられます。学生アルバイトを雇うとしたら、どちらの組の学生を雇ったら安心できるでしょうか?B組の学生はすごく優秀な学生もいますがとんでもないお馬鹿さんもいます。どちらに当たるかわかりません。A組はすごく優秀な学生はいませんがどの学生も一定以上のレベルです。当たりはずれがありません。 製造業などでの品質の考え方ではA組の方が品質が高いと考えます。 このようなばらつきを考えるのが標準偏差とか分散とかいった考え方です。 まず、1年目のそれぞれのデータと平均値との差を2乗し、2乗の平均を計算します。これを「分散」と呼びます。この分散の平方根が「標準偏差」です。 先ほどの学力テストの点数の例で、A組の学生は6人いてそれぞれの点数が、60、65、70、70、75、80、であったとすると、平均点は70点です。それぞれの学生の、平均との差は 10、5、0、0、5、10 ですから、それぞれの二乗は 100、25、0、0、25、100 です。この平均は41.67 で、これが分散です。 この分散の平方根は6.455です。これが標準偏差です。すべてのデータのうち約67%が(平均±標準偏差)の範囲内に入ります。 質問者さんのデータで、各年度のデータの標準偏差を求め、これがだんだん小さくなってゆけば、全体の値が小さくなっていると言えます。 しかし、標準偏差が大きくなっていくようだと、平均が小さくなったのはたまたま偶然そうなっただけだ、ということになります。

rodyu-kiss
質問者

お礼

わかりやすい説明をありがとうございます。 早速、標準偏差を出してみました。 1年目のデータと2年目のデータの標準偏差を比較すると、2年目の方が小さくなりました。 これは、ある介入がこのデータに有意な影響を与えていると言えるのでしょうか? 有意差ありと。 2年目のデータと3年目のデータの標準偏差を比較すると、3年目の方が大きくなっていました。 これは、有意差が得られなかったとなりますでしょうか? このように、たまたま偶然そうなっただけというのを、何とか有意差ありと言えるように解析するものはないものでしょうか…? また、これとはまた別の話になるかもしれませんが、よく聞くt検定やカイ二乗検定、マンホイットニーU検定などをこのような研究に使用するとすると、どのように活用すれば良いのでしょうか? 男女や年齢がわかっているのと、得られたデータの値の高い群と低い群を分ける明確なラインがわかっています。 的外れな質問だったら申し訳ありません!