• ベストアンサー

t検定?F検定?

本当に初心者で申し訳ありません! 統計について、まったく分からないのです。 有意差を出したいな~…と思っていますが、t検定を使うべきなのか F検定なのか、よくわかりません。 エクセルで行おうと思っているのですが、t検定の場合でやろうとすると 配列1、配列2、尾部、検定の種類など…ちんぷんかんぷんです。 統計の本も読みましたが慣れてないこともあり・・お手上げです。 知りたいこと 1.        研究前   研究後     学習群  平均得点  平均得点 非学習群 平均得点  平均得点  有意差があるか?   2.     研究前   研究後 ●●疾患 平均得点  平均得点 △△疾患 平均得点  平均得点  有意差があるか? …等を知りたいのです。 説明も下手で申し訳ありません!! どなたか教えてください。宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.7

No5です。  ご事情は、理解したつもりです。真摯に取り組んでいる方に、まったく失礼な書き込みをして、申し訳ありません。  このカテゴリーで統計関係の書き込みをみて、疑問・不安がありましたので、つい失礼な言葉を何人かの方に投げつけてしまっています。  それは、1) 学術レベルのご質問が多いのに、謝辞の点に全く配慮が無い、2) 普通は指導者や研究協力者がいるだろうが、その方に失礼にあたる、3)なによりデータがあるのでなんとか、というのは統計学に対する基本姿勢が誤っている、など研究そのものをどのように考えているか、ということです。  ただ、何人の方は、一人でコツコツとなさっています。そのようなnachahimeさんをはじめ敬意を払うべき方に、不愉快な言葉を投げかけ恥じ入っています。どうか、お許し下さい。  さて、ご研究の内容からすると、初心者レベルではありまん。統計処理には、中級どころか熟練者でも、このデータではおそらく難しい。  1) >平均点 平均というのは、難点のある場合があります。嫌いを1点、普通を2点、好きを3点にすると、平均すると2点になります。しかし、嫌いな人3人を集めると3点になりますが、評価が好きに転換するわけではありません。このように、自分で得点化したものを平均しても、無価値な場合が少なくありません。この場合は、順序尺度でしょうから、取り扱いには注意が必要です(平均するのは誤り)。  2) >学習の成績は必ず100点とさせ、終了する方法を行いました。  これも様子を推定するしかないのですが、成績は全員100点ですから、評価は100点をとるまでの時間なのでしょうか。 > 「1,2」といった数字は、客観的な変化を見る評価の中で、 得点を付ける際に1~6の得点をつけた結果でしたので、少ない数字になっています。 この得点は、主観的につけらていますので、t-検定やF-検定は使えません。1)で書いたように、これで「4」と評価された人は「1」と評価した人の4倍の能力があるとは言えないからです。  数学のテストなどは、40点の人は10点の人の4倍の能力と判断しても異議を唱える人はいません。評価や得点で、足し算したり、平均をだしても意味が無いと、私のような初心者レベル(t-検定とF-検定はなんとか)では対処できません。 3) >質問形式で行う検査が2つ、客観的な変化を見る検査が1つあります。 この3つの評価を得点化しています。 違う検査法を、合算させていませんか。検査法は、相違がでやすいものと出にくいものがあります。それぞれ独立で評価するべきです。 >4名の被検者のうち、2名に関しては折れ線グラフで右上がりになっています。 データ数(このばあい、折れ線グラフ上の点の数)が学習前も学習後も5つ以上あるのなら、学習前と後ののデータについて、それぞれ回帰式を求める。効果があるのなら、回帰式の傾きは、増加しているハズなので、回帰式の傾きについて有意差検定をしてみる、ことが方法としては考えられます。  難点は、データが順序尺度ではないか、ということです。これだと、論文審査などでは、まずパスしません。先駆的な研究で、誰もやっていない、最初の試みというのなら、私は評価しますが。  一番良いのは、統計学の上級者とご相談するこことです。ただ、学会・など外部に出す時は、共同研究者とか謝辞だとか礼儀を尽くして下さい。外部に出して評価を受けた方が、研究は進むのは経験済みです。批判を受けないように、科学的に方法論を採りますので。  外部に出さないのは、単なる趣味なので、熱意に訴えるなどしないと、専門家だとメリットは無いので、難しいと想います。 全体プランを私なら、 1) 検定法を決める 2) 検定の初心者なら、t-検定やF-で利用できるデータを集める。  すなわち、足し算したり、平均をとっても意味のある(リンゴとミカンの個数の平均には、意味が無い)間隔尺度、または比率尺度のデータを集める。これだと回帰分析も可能。  間隔尺度のデータ収集法は、学校のテストの成績を思い出してください。これは、一応間隔尺度と考えられています。  自動者免許の○×問題、単純な計算を一定時間でさせてみる、なんぞが思いつきますが。  以上、釈迦に説法の点は、ご容赦下さい。また、失礼な表現もあるかと想いますが、お許し下さい。

nachahime
質問者

補足

色々と、ご指摘、ご指導を本当にありがとうございます。 お答えいただいた文章をじっくり読ませていただきました。 浅はかな考えで最初の時点で「平均点」などと言ってしまい、恥ずかしく思います。 平均点については行わず、客観的評価については 全体的にどのように変化したかと見ていきたいと思います。 >2) >学習の成績は必ず100点とさせ、終了する方法を行いました。  これも様子を推定するしかないのですが、成績は全員100点ですから、評価は100点をとるまでの時間なのでしょうか。 学習の成績自体は関係なく、その後の「質問式の評価」と「客観的な変化を見る評価」 の点数をデータとして記録していました。 (学習の方法として、100点で終了させるという学習を行っているため) こちらは、ご指摘の通り、t検定やF検定は行わず全体的な変化を見ていこうと思います。 >3) >質問形式で行う検査が2つ、客観的な変化を見る検査が1つあります。 >この3つの評価を得点化しています。 >違う検査法を、合算させていませんか。検査法は、相違がでやすいものと出にくいものがあります。それぞれ独立で評価するべきです。 その通りだと思いました。一緒に考えてしまっていたため、混乱してしまっていました。 独立で評価すると、すっと頭の中がすっきりしました。 ありがとうございます。 本当に色々とご指導、ご指摘などなど…本当にありがとうございました。 今後も臨床に役立てていけるよう、勉強していきたいと思います。 このような形で、失礼もたくさんあったと思います。 大変勉強になりました。ありがとうございました!

その他の回答 (6)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.6

No5です。No3の方の補足を読んでいなかったので。謝辞なんぞの厚かましい文字を書き込んだので、行きががり上。  データは、どのようにして得られた(これから?)のでしょうか。 1) 4月のデータというのは、同一の日にしたのですか。  それとも、毎日のデータがあって、平均点というのは、4月とか5月とかのデータの平均ですか。 2) 4月のデータが毎日のものであれば、この間、学習はしているのですか。  4月のデータが毎日のもので、1日は1、2日は4、3日は2・・・となると、学習効果は無いように見えてしまいますが、 3) 各月に毎日データを出していて(無い日があってもOK)、横軸に学習開始日からの日数、縦軸に点数の折れ線グラフを描いた時に、全体では右上がりに見えますか。  この3)の場合だけは、回帰分析とt-検定を組み合わせれば、「学習の効果はあったのか」の検定は、可能かと。  統計学で、初心者の最悪のパターンは、「データがあるので、どんな検定をすれば」という質問です。  学習効果の検定については、教科書的には次のようにします。 1 被験者を集めて、同時期、同一課題を課す。   集めるのが困難なら、それなりの工夫が必要。 2 学習させる 3 学習後に、学習前と同レベルの課題をさせる。  すなわち、授業の効果を知りたければ、まずテストをして、授業をし、同レベルのテストの平均点をt-検定、という手順を想い浮かべれば明確です。私は、この方法でe-learningの効果の検定をしました。  これからデータを集めるのなら、t-検定などの検定法を想定し、その検定法が使えるようにデータ集めをして下さい。そうでないと、初心者以前、ど素人です。

nachahime
質問者

補足

ご指摘ありがとうございます。 本当にド素人、説明不足で申し訳なく思っています… 学生の研究や論文発表ではありません。 私が臨床の中でデータ収集を行ったため、形にしたいと思い こちらに質問させていただいています。 研究の内容をもう少し詳しく書きます。 ある学習を継続して行うと認知面や記憶面が向上するのか?という疑問から 研究を開始しました。 >データは、どのようにして得られた(これから?)のでしょうか。 被検者4名の方に対し、5月から毎日学習をしてもらいました。 学習の成績は必ず100点とさせ、終了する方法を行いました。 学習前の期間は2ヶ月間です。 学習をしている期間は6ヶ月です。 学習は毎日行い、月に一度、認知面や記憶面に対する評価をご本人に質問形式で行いました。 質問形式で行う検査が2つ、客観的な変化を見る検査が1つあります。 この3つの評価を得点化しています。 質問形式を行った評価者は1名で、客観的評価を行った評価者は6名です。 >1) 4月のデータというのは、同一の日にしたのですか。 >それとも、毎日のデータがあって、平均点というのは、4月とか5月とかのデータの平均ですか。 4月に1度、5月に1度、と各月に評価を行った結果となっています。 毎日のデータはありません。 平均点がややこしくしてしまったのだと思います・・すみません。 >2) 4月のデータが毎日のものであれば、この間、学習はしているのですか。 >4月のデータが毎日のもので、1日は1、2日は4、3日は2・・・となると、学習効果は無いように見えてしまいますが、 「1,2」といった数字は、客観的な変化を見る評価の中で、 得点を付ける際に1~6の得点をつけた結果でしたので、少ない数字になっています。 (また言葉が足らなかったらすみません) >3) 各月に毎日データを出していて(無い日があってもOK)、横軸に学習開始日からの日数、縦軸に点数の折れ線グラフを描いた時に、全体では右上がりに見えますか。 >この3)の場合だけは、回帰分析とt-検定を組み合わせれば、「学習の効果はあったのか」の検定は、可能かと。 4名の被検者のうち、2名に関しては折れ線グラフで右上がりになっています。 そのうちの2名はほぼ変化がありませんでした。 教えていただいた参考URLも拝見し、実際に行ってみました。 質問形式の1つを、 t検定で行ったところ、7.82708E-06 と表示されました。 F検定を行ったところ、0.698324286 と表示されました。 ===================== 補足項目のほうで書かせていただいたデータは、客観的な変化を見る評価の得点なので、 評価者はAさんからFさんという形で書かせていただきました。 ↓こちらです。 Aさん  4月 5月 6月  1  1  1・・・  4  2  1・・・  2  0  2・・・  3  3  3・・・  ・  ・  ・  ・  ・  ・ というような形で出ています。AさんからFさんまで同じような形で データが出ています。 ====================== 評価項目が3つあり、それぞれの評価が違うために 私の頭もパニックになってしまって色々なことを書いてしまい、余計にややこしくしてしまいました。 補足内容になっているでしょうか・・・ここまでドキドキしながら書いています…。 1つ1つ、しっかり取り組んでいきたいと思います。 ご指摘、ご指導ありがとうございます。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

私も初心者ですが、それ故どこが分かりにくいかは理解しているつもりなので。専門家の記述は正確なのですが、正確さに囚われて初心者にわかりやすいようには書いてくれていません。 1の目的は、学習群は有意差があり、非学習群は優位差が無い、ことを示したいのだと推測します。  ここで、統計学の大原則で初心者の最大の落とし穴は、「有意差が無いこ」とは証明できません。有意差が無いとの表現は誤りで、有意差は認められなかった、と謙虚に記述します。他の人が適切な方法で証明できるかもしれないからです。ですから、この目的は、学習群に効果があったことを示したい、というのが目的になります。 >t検定を使うべきなのかF検定なのか、よくわかりません t検定は2群の平均値の差から、F検定は2群のバラツキから、有意差を検定します。どちらを用いても、有意差が出ればOKです。ただ、t-検定は、データが正規分布をしている、前提条件があります。  とりあえず、下記を参考にして下さい。  http://oshiete1.goo.ne.jp/qa3516234.html これで、有意差が出れば、t-検定は修了。  出ない場合、 尾部は2、対応は2を使うのが一般的。学生に教えるときは、説明が面倒なので、問答無用でやっています。  尾部は、学習前と後で、数値は必ず上がる(または下がる)ことが想定できるのなら、尾部は1、  検定の種類は、学習前後の人のデータは同一人であれば、それぞれの前と後で対応しているので2  にすれば、有意差が出るかもしれません。  ここから先は、謝辞を要求したくなりますので、書きません。一人でやっている、趣味というのなら、参考URLのように、独り言を書き込みます。その場合、何を主張したいのかを明確にして下さい。  ただ、目的によっては2次元以上の分散分析や多変量解析をしないといけないかもしれませんが、それは私の手に余ります(常に初心者レベルの研究計画しかたてないので)。

参考URL:
http://oshiete1.goo.ne.jp/qa3516234.html
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.4

「Welchの検定」で調べてください。

nachahime
質問者

補足

ありがとうございます。 Welchの検定で調べました。 色々とt検定について書かれており、√などは分かりませんが… 少しずつ勉強させていただきます。 本当にありがとうございます。

  • slate
  • ベストアンサー率41% (14/34)
回答No.3

参考までに、URLをあげておきます。 http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html http://www.aoni.waseda.jp/abek/document/t-test.html http://aoki2.si.gunma-u.ac.jp/lecture/Average/oneway-ANOVA.html 貴方の提示されたデータでは、通常のt検定やF検定ではちょっと難しいと思います。 平均だけではなあ・・・ 例えば、各群1例だけの場合、とか考えるとナンセンスなのは分かりますでしょうか? あと、t検定は英語でもt testです。二群に対してのt検定は「Two sample t-test」といいます。念のため。

参考URL:
http://www.aoni.waseda.jp/abek/document/t-test.html
nachahime
質問者

補足

参考URLありがとうございます! 実際のデータは Aさん  4月 5月 6月  1  1  1・・・  4  2  1・・・  2  0  2・・・  3  3  3・・・  ・  ・  ・  ・  ・  ・ というような形で出ています。AさんからFさんまで同じような形で データが出ています。 平均としてしまったことが余計に面倒にしてしまったのでしょうか・・ 参考URLを元にしながら、このデータと格闘してみます。

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

提示されたデータ形式を見ると少し複雑な問題のように思います。 研究前と研究後という意味が分からないので、処置前と処置後として置き換えて考えると、「学習群では処置前に比べて処置後の数値が高い」的な仮説でしょう?一方で「非学習群では処置前に比べて処置後の数値が高い」ということかな。 それとも、学習群と非学習群とで(処置前後の平均値の差が)どちらが大きいのかということなのでしょうかね。よく分かりませんが。 また、処置前と処置後とでは被験者は同一なのか異なるのかも分かりませんとね。もし同一なら「対応のある2条件間の平均値の差の検定」ですし、異なるのであれば「独立2標本の平均値の差の検定」になります。ただし、前者だとややこしい問題かもしれない。。。 ちなみに、t検定とはt分布を用いた検定の総称で、F検定はF分布を用いた検定の総称です。一体、何について検定をするのかを正しく表記すると誤解が少ないでしょう。

nachahime
質問者

補足

言葉足らずですみません・・・ >「学習群では処置前に比べて処置後の数値が高い」的な仮説でしょう? そのとおりの仮説です。 学習群では処置前に比べて、処置後の数値が高いことを仮説に立てています。 処置前と処置後の被検者は同一です。

  • u-tanaka
  • ベストアンサー率54% (6/11)
回答No.1

t検定は、Two-sample Testの略ですから、二つのグループに差がある。つまり、有意差があるときに用います。 f検定は、二つのグループの比が正しいか?否か?を調べるときに用います。 ご存知のことかと思いますが、二つのグループに分けて、対象群同士の比較を行う検定は、t検定を用います。しかしながら、その分けた集団同士が、同じものか?否か?を検定する(検算する)場合には、f検定を用いて検算を行うことで、その分布もしくは分散が一致していないか?どうかを確かめるのです。 さて、Excelでやる場合には、配列1が母集団を扱う対象群のデータ列としますか。配列2を比較する対象群のデータ列とします。尾部というものは、そのデータ列の終端を指定するためにあるものです。 詳しくは、 ・東京大学教養学部統計学教室編, 統計学入門, pp240-p245, 東京大学出版会, 1991 辺り(ちなみに教養の教科書で申し訳ないのですが・・)でも参考にしてみてください。

nachahime
質問者

お礼

わぁあ… 分かりやすいです!! ありがとうございます!少しずつ進めてみます!!

関連するQ&A