- ベストアンサー
t検定について
2つの事柄に違いが見られるかを調べるためt検定を行ったのですが、『P(T<=t)両側』の値が、どうであれば違いが見られたと判断されるのかわかりません。この数値がどうだと違いが見られたと言えるのでしょうか?
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
がんばっておられますね,kanata19さん.selferです. 最近卒論や試験の時期だからこの手の質問が多いなぁ,と思いました.ヒントとなるものは,「t検定」をキーワードにてい過去の回答を検索すると見つかります. <簡単なt検定の判断法> ・t値と自由度から導かれたP値(最近は直接算出される)が「分析者が予め設定しておいた有意水準(α,大抵は0.05,つまりは5%)」以下であれば「有意差あり」と判断できる 実践的には上記の判断法を知っておけば構わないんですが,統計法をちゃんと勉強していない人は,「有意さありって,結局なんなの?」とポイントを掴みきれずに,ときどき解釈に困ったりします.このようなことをさけるために,数式展開されている教科書を参考にして,それをなるべく自分の言葉で再構成することが必要でしょう. <そもそもt検定とは何をしているの?> t検定やF検定を含めて,検定とは「ある現象が(ある基準に比べて)どの程度珍しいか?」を調べることです.そのために○○検定は,すべて「確率○○」という形を最終形態とします.そして○○検定に種類があるのは,現象の種類によって確率算出に違いがあるからです. さて,t検定とはどのような現象の確率計算をするものなのか? t検定とは「数値yが基準の場合,ある数値xが発生する確率はいくらか?」という現象を調べるための検定法です.ここでの鍵は「数値xとyは一変数」ということです.このような「一変数の現象」の確率はt分布によって導かれ,そのため,「一変数現象」に対してt分布を使うt検定を適用させることになるのです(ここで正規分布による検定を知っている人は「一変数の現象」はt検定ではなく,正規分布による検定が本来だろう,と思われるかもしれません.この疑問はもっともで,本来の「一変数の現象」は正規分布による検定が担っていたのですが,多くのデータ分析家が「正規分布が使えない(正規分布は大量データに対して適用されることが多い)」小数のデータ用の統計解析法を求めたために開発・普及したのがt検定です.その意味ではt検定は正規分布による検定の系列・修正版と考えることができます). 具体例で考えてみましょう.「普通の人であれば得点50点になるようなテストで,Aさんが得点76点を取った」このような現象に対して検定を行う場合,「50点を基準にして,76点という現象がどの程度珍しいかの確率」と考えます. ・t検定(及び,正規分布による検定)では「基準は○○において,△△という数値の発生」という枠組みでとらえ直す必要がある 計算式は省略しますが,t検定により「t値」「自由度」「確率」を求めます.このときに算出された「確率」とは「基準○○が【本来の姿だと考えたときの】△△発生確率」を意味します.先の例で言えば,人間であれば誰でもそのテストでは50点を取るのが本来の姿なのだ,それ以外の得点は「偶然」に過ぎないのだ,と仮定しているわけです. しかし,偶然は何回も続かないと考えるのが普通なわけですから,発生確率が非常に小さいあるいは大きい場合は,「偶然そうなった」と考える,その前提こそが誤りではないか,と考えられるわけです.Aさんが何回もテストで「80」「90」「78」……のように「50」よりも遙かに高得点を連続で取る人物であるならば,このAさんは「いつも50点を取る普通の人」と考えることは不自然と解釈されるわけです. このように「珍しさ」を基準にして「偶然なのか? 必然なのか?」を解釈します.この「偶然,必然の判断の境目の確率」を「有意水準/危険率」と呼ぶわけです. 先を急ぎます.t検定の本来の使い方は上記のように「一変数の現象」データに対して使われるものですが,心理学や実験データでは,これを応用的に使っており,しかもその応用的使い方が「標準的な使い方」として定着しているという奇妙な状態なのです. 実験の場合では,二変数の間に差があるかどうかを調べるわけですが……この実験デザインで,どのようにt検定の論理「基準は○○において,△△という数値の発生」を持ち込むのでしょうか? 変数A,変数Bの平均を平均A,平均Bとします.いま,二変数の間に差があるかどうかとは,平均Aと平均Bとに差があるかどうかを調べることと同意になりますね? 平均Aと平均Bに差があるかとは,どうやって数式で表現するか? それは平均Aと平均Bが同じであるならば,平均A=平均Bと表現できるわけです.ならば式変形をして…… ○二変数におけるt検定の論理 「平均A-平均B=0」と表現でき,一変数の形に持ち込めた. ↓ 「基準は○○において,△△という数値の発生」に適用 ↓ 「平均値の差は,基準値『0』において,△△という数値の発生」 の確率を求める このようにして,t検定が使えます.具体的には変数Aと変数Bとの平均値の差が例えば「5」とかいう数値だと思いますが,その「5」という数値が「0」を基準にして異なっているのか……ということを調べているわけですね.
お礼
大変参考になりました。 回答どうもありがとうございました。