- ベストアンサー
マイナスのt値についての違和感とは?
- マイナスのt値が出る場合は違和感を感じることがありますが、実際には絶対値として扱われるため問題はありません。
- t値がマイナスになる計算方法に違和感を感じる人もいますが、統計ソフトの出力によって決まる結果です。
- 平均値の差を問題にする場合は、必ず平均値が大きい方から小さい方を引くと考えるべきです。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
> もう少し理論的に、必ず正の値になるようにするべきだ、いや両方使っていい、いやいやそこは絶対値を書くべきだ、といった説明が知りたいです。 数学的にt分布において、いわゆる検定統計量であるt値はマイナスの値をとりうるので、マイナスの値がt値として得られることに何ら問題はありませんし、そもそもそれが"理論的"でしょう。 私は逆に > マイナスがでるような計算をすること自体に強烈な違和感があります。 というのが不思議だなぁと思いました(^_^;) > 統計ソフトの出力がそうなっている これはプログラマーがどのような式を用いているか(どのように計算させるか)によるものです。ごく一般的な公式としては分子に (X1_bar - X2_bar) という計算式がでてきますから、プログラム中にこの式を記せば、関数の引数にX1のデータベクトル、X2のデータベクトルを指定したとき、X1がX2より大きければプラスのt値が計算されるでしょうし、逆にX1がX2よりも大きければマイナスのt値が得られるでしょう。 Rのt.test()でもそのようになります。 > a <- rnorm(10, mean=100) # 平均が100の正規乱数を10個用意する > b <- rnorm(10, mean=50) # 平均が50の正規乱数を10個用意する > t.test(a, b) # aを先に指定するX1_barは変数aの平均値になる Welch Two Sample t-test data: a and b t = 112.9208, df = 13.99, p-value < 2.2e-16 # t値は正の値 > t.test(b, a) # bを先に指定するX1_barは変数bの平均値になる Welch Two Sample t-test data: b and a t = -112.9208, df = 13.99, p-value < 2.2e-16 # t値は負の値 もちろん、質問者さんがご指摘されているように、実質的には符号の正負は関係ないので abs(X1_bar - X2_bar) といったように、計算式に絶対値として書いてしまう場合だってありえるわけです。
お礼
色々と調べていたら、私の思い込みが間違っているような気がしてきました。 片側検定と両側検定の使い分けは仮説の時点で決まるものですが、実際に自分が取っていた手順を考えると、自動的にp値まで計算してから仮説を思い出し、そこで必要があれば片側/両側検定に適切な処理をしていました。 要するに使い分けのタイミングが後ろにずれていて、そのせいでt分布のマイナス部分の意味を失念していたように思います。 あと違和感に関しては、t分布の確率表は上側確率のものしか見たことがないので、そのために見慣れないマイナス表記が奇妙に思えるのかもしれません。 ありがとうございました。