• ベストアンサー

t検定のt値の式の導出の仕方が分かりません

まずはこちらのサイトをご覧ください ttp://sasoude.ojaru.jp/t.pdf (A-B)の値の標準誤差で グループAとBのケース数が等しい場合 AとBのケース数が等しくない場合 のt値の式の分母が違います。 これらは1ページ目のt値の式からどのように導出されるのでしょうか? 分かる方いましたら教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

>(nA+nB-2)というのは、A群とB群の自由度 (nA-1),(nB-1)を足したものでしょうか? そう考えて差し支えないと思います。 >(nA-1)の「-1」の意味もわかりません。 これは不偏分散Uが U=1/(n-1) *Σ(x-m)^2 で計算されることに対してでしょうか? 元々、分散Vは V=1/n *Σ(x-μ)^2 で計算されます。二つの違い(-1が有るかどうか以外に)が分かりますでしょうか? あえてmとμと使い分けました。母集団の平均値μが分かっている時は nを使って計算していいのですが標本から計算された平均mを使う時は (n-1)を使います。分かりやすい例として標本数1を考えて見ましょう。 今、母集団の平均μが分かっている時は標本数1でも分散を計算することは できます。(信頼度は置いといて)1個のデータで1個の分散が計算できますから 自由度1です。ところがμが分からない時は標本の平均はその標本の 値そのままであってどんな値が出ても分散は0になります。これは自由度が0と 考えるのが妥当でしょう。(0以外の値をとることができませんから) このように標本データから計算される値を使って何らかの統計量を 計算する時には自由度は使った数だけ減ります。 その意味で上の回答も (nA+nB-2) は全データ数から使った統計量(それぞれの平均mA,mB)の二つを 引いて自由度が(nA+nB-2)となったと考えてもいいのです。 (本質的には同じことなのでそれぞれの自由度を足したと考えてもいいですよ)

shimataq
質問者

お礼

とても良く分かりました。ありがとうございます。

すると、全ての回答が全文表示されます。

その他の回答 (1)

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.1

ウェルチの方法ですね。少し見慣れない式変形をしてあるようですが、 まず第一に両者は同じ式ですよ。nA=nBとして下の式を等式変形してみてください。 上の式になります。 次になぜこのような式になるかということですが、(あまり、1ページ目の 式に意味はないですね。SEと書いてあるだけですから) 本来、A群とB群のそれぞれの不偏分散量をUA,UBとすると それぞれ(nA-1),(nB-1)をかけて偏差平方和に戻して これを自由度(nA+nB-2)で割ることで両群の分散推定量を出します。 Ueとするとt値を計算するにはそれぞれの標本数で割って それぞれの個々の分散値にしてから足して平方根を出して分母に持ってきます。 つまり、 Ue={(nA-1)UA + (nB-1)UB}/(nA+nB-2) √{Ue/nA+Ue/nB)}=√{Ue(1/nA+1/nB)}=√{(nA+nB)Ue/nAnB} この両者を合わせてまとめると下の式になります。 (UA=sA^2,UB=sB^2です。念のため)

shimataq
質問者

補足

分かりやすい回答ありがとうございます。 自由度に関して質問です。 (nA+nB-2)というのは、A群とB群の自由度 (nA-1),(nB-1)を足したものでしょうか? あと、いまいち自由度の意味がよく分かりません。 また(nA-1)の「-1」の意味もわかりません。 もしよろしければ、ご回答お願いします。

すると、全ての回答が全文表示されます。

関連するQ&A