- 締切済み
平均値の検定と元データの検定
例えば、男女の100m走のタイムに有意な差があるかを95%信頼区間、 両側検定を用いたT検定で調べるという実験があったとします。 1.まず、実際に8人の被験者に走ってもらい以下のデータを得ます。 A子~D子さんに4回ずつ走ってもらう→16個のデータ A男~D男さんに4回ずつ走ってもらう→16個のデータ 2.このデータからA子さんの4回走った平均値、B子さんの4回走った平均値などという風に4つの平均値データ 同じくA男さんの平均値、B男さんの平均値という4つの平均値データを得ました。 (A子さんは速く、B子さんは遅いなどばらばら) 3.さらに女子(A子さん~D子さん)の一本目の平均、二本目の平均、といった平均の取り方で取った 平均値データ、同じように男子の平均値データ計8つが得られました。 (男女とも1本目の平均値が最も速く、4本目の平均値が最も遅い) そして実際にT検定した所、 ・16個のデータを比べたら有意差は出たが、(p≒0.01) ・4人の平均値のデータを比べたら有意差が出ない(p=0.054) ・4本の平均値のデータを比べたら有意差が出た)(p≒0.01) という状況に陥ったとします。 ここから、 1)男女の100m走のタイムに有意差はあるといえるのか? 2)4人の平均と、4本の平均で有意差が違うのは何故なのか? (イメージ的に何故なのかなんか腑に落ちません。4×4のデータ表があって、右への平均と下への平均で こんなに差が出ていいものなのでしょうか??) (実際は男女の100m走実験で無く、分かりやすいため書き変えております。 よって、実験をこう変えた方がいいなどの指摘はご容赦下さい。) 宜しくお願い致します
- みんなの回答 (4)
- 専門家の回答
みんなの回答
#3訂正 最後の行で「(a)と(b)の方法は」とありますが(b)ではなく(c)の間違いです。
3つの解析方法をそれぞれ (a)16個のデータを比べたら有意差は出たが、(p≒0.01) (b)4人の平均値のデータを比べたら有意差が出ない(p=0.054) (c)4本の平均値のデータを比べたら有意差が出た)(p≒0.01) とします。 この3つの方法のうち妥当と考えられる方法は(b)となります。 従って、男女の100m走のタイムに有意差はある」とは言えません。 なぜ「4人の平均と、4本の平均で有意差が違う」のかというと、おそらく男女差と本数の差以上に個人差があったためでしょう。 差があると考えられるのであれば、もっと大勢の人を調べないといけないということです。 以下、もう少し詳しい説明を付け加えますが、長文で読みづらいかと思います。 あと途中の計算を少し端折って書いてあります。 始めにデータの構造模型を考えます。 性別iの走者kのj本目のタイムをx_{ijk}、総平均をμ、性別による効果をα_i、本数による効果をβ_j、性別‐本数間の交互作用をγ_ij、個人差をε_ik、1本毎の誤差をδ_ijkとすると x_{ijk} = μ + α_i + β_j + γ_ij + ε_ik + δ_ijk と表現できます。 ここで、μ, α_i, β_j, γ_ijは未知の定数で、ε_ikは平均が0で分散がσ^2の正規分布に従う確率変数、δ_ijkは平均が0で分散がτ^2の正規分布に従う確率変数であり、 1≦i≦2、1≦j≦m、1≦i≦n Σ_i α_i = 0 Σ_j β_j = 0 Σ_i γ_ij = 0 Σ_j γ_ij = 0 を満たすとします。 さて、(a)~(c)の3つの検定方法ははどれも男女の平均の差 d = (Σ_{jk} x_{1jk})/(mn) - (Σ_{jk} x_{2jk})/(mn) (Σ_{jk}はjとkについての和とします) の絶対値を各方法で推定した分散で割った値の大小で比較する方法です。 dはどの方法でも同じ値なので、各方法で有意差の有無の違いが生じたのは、推定した分散が異なるためです。 (自由度の違いもありますが) では、次にdの期待値E[d]と分散V[d]を求めてみます。 Σ_{jk} x_ijk/(mn) = μ + α_i + Σ_k ε_ik/n + Σ_{jk} δ_ijk/(mn) なので E[d] = E[Σ_{jk} x_{1jk}/(mn) - Σ_{jk} x_{2jk}/(mn)] = E[α_1 - α_2 + Σ_k (ε_1k - ε_2k)/n + Σ_{jk} (δ_1jk - δ_2jk)/(mn)] = α_1 - α_2 V[d] = V[α_1 - α_2 + Σ_k (ε_1k - ε_2k)/n + Σ_{jk} (δ_1jk - δ_2jk)/(mn)] = V[Σ_k (ε_1k - ε_2k)/n + Σ_{jk} (δ_1jk - δ_2jk)/(mn)] = V[Σ_k (ε_1k - ε_2k)/n] + V[Σ_{jk} (δ_1jk - δ_2jk)/(mn)] = Σ_k (V[ε_1k] + V[ε_2k])/n^2 + Σ_{jk} (V[δ_1jk] + V[[δ_2jk])/(mn)^2 = 2(σ^2/n + τ/(mn)) そして各方法の推定した分散の期待値を求めてみると、それぞれ次のようになります。 (a) E[Σ_{ijk} (x_{ijk} - Σ_{jk} x_{ijk}/(mn))^2/(mn(mn-1))] = E[Σ_{ijk} (β_j + γ_ij + ε_ik - Σ_{k} ε_ik/n + δ_ijk - Σ_{jk} δ_ijk/(mn))^2/(mn(mn-1))] = (Σ_{ijk} (β_j + γ_ij)^2 + E[Σ_{ijk}(ε_ik - Σ_{k} ε_ik/n)^2] + E[Σ_{ijk}(δ_ijk - Σ_{jk} δ_ijk/mn)^2])/(mn(mn-1)) = (2nΣ_j (β_j)^2 + nΣ_{ij} (γ_ij)^2 + 2m(n-1)σ^2 + 2(m-1)(n-1)τ^2)/(mn(mn-1)) = 2((m-1)(n-1)/(mn-1))(Σ_j (β_j)^2/(m(m-1)(n-1)) + Σ_{ij} (γ_ij)^2/(2m(m-1)(n-1)) + σ^2/((m-1)n) + τ^2/(mn)) (b) Σ_j x_{ijk}/m = μ + α_i + ε_ik + Σ_j δ_ijk/m であるから E[Σ_{ik} (Σ_j x_{ijk}/m - Σ_{jk} x_{ijk}/(mn))^2/(n(n-1))] = E[Σ_{ik} (ε_ik - Σ_k ε_ik/n + Σ_j δ_ijk/m - Σ_{jk} δ_ijk/(mn))^2/(n(n-1))] = (E[Σ_{ik} (ε_ik - Σ_k ε_ik/n)^2] + E[(Σ_j δ_ijk/m - Σ_{jk} δ_ijk/(mn))^2])/(n(n-1)) = 2((n-1)σ^2 + (n-1)τ^2/m)/(n(n-1)) = 2(σ^2 + τ^2/m)/(n)) =V[d] (c) Σ_k x_{ijk}/n = μ + α_i + β_j + γ_ij + Σ_k ε_ik/n + Σ_k δ_ijk/n であるから E[Σ_{ij} (Σ_k x_{ijk}/n - Σ_{jk} x_{ijk}/(mn))^2/(m(m-1))] = E[Σ_{ij} (β_j + γ_ij + Σ_k δ_ijk/n - Σ_{jk} δ_ijk/(mn))^2/(m(m-1))] = (E[Σ_{ij} (β_j + γ_ij)^2] + E[Σ_{ik}(Σ_k δ_ijk/n - Σ_{jk} δ_ijk/(mn))^2])/(m(m-1)) = (2Σ_j (β_j)^2 + Σ_{ij} (γ_ij)^2 + 2(m-1)τ^2/n)/(m(m-1)) = 2(Σ_j (β_j)^2/(m(m-1) + Σ_{ij} (γ_ij)^2/(2m(m-1)) + τ^2/(mn)) 以上のことから、分散を正しく推定できているのは(b)の方法のみということがわかりました。 (a)と(b)の方法は、σ^2がβ_jやγ_ijを含んだ項の和より十分大きい場合、(b)よりも分散を小さく見積もりやすく、その結果検定統計量が大きくなり、有意差が得られやすくなります。
- ken-nosuke
- ベストアンサー率36% (56/154)
ANo1です。 男女の差を見たいときは、その他の要素は、極力一定にするのが原則です。 今回の問題は、4回づつ続けて走っているため4回の条件が一定ではありません。結果からも1~4回で明らかに遅くなっています。 男女の差を求めるためには、分散分析により全体のバラつきから、4人の個人のバラツキ、4回の繰り返しによるばらつきを除去したうえで、検定する必要があります。 簡単に説明する方法を知りませんので、ご自身でご勉強されるようお願いします。 なお、 (1)分散分析には、平均値だけでなく、個々のデータが必要です。 (2)4人の平均、4回の平均を小数点以下を丸めて処理しているため、全平均が、個人別と回数別で、異なっています。統計計算では、おおざっぱな丸めは、誤差を大きくしますので、少なくとも小数点以下1桁まで出した方が良いと思います。 (3)4人の平均値で有意差が無いデータになっていますが、限りなく優位に近いので、サンプル数(人数)を増やせば、この計算でも優位になると思います。
- ken-nosuke
- ベストアンサー率36% (56/154)
1)男女の100m走のタイムに有意差はあるといえるのか? 男女の比較はデータの表示がないので不明。 2)4人の平均と、4本の平均で有意差が違うのは何故なのか? (イメージ的に何故なのかなんか腑に落ちません。4×4のデータ表があって、右への平均と下への平均で こんなに差が出ていいものなのでしょうか??) (1)4人の平均で有意差がないということは、「4人に差があるとはいえない」ということ。 (2)4回の平均で有意差があるということは、「回毎の差がある」ということ。 1回目から4回目まで順に遅くなったとすれば、走るごとにだんだん疲れて遅くなったと考えられる。 回数と、平均値の相関について検定して、有意になれば、回数との相関があると言える。 もし、回毎に、早くなったり、遅くなったりするのであれば、たとえば、風向きとか、走る間隔とか別の要素を加えて、検定すれば、回数ごとの変化の原因がつかめることになる。 今回の実験で考えられることは、「4人の間に差は見られないが、いずれも繰り返し走ると遅くなる」ということでしょうか。
お礼
御回答ありがとうございます。そして言葉足らずで申し訳ございません。 4人の平均で有意差があるというのは、 (A子が4回走った平均24秒、B子22秒、C子20秒、D子26秒、 A男が4回走った平均21秒、B男19秒、C男20秒、D男18秒) この場合女子のデータ(24,22,20,26)と男子のデータ(21,19,20,18)という4つずつの数値でT検定した結果、有意差が出なかった。(実際にこの場合p>0.05です。) 4回の平均で有意差があるというのは、 (A子~D子1回目のタイムの平均21秒、2回目22秒、3回目23秒、4回目25秒) (A男~D男1回目のタイムの平均17秒、2回目18秒、3回目19秒、4回目22秒) で、女子のデータ(21,22,23,25)と男子のデータ(17,18,19,22)を比べた 結果有意差が出た。(この場合p=0.03です。) なのでおそらく、 >>(1)4人の平均で有意差がないということは、「4人に差があるとはいえない」ということ。 >>(2)4回の平均で有意差があるということは、「回毎の差がある」ということ。 のような、人ごと、回ごとの有意差は検定していないと思われます。 さらに、女子のデータ計16、男子のデータ計16でのT検定では有意な差が出ました。 また、今回言いたいのは、各個人や回数の違いよりは、「男子は女子に比べ○○である。 (足が速い、体力があるなど)」という結論を導きたいと思います。 宜しくお願い致します。