- 締切済み
統計学について、早急に回答願います!!
統計学初心者です。 学校の課題で、「肩こりがある人とない人の差」というものをを調べています。 頭の上から撮った写真から肩の角度を出し、表にしました。 そして両方の角度の平均を出しました。 この表から、「肩こりのある人は角度が大きい」ということをいいたいのです。 いろいろ調べてここまで計算してみたのですが、計算結果の読み方が分からず、焦っています。 計算式があっているのかも不安です。 ↓この数字は両方の肩の角度の平均の数字です。 肩こりのない人:(Q2) 23 17 18 24 23 23 15 21 15 22 23 (Q12) 肩こりのある人:(S2) 24 33 25 25 26 16 33 25 30 31 28 (S12) =TTEST(Q2:Q12,S2:S12,2,1) 計算結果:0.015162711 (2%) =TTEST(Q2:Q12,S2:S12,1,1) 計算結果:0.007581356 (1%) =FTEST(Q2:Q12,S2:S12) 計算結果:0.281855627 (28%) =STDEVPA(Q2:Q12) 計算結果:3 =STDEVPA(S2:S12) 計算結果:4.639036663 =CONFIDENCE(0.05,Q20,11) 計算結果:2 ※Q20は"=STDEVPA(Q2:Q12)"の計算結果を入れています =CONFIDENCE(0.05,S20,11) 計算結果:2.7414451 ※S20は=STDEVPA(S2:S12)"の計算結果を入れています 計算式は正しいのでしょうか? そしてこの計算結果から「肩こりのある人は角度が大きい」ということが言えるのでしょうか? 文章にして提出しなければいけないので、できれば詳しく解説していただけると助かります。 よろしくお願い致します。
- みんなの回答 (6)
- 専門家の回答
みんなの回答
- kgu-2
- ベストアンサー率49% (787/1592)
>危険率とは=有意水準ですよね? 危険率は、エクセルなら、TTESTの関数を使って計算され表示される値です。 有意水準は、0.05(5%)か0.01(1%)で判定するのが、統計学の約束事です。最近はコンピュータで簡単に計算できるのでp=0.00023などと書く論文も見ますが、『馬鹿め、生兵法は・・・』と感じています。5%にするか1%かは、研究者の自由(好き勝手)です。 >これは表のどの部分から分かることでしょうか? エクセルなら、TTESTの関数を使って表示されるのが、危険率の値です。有意差の判定に必要なのは、この値だけなので、他の用語はとりあえず知らなくても(計算できなくても)、判定はできます。 私は初心者で、テレビの仕組みを知らなくてもテレビを楽しむことはできる、検定はpさえ分かれば判定はできる、でやっています。 統計学は、教えても身につきません。疑問をもち、自分で結論を得て、ようやく 身につきます。とりあえず、学修の課題を説明できるようにして下さい。 1%と5%をどのように使い分けるか。 「有意差が無い」との表現は、間違いである。 アンケートの回答は、通常t検定は不適である。 ウイルコクスンの順位差検定、χ(カイ)2乗検定、相関分析をマスターすれば、論文の80%の検定は出来るそうです。ただし、相関分析は専門家でも解釈などがかなり誤っています。
> 両肩の平均を使わず、「ない人の左とある人の左」 > という感じで計算してみました。 左と左、右と右という比較はうまくないような気がします。 例えば左肩だけこる人の左肩の角度と、右肩だけこる人の左肩の角度、それに両肩ともこる人の左肩の角度はどの人も同程度の値になるでしょうか? そうはならないのではないでしょうか? 両肩の平均を使うことも妥当かどうか怪しいところもありますが、片側のみの値よりもましなのではと思います。 (まあ、学校の課題とのことですので、そこまで細かいところは追求されないでしょうが……) また、ANo.4さんでの補足で > 危険率とは=有意水準ですよね? > これは表のどの部分から分かることでしょうか? > また別に有意水準を検定する必要があるということでしょうか? と書かれていますが、基本的なところを勉強されたほうが良いと感じます。 例えば、参考URLの「ハンバーガーショップで学ぶ楽しい統計学 ──平均から分散分析まで──」の4章のt検定(対応なし)等を読んでみてください。 危険率=有意水準というのはあっています。 あなたが記載した【α=0.05】がそれになります。 有意水準に対して検定をする必要はありません。 有意水準に対して、p値がどうなっているかを見る必要があります。 あとは、等分散を仮定していいかどうかは、 > FTEST(Q2:Q12,S2:S12) 計算結果:0.281855627 (28%) この結果から判断することになります。
- kgu-2
- ベストアンサー率49% (787/1592)
No3です。何を書き込んでも、研究者のマナー違反の恐れはないようなので。 補足を読むと、検定の途中結果の記述は多すぎる、歯に衣を着せず言えば、不要な情報ばかり。 検定の解釈で必要なのは、 1)適切な検定方の選択 2)危険率 だけ >できれば詳しく解説していただけると 私も学生時代は、統計学(推計学)の試験は白紙状態。補足の記述から判断して、詳しく解説しても・・・・。 というわけで、私ならという方法を書きます。 検定目的は、「有意差を見つけること」です。 検定法は、どれを選択するかは、する人の自由です。 ただし、前提条件は守る必要があります。たとえば、t検定はデータが正規分布(あるいはt分布)していることが前提です。今の場合、正規分布していることは証明されていません。が、データを得た被験者を意図的に選んだのでなければ、「恣意的に選んだのではないから、母集団は正規分布が想定される」と主張できます。 そこで、t検定で危険率を計算すると、「5%より小さいので、有意差あり」と結論します。 F検定の結果は、隠します。質問されたら、「F検定では有意差は認められませんでした」と返答して下さい。それでも、「F検定・・・・、」とゴチャゴチャ言う者は、「生兵法は怪我の元」の類です。ただ、質問者が生兵法と決めつけて、へこませる力があるとは思えませんので、返り討ちにならないように。 時間とソフトがあれば、ウィルコクスンの順位差検定が、この場合最も適切だと考えます。
- kgu-2
- ベストアンサー率49% (787/1592)
学生か院生の研究でしょうか。 そうすると、回答するのは、研究者のマナーに反するので・・・。 そこで、独り言。 T検定では、有意差有り。 F検定では、有意差無。 結論、・・・・。 >できれば詳しく解説していただけると助かります。 教員など、指導者はいないのですか。 おもしろい結果なので、「私もやって、先に発表しよう」という輩が出てこないとも限らず、データを示しての外部への質問は違反。会社なら、秘密漏洩でクビ。 指導者がいないのなら、その旨書いて下さい。 エクセルの計算については、拒否反応もありますが、T検定、F検定の計算にあやまりがある、とは耳にしていません。簡単にできるので、私は使っています。
補足
回答ありがとうございます。 今専門学校に通っているのですが、そこで実習の授業の一環でグループで調べて発表しなさい!という課題が出てるんです。 指導者もおらず、グループの中には統計なんてできる人がいなくて・・・。 特に厳密な実験ではないので、内容については大丈夫です。 エクセルの分析ツールを使用して以下のような結果になったのですが、どうやっても読み方が分りません。 よろしければ教えていただけないでしょうか? t-検定 : 等分散を仮定した2標本による検定(左) 変数 1 変数 2 平均 20 25.63636364 分散 10.4 16.25454545 観測数 11 11 プールされた分散 13.32727273 仮説平均との差異 0 自由度 20 t -3.620843103 P(T<=t) 片側 0.000851899 t 境界値 片側 1.724718218 P(T<=t) 両側 0.001703798 t 境界値 両側 2.085963441 t-検定 : 等分散を仮定した2標本による検定(右) 変数 1 変数 2 平均 20 27.45454545 分散 28.4 42.87272727 観測数 11 11 プールされた分散 35.63636364 仮説平均との差異 0 自由度 20 t -2.928571429 P(T<=t) 片側 0.004153148 t 境界値 片側 1.724718218 P(T<=t) 両側 0.008306296 t 境界値 両側 2.085963441 【α=0.05】 t-検定 : 分散が等しくないと仮定した2標本による検定(左) 変数 1 変数 2 平均 20 25.63636364 分散 10.4 16.25454545 観測数 11 11 仮説平均との差異 0 自由度 19 t -3.620843103 P(T<=t) 片側 0.000910019 t 境界値 片側 1.729132792 P(T<=t) 両側 0.001820037 t 境界値 両側 2.09302405 t-検定 : 分散が等しくないと仮定した2標本による検定(右) 変数 1 変数 2 平均 20 27.45454545 分散 28.4 42.87272727 観測数 11 11 仮説平均との差異 0 自由度 19 t -2.928571429 P(T<=t) 片側 0.00430977 t 境界値 片側 1.729132792 P(T<=t) 両側 0.00861954 t 境界値 両側 2.09302405 【α=0.05】
- backs
- ベストアンサー率50% (410/818)
Excelのワークシートで手計算をするのではなく、専用のソフトウェアを使うべきでしょう。また、Excelの分析ツールを使うことは、たぶんどの学術領域でも認められないでしょう(^_^;) (ダメという決まりがあるわけではありませんが、使わなくてもよいものをわざわざ使う必要はないということですね) Rなら無料で次のように、たった3行のコードを書くだけで実行できますよ(医療系の分野ならJMPやPRISMなんかが有名でしょうけど)。 > Q2 <- c(23, 17, 18, 24, 23, 23, 15, 21, 15, 22, 23) > S2 <- c(24, 33, 25, 25, 26, 16, 33, 25, 30, 31, 28) > t.test(Q2, S2) Welch Two Sample t-test data: Q2 and S2 t = -3.6209, df = 17.923, p-value = 0.001965 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -10.344454 -2.746455 sample estimates: mean of x mean of y 20.36364 26.90909 なお、「肩こりのある人は角度が大きい」ということを積極的に主張したいならば、両側検定ではなく片側検定を行えばよろしい(片側検定ならp値を1/2倍すればよい)。
その計算では「肩こりのある人は角度が大きい」ということが言うのはできないでしょう。 2群の母平均の差の検定を行います。 恐らくExcelを使っているでしょうから、分析ツールから「t 検定: 等分散を仮定した 2 標本による検定」か「t 検定: 分散が等しくないと仮定した 2 標本による検定」のどちらかを使うのが一番簡単な方法です。
補足
回答ありがとうございます。 分析ツールを使って以下のような結果を出してみました。 両肩の平均を使わず、「ない人の左とある人の左」 という感じで計算してみました。 やはり読み方が分からないので、もし、よろしければ回答お願いいたします。 t-検定 : 等分散を仮定した2標本による検定(左) 変数 1 変数 2 平均 20 25.63636364 分散 10.4 16.25454545 観測数 11 11 プールされた分散 13.32727273 仮説平均との差異 0 自由度 20 t -3.620843103 P(T<=t) 片側 0.000851899 t 境界値 片側 1.724718218 P(T<=t) 両側 0.001703798 t 境界値 両側 2.085963441 t-検定 : 等分散を仮定した2標本による検定(右) 変数 1 変数 2 平均 20 27.45454545 分散 28.4 42.87272727 観測数 11 11 プールされた分散 35.63636364 仮説平均との差異 0 自由度 20 t -2.928571429 P(T<=t) 片側 0.004153148 t 境界値 片側 1.724718218 P(T<=t) 両側 0.008306296 t 境界値 両側 2.085963441 【α=0.05】 t-検定 : 分散が等しくないと仮定した2標本による検定(左) 変数 1 変数 2 平均 20 25.63636364 分散 10.4 16.25454545 観測数 11 11 仮説平均との差異 0 自由度 19 t -3.620843103 P(T<=t) 片側 0.000910019 t 境界値 片側 1.729132792 P(T<=t) 両側 0.001820037 t 境界値 両側 2.09302405 t-検定 : 分散が等しくないと仮定した2標本による検定(右) 変数 1 変数 2 平均 20 27.45454545 分散 28.4 42.87272727 観測数 11 11 仮説平均との差異 0 自由度 19 t -2.928571429 P(T<=t) 片側 0.00430977 t 境界値 片側 1.729132792 P(T<=t) 両側 0.00861954 t 境界値 両側 2.09302405 【α=0.05】
補足
kgu-2さん、丁寧な回答ありがとうございます。 危険率とは=有意水準ですよね? これは表のどの部分から分かることでしょうか? また別に有意水準を検定する必要があるということでしょうか? 被験者は恣意的選んではいないという前提で勧めています。 無知で申し訳ありません。 この発表でどうなるってことはないのですが、やるからにはどうしてもしっかりやりたくて。 時間もソフトもないのでkgu-2さん、もう少しお付き合いいただけないでしょうか。 宜しくお願い申し上げます。