- ベストアンサー
T検定について
現在とある研究を行っており、その際の検定方法で質問させていただきます。(福祉関係勤務) _______________________________ A、B、C、D、E、F、G、H、I、J、K、L、N、Mさんがいるとします。 これらの方々に、○○という治療を行います。 事前に、14名に痴呆のテスト(点数化されるもの:0点~30点)を行います。 事後にも、同様のテストを行います。 上記にて、○○という治療に効果があるかをT検定を行おうと考えています。 __________________________ 以前、学生時代に、違う研究でT検定を使ったのですが、まったく思い出せません。 そこで、質問です。 例=TTEST(F3:F12,J3:J12,X,Z) 上記例ですと、F3:F12のデータが事前で、J3:J12のデータが事後と記入しているとします。 この場合、その後の、【X】は 尾部 …両側分布か片側分布かを1か2で指定 1…片側分布の値が計算される 2…両側分布の値が計算される 【Z】は 検定の種類 …検定の種類を1から3の数値で指定 1…対をなすデータのt検定 2…等分散の2標本を対象とするt検定 3…非等分散の2標本を対象とするt検定 をいれたらいいのですよね? この場合【X】、【Z】はどうすればよいですか?簡単な説明でよいので解説をつけていただけるとうれしいです。 さらには、0.05より小さい数字が出れば、この○○という治療は、効果あり!といえる。ということであってますかね? 乱筆、申し訳ありません。補足等可能な限りします。よろしくお願いします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
私がこのデータでt-test(T検定)をするなら、 【X】は2で、【Z】は1ですね。 でも、ちょっと厳密な話をしますと、テスト結果を点数化されているそうですが、その場合正規検定の t-test は不適当です。従って、ノンパラメトリック検定をするべきだと誰かに指摘されるかも知れません。こういう場合、「Wilcoxonの順位和検定」ですかねぇ。ちょっと自信ありません。詳しくは参考URLの「手法の選択」を参考に http://www.gen-info.osaka-u.ac.jp/testdocs/tomocom/ さらに、このサイトはすばらしいことにデータを入力して実際に検定を行うことも出来ます。 >0.05より小さい数字が出れば、この○○という治療は、効果あり! ここはちょっと誤解されているかも。数字が例えば0.03と出れば、同じデータが出た100回の実験のうち97回は平均値に差があることが正しくて、3回は嘘っぱちだということです。値が小さいほど間違いは少なくなりますが決してゼロではありませんし、逆に値が大きくても本当は差があるかもしれません。実は「便宜上数字が0.05以下なら正しいことにしようか…」という暗黙の了解があるだけなんですよ。そんな当て物みたいな…と思われるかもしれませんが、それが「t-test」であり「統計学」なんです。 さらに値が0.05より小さいからといって「効果がある」と言い難い場合もあります。例えばある処理をして血糖値の平均値が 200mg/dl から 198 mg/dl に落ちたとしましょう。これに t 検定をして 0.01 と言う数字が出たとしても、この処置による血糖降下作用に意味があるでしょうか?t 検定で分かることはあくまで、「二つの群の平均の差が有意かどうか(違うかどうか)」ただそれだけです。 最後に14人すべてに○○という治療をするんですよね。 1.テストは主観が入らないものですか?つまり、kenchang さん達の良くなって欲しいという意識が影響して点数が高くなってしまうことはありませんか? 2.また、テストを繰り返すことによって例えば「慣れ」て点数が高くなることはありませんか? この2点は実験の根幹に関わるとおもいます。特に2.があるのなら、「○○という治療」が効果があるのか「慣れた」だけなのかわかりません。 参考にしていただけると幸いです。
その他の回答 (3)
- ssmarugoo
- ベストアンサー率47% (84/176)
新人看護師です。回答します。 ○○の治療が効果があるかどうかを調べるわけですね。 まず、痴呆(認知症といいますね)のテストがオリジナルならそのテストの内的整合性について妥当性・信頼性の【クロンバックα係数】を算出して検討します。 あと、テストの点数の分布を調べてください。ヒストグラムを作成するのです。そして、前後とも得点が正規分布するかどうかを確認します。この確認は、【コルモゴルフ・スミノルフ検定】を行います。そして、正規分布が仮定できるかどうか?の結果を出します。正規分布が仮定できたならt検定でOKです。(T検定ではなくtは小文字ね) あと、○○によって、物理的に治療効果が下がることがありえますか? 上がるか?下がるか?が事前に分からない場合に両側検定です。 たぶん認知症の点数の評価なら両側検定(two-tails)を選択するのが妥当です。 もちろん【対をなすt検定(両側】ですね。 あ、正規分布を期待できないなら、ノンパラメトリック検定の【ウイルコクスン検定】ですが。 0.05というのは、有意水準significant levelのことで平均値に差がないときの確率を棄却する判断基準のことです。これは主観的なものでp valueを求めてそれを示すべきです。 被験者のサンプルサイズ(標本数)によって、有意水準の決定はいくらにするか?は変えた方がいいです。サンプルサイズ30以下程度なら、有意水準0.1でもいいでしょう。あとテストの内容にもよります。厳密性が要求されるようなテストのt検定なら、0.001以下に設定とかもしますが、そうでもなさそうなので0.1がいいでしょう。 p valueが0.1以下なら治療効果あり。といえる。でいいですよ。 あ、もちろん被験者のほかの条件をマッチング(一致)させないといけませんが。(選択バイアスに対する対応) すみませんが、それ以前にエクセルでこれらの検定を行うことは不可能ですよ。統計ソフトでやらないと認められませんよ。 ※あと、あらゆるバイアスを制御したり、ランダムサンプリングしないと論文自体が査読でとおりません。もちろんプラセボの効果もブラインドする必要がありますね。できれば、被験者も実験者も、解析者さえもブラインドされたトリプルブラインドテストでなければ、研究と呼べるような代物ではありません。 厳しい内容を書きましたが、医療系では最低これくらいやらないと全く受け付けてもらえませんよ。
- backs
- ベストアンサー率50% (410/818)
大学生が遊びで検定を行うためにExcelを使うのは良いでしょうが,お仕事で検定を行うのであれば信頼できる統計ソフトを用いるべきでしょう。こういうこと(http://bekkoame.okwave.jp/qa2649494.html)がしばしばあるのでExcelはやめた方がよいです。R(http://www.okada.jp.org/RWiki/)なら無料です。 例えば以下のように打ち込むだけでOKです。 jizen <- c(12, 10, 11, 13, 9, 10) #事前のテストデータ(F3:F12のデータ) jigo <- c(25, 28, 29, 27, 24, 26) #事後のテストデータ(J3:J12のデータ) t.test(jizen, jigo) #t検定を行うための関数です p-valueというのがp値ですから,おっしゃるようにこの値が0.05よりも小さければ有意差が認められるということになります。ただし,それが効果ありと断定することができるかといえば,必ずしもそうではない。
補足
回答ありがとうございます。 >大学生が遊びで検定を行うためにExcelを使うのは良いでしょうが,お仕事で検定を行うのであれば信頼できる統計ソフトを用いるべきでしょう。 この点につきましては、素人ながら、承知した上で行っています。 本研究は、一応、法人内の小さな発表の場でのみの研究と現在は考えています。 今後、この研究、又は、別の研究等、学会レベルのモノに関しては、今後勉強して行きたいと思います。 ご教授ありがとうございます。 なお、この質問は、実際、統計処理を行ってから質問を閉じたいと思っております。
- thiku-rin
- ベストアンサー率54% (45/82)
ANo.1 です「実験」の根幹に~ 「実験」と言う言葉をつい使ってしまいましたが、大変不適切でした。申し訳ありません。
補足
すいません。 追加で質問です。 【Z】の部分に関して(記号表記のルールを知らないもので…) 同じ人の前後は、『対をなすデータ』でいいということであってますか?
補足
回答、ありがとうございます。 正直、統計処理をするのは、学生時代も入れ、2回目で、T検定しか使ったことはありません。 今回は、ご指摘の部分も重々承知していますが、○○を行ったことで、実施前とは、有意に差がついたという方向で結果を持っていこうと思います。 今後、学術的な研究も考えていますので、これからさらに勉強して行きたいと思います。 ご教授ありがとうございます。 なお、最後に…のくだりについてですが… 1.例で、痴呆テストを出しましたが、本当は、情緒に関するテストをおこないました。 コレは、完璧に客観性が確認されたテストではなく、さらに、実施した私としても主観性が介助できない部分を感じております。 2.テスト自体は、検査者が2名以上で、実施しており、対象者に行ったものではありませんので、対象者の慣れはありません。ただし、上記で書いたように、検査者の主観を排除しきれていないといった問題も残ります。