- ベストアンサー
統計学 t-testについて 誰か助けて下さい!
Hypotesis testingを英語で習っているのですが、t-testの中の one sample t-test pooled t-test paired t-test chi-square test...etc の特徴が今一つかめません。 その特徴がつかめないと問題に対して、どのt-testを使っていいのかわからないため、問題に答えられません。 どなたか教えて下さい。 また、私でも読めば分かるような簡単なサイトがありましたら教えて下さい!!!
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
再度登場させていただきます. 「対応なし/あり」についてですが,tokotoko1212さんが挙げられている「広告(advertising)」を例にして説明します. 宣伝をより効果的にするために開発された広告があるとします.この新広告が,これまで使用してきた旧広告よりも効果があるかを調べたいとします. 調査1 できれば旧広告と新広告を全く見たことがない人をある程度の人数集めます.そして半分の人達を旧広告,もう半分の人達は新広告を見せます.広告を見せた後に,「その広告された商品をどの程度買いたいと思いますか?」を質問して購買欲求得点を集計,それぞれの平均値を比較します. この場合では S1~S8さんの8人が調査に協力してくれたとして…… 新広告群: S1の得点 S2の得点 S3の得点 S4の得点 旧広告群: S5の得点 S6の得点 S7の得点 S8の得点 このようになっており,新広告群と旧広告群では同じ人の得点は含まれていません(何を問題にしているかは調査2を見てください). 調査2 やはり全く広告を見たことがない人を集めます(調査1とは別人).半分には「旧広告→新広告」,もう半分には「新広告→旧広告」の順番で広告を見せます(順番を変えているのはカウンターバランスのためです).そしてそれぞれの広告を見てもらった後に,一回一回購買欲求得点を出してもらいます. この場合では 旧広告 新広告 その差 A1 得点 得点 x1 A2 得点 得点 x2 A3 得点 得点 x3 A4 得点 得点 x4 A5 得点 得点 x5 A6 得点 得点 x6 A7 得点 得点 x7 A8 得点 得点 x8 旧得点平均 新得点平均 xの平均 A1~A8のデータで,x平均が「0」ではない(0であれば,旧と新では違いがない→新広告の意味がないとなります)ということを証明します. このデータではA1さんのデータが旧広告群と新広告群の二つ,二回登場しています. 長々と書いてしまいましたが,対応なしが調査1で,対応ありが調査2です.このように同一対象のデータが使われている場合は「対応あり」ということになります.
その他の回答 (3)
- selfer
- ベストアンサー率76% (104/136)
仮説検定(Hypotesis testing)のt検定(t-test)とχ2検定(chi-square test)ですね.両者は異なる手法です. t検定は,t分布と呼ばれる確率分布を利用した統計検定の一種です.t検定の根本的な使用法は,ある得点(x)が基準点(0)に比べて離れている場合,どの程度離れているか,確率統計的に離れているかどうかを調べるものです. 実際にはいくつかの使われ方がしています. ☆t検定 1)一標本におけるt検定(one sample t-test) 先に挙げた根本的な使用法をそのまま使ったやり方です. 使用例としては,大学受験の偏差値は50が平均になるようになっていますが,例えば,Aさんは偏差値53だとします. Aさんの偏差値53は平均(基準)の50に比べて,確率統計的に有意に高いといえるのか? などでしょうか? 2)対応なし二標本の差に関するt検定(pooled t-test) 訳の方がだんだん怪しくなりますので,訳語は別にただしいものを確認して下さい. 二つの標本・集団の平均値の差の検定を調べる場合に使います.実験系でt検定を使う場合は大抵コレです.差があるならば,二標本の平均点の差は「0」(これを基準とする)とは統計確率的に異なる,としてt分布を利用します. 3)対応ありt検定(paired t-test) 対応がある二つの標本・集団の平均値の差の検定を調べる場合に使われるものです.2と3は両方とも二標本の平均値の差の検定であり,違いは「対応がある・なし」ですので,「対応」の意味を注意して下さい. ☆χ2検定 χ2分布という確率分布を利用する統計的検定です.主に,期待値と実測値とのズレが有意に異なるかどうかを調べます.一口にχ2検定といっても,その用途によって,複数の使われ方があります(今回はt検定に関する質問のようなので省略します).
統計英語はさっぱりわからないので カンケイサイトだけ
以下の参考URLは参考になりますでしょうか? 「エクセル統計分析」 ●http://stat.eco.toyo.ac.jp/~michiko/newfront/ch04/ (初歩からのデータ分析) 最近は分かりやすい統計の本が出版されていますので、図書館や本屋で探されてはいかがでしょうか? ご参考まで。
お礼
サイトにとにかく行ってみました。初歩からのデータ分析:◎でした。分かりやすく、セクションごとに分かれていて、スライド式でポイント重視。ご紹介して頂き有難うございました。 皆さんは何でそんなに分かり易いサイトをご存知なんですかね。それはともかくとても為になりました。感謝です!
お礼
かなり分かりやすかったです。丁寧な説明有難うございました。統計学は学び始めのため頭の中がパニック状態なんです。selferさんの説明で頭の整理が出来そうです。 pooled t-testは実験系にはこのt検定が使われるのですね。なるほど。 paired t-testの場合は、マーケティングなどのadvertisingをする前、した後のセールスの違いなど、このような時に使うのでしょうか? 「対応」のある/なしの差が分かっていないような気がします。もし宜しければ、もう少しその違いについて教えて頂けないでしょうか?