- ベストアンサー
Excelでt検定を行うTTESTという関数
Excelでt検定を行うTTESTという関数 の使い方についてわからないことがあります。 検定の種類で1-3の数字を選ばないといけないようで、helpを見ると下記のような説明が書かれているのですが、何のことかわかりません。それぞれどのような場合に使うのでしょうか?具体的な簡単な例で説明していただけると助かります。 1 対をなすデータの t 検定 2 等分散の 2 標本を対象とする t 検定 3 非等分散の 2 標本を対象とする t 検定
- みんなの回答 (11)
- 専門家の回答
質問者が選んだベストアンサー
たとえば二つのクラス(1組と2組)に同じ試験をやり、どちらが優秀であるかを、その平均で比べるときを考えます。この時は一人一人の点数は、二つのクラスですから対応関係がありません。すなわち対をなすデータの検定ではありません。 もし1組だけ考えて、1回目の試験のあとで特別教育してから同じレベルの試験をやり直して能力が向上したかを平均値で見て調べるとします。この時はそれぞれ人について1:1対応がありますので対のあるデータの検定になります。 また、等分散と非等分散は1組と2組の点数の分散が問題になります。実測値ですから通常完全に一致はしません。もし、その差が有意でない、つまり差が小さくて本当に差があると結論できないならば、共通の分散を使ってt値が計算でき、平均値の差の検定ができます。ここで共通の分散はそれぞれのサンプル数をn1,n2, 偏差平方和をS1,S2とすれば s=[(S1+S2)/{(n1-1)+(n2-1)}]^(1/2) で出します。ところが両者の分散の差が有意である(つまり両者の分散に差がある)ときにはもう少し複雑な計算になります。
その他の回答 (10)
- kgu-2
- ベストアンサー率49% (787/1592)
No5です。感情的になっていませんし、なる必要もないのですが。 教科書を持ち出したのは、「差が無い(同じ)」という表現は、どこにもないでしょう。すなわち、「差が無いということは、言えない」と私が言っても、信じますか。明確にしたかっただけです。 >具体的な簡単な例で説明していただけると助かります。 他の書き込みでは、書かれていないようなので(感情的であれば、わざわざ教えません)。 教科書には、あまり具体的ではないのですが、高血圧の患者について、入院前と入院後の血圧の検定をあげておきます。 対応のある場合は、同一の人の前と後を比較する。同一の人ですから、前と後のデータ数は同じになります(必然的に)。 もちろん、高血圧は、肥満でも、糖尿病でも。入院前後は、トレーニング前後でも。ただ、データは、機器の測定値なら妥当ですが、対面での聞き取り、アンケートなどは不適です(専門家は、適切な検定法を使いますが)。学習効果は、前と後のテストのレベルを同じにする、というのは当然です。文字では同程度、と簡単に書けますが、同程度の裏付けをどのようにするのかについては、読んだことがありません(No5)。 対応の無い場合は、同一人であっても、なくても構いません。ですから、人数が違っている場合がほとんどです。 >10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方の検査を受けてもらったとします。 正常者は検査A、違う正常者は検査B、と読めます。正常者に1年生、検査Aに国語、違う正常者に2年生、検査Bに算数で実施。これで検定しても、何が言えますか。的外れ、という意見は、的外れでしょうか。 厳しい表現をしたのは、間違いに気づくだろうと。統計は、教えてらうとその通りにはできても、身に付かないので、次の事例では役立たない、という経験が嫌ほどあります。 私も「差が無い」ことを主張したくて悩みました。が、無理だと理解するのに約3年かかりました。今では工夫しています。それには、統計の専門家が必要だ、というのがアドバイスです。具体的なデータが分からないと。かと言って、方法を教えるのは私が、データの提示は質問者が、研究者として倫理の問題があるので、というのがNo10。
補足
厳しいお言葉を叱咤激励と捕らえずに、こちらが感情的になっていて申し訳ありませんでした。。 仰っていたことを冷静に読み返すと、回答者様の言っていることが納得できてきました。 ありがとうございます。 > 教科書を持ち出したのは、「差が無い(同じ)」という表現は、どこにもないでしょう。 > すなわち、「差が無いということは、言えない」と私が言っても、信じますか。 信じます。 少しでも納得のいく説明があれば、信じる方向で理解しようとします。 それでも信じられなければ、懐疑的に考えると思いますが。。 > >具体的な簡単な例で説明していただけると助かります。 > 他の書き込みでは、書かれていないようなので(感情的であれば、わざわざ教えません)。 説明をありがとうございます。 > >10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方 > >の検査を受けてもらったとします。 > 正常者は検査A、違う正常者は検査B、と読めます。正常者に1年生、検査Aに国語、 > 違う正常者に2年生、検査Bに算数で実施。これで検定しても、何が言えますか。 > 的外れ、という意見は、的外れでしょうか。 そのような検定は無意味です。 > 厳しい表現をしたのは、間違いに気づくだろうと。統計は、教えてらうと > その通りにはできても、身に付かないので、次の事例では役立たない、 > という経験が嫌ほどあります。 きっとそうだと思います。 しかし、ただ単に形式的に教えてもらうだけだと応用が利かないと思いますが、 何故そうなのかまでを納得いくまで議論できれば身に付くのではないかと思っ ていました。 もちろん自力で考えて答えを見つけるのが一番身に付くと思いますが、せっか く良い先生と話が出来るなら、単に表面的なことを教えてもらうだけではなく て、納得がいくまで議論すれば独学以上に深い理解が出来るのではないのでし ょうか。。 ただ、納得いくまで議論しようとすると、たいてい煙たがられますが。。 それと、回答者様の回答に対して私が提示した例については、私がそのような 統計解析を行っているわけではなくて、この議論のためにでっち上げたあくま でも架空の話です。
- kgu-2
- ベストアンサー率49% (787/1592)
No5です。 >建設的な議論 どうしても「差が無い」と言いたいようなので、 現実には、他の方が書きこまれたように、差が無いという帰無仮説を否定できないなら、差が無い、という場合もあるかもしれません。てすが、雑な検定をしたり、端的にはサンプル数を減らすだけで、簡単に「有意差は見られなかった」という結論をだせます。「有意差」探しに、多くの研究者は四苦八苦しているのは、そのせいです。 しかも、学会なら、はじめは慇懃無礼に、最後は袋叩きにされます。「無限回測定したら」と言われます。そうすると理論的には、差は出ます。「現実には難しいので」との返答で許してもらえるかどうか。 質問者は、統計学では無理なことをやろうとしているのです。これまでも、「無理」と回答しています。非建設的ではなく、理論的に不可能。統計学を少しやると、『差が無いひことを示せるのでは』と思いつきます。が、無茶はしないように。まあ、厚生労働省なら、この程度の無茶を言って・・・。 機械Aと機械Bの測定値なら、可能です。そういう論文もあります。詳細が分かれば、アドバイスはできます。しかし、研究者としては、それは倫理的に問題がある、と何度も書きこんでいます。専門家に聞け、とアドバイスしましたが、その人には謝辞を述べることができます。当然ですよね。私には、本名が分からないので、不可能です。これは、マナー違反。 ttestのご質問は、一般論です。しかし、私の回答くらいから、ご自身の研究に立ち入っています。お一人のご研究なのか、会社の仕事なのか、などでマナー違反かどうか判断に迷うところですが、それは質問者が状況を書いていないので、私のせいではありません。
補足
> >建設的な議論 > どうしても「差が無い」と言いたいようなので、 表現が不適切だったようで、申し訳ありませんでした。 どうしても「差が無い」という議論にもっていきたかったわけではありません。 わたしの考えが間違っているなら、どこが間違っているのかを理解させてくれるような議論を望んでいただけです。 「どの本のどのページに…」というような子供の喧嘩のような感情的とも思えるやりとりは建設的ではないと思ったので、上記のような表現を使ってしまいました。。 そういっている私が少し感情的なお返事をしてしまったことをお詫びいたします。
- jamf0421
- ベストアンサー率63% (448/702)
No3,4,6,7です。あまり深入りしても仕方がありませんが、普通の初等的統計の教科書にでてくる検定の話を書きます。 まず帰無仮説(null hypothesis)から出発します。母集団のある母数θがθ=θoである、あるいは母集団がある特定の分布型である、といった命題です。実用的に出てくるのは二つの測定は同じ結果を与える、などの命題です。データが同じ母集団から出てきたサンプルであるように考えるのです。この仮説をHoと書きます。これに対立する仮説を対立仮説(alternative hypothesis)とよび、H1と書きます。 実際に得られた結果が、非常に稀(たとえば5%以下)であれば、そのような稀なことが偶然起きたと考える代わりに前提であるHoを棄却します。しかし、5%といえども起こらない訳ではないので、この結論には5%の危険率があります。(5%を危険率とか有意水準とか呼びます。)このようにHoが眞であるのに棄却する誤りを第一種のあやまり(error of the first kind)と呼びます。逆にH1が眞なのにH0を採択するのを第二種のあやまり(error of the second kindと呼びます。 ここで「Hoが棄却された」状況を考えてみます。これは (例えば)t分布のt値が○○よりも大きい(稀である)→二つの測定値は同じ母集団からのデータとは言えない。(命題1) ということです。つまり差があったときはこれでO.K.です。我々は十分条件を握っているわけです。しかるにHoが棄却されない場合において t分布のt値が○○よりも小さい→二つの測定値は同じ母集団からのデータだ(命題2) というのは先の命題1の「裏」で「対偶」ではなく一般的には成立しません。 つまり「Hoが棄却されない」場合でも、対応する仮説(例えば、同等の測定値を与える)は積極的に肯定される訳ではない、ということです。 それはそうなのですが、実際に企業での測定機器の変更に伴う測定値の同等性、あるいは製造工程の変更にともなう製品と特性値の同等性、顧客との測定値の手合わせでの同等性などをみる場合、Hoが棄却されなければ同等と考えて対応します。
お礼
丁寧な、そして冷静で的確な議論をいつもありがとうございます。 とても参考になります。
- kgu-2
- ベストアンサー率49% (787/1592)
No5です。 >それでも、この検定は何の足しにもならないですか? 所期のご質問とは変質しています。 繰り返しになるかもしれませんが、t検定の目的というより期待する結論は、「有意差あり」。つまり、差があることを示したい場合に使います。質問者の期待(希望)は、差が無い、ということでしょう。が、教科書などに「差が無い」と結論しているものがあれば、ほんの名前、出版社、著者などを教えて下さい。まあ、そんな初歩的な間違いをするとは思えませんが。 ちなみに、「有意差は無い」は、ありますが、初心者にとって学術的には意味はありません。過去に「同じことを示したい、どうすれば」なんぞの質問があり、・・・。 質問者の期待する結論は、かなり工夫する必要があります。統計の専門家にご相談を、というのが唯一のアドバイスです。学生なら、教員に訊くこと。
お礼
アドバイスをありがとうございます。 専門家の方や建設的な議論をしていただける方に相談するようにいたします。
- jamf0421
- ベストアンサー率63% (448/702)
No3,4,6です前回のNo6の回答でうっかりNo4&5と書いてしまいました。これはNo3&4と書くべきでした。お詫びして訂正いたします。
お礼
了解です。 ご丁寧にありがとうございます。
- jamf0421
- ベストアンサー率63% (448/702)
No.4&5です。 検定対象の状況につきましてちょっと補足をします。 >10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方の検査 >を受けてもらったとします。 質問者さんのImageでは最初の10人とあとの10人は均質的なものだったと思っています。別の例を挙げるなら、病人の集団を考えて、薬をのませた人と偽薬をのませた人で有意の差があるか、という比較が考えられます。もちろんここで薬を飲ませた10人と、偽薬を飲ませた10人は同じ母集合からくじ引きで選ばれています。両グループで病状の指標となる何らかの測定値の平均の差が有意であるかどうかの検定は、対応関係がない検定になります。 対応関係のある検定の現実社会における適用につきましては、製造会社などで、たとえば品質管理に使う測定装置が変わって、データが新しい装置でも元と同等の値になるかをチェックしたいとき、幾つかの標準サンプルの両方の装置での値を比較し、有意差がなかったら、まえと同じデータが出ると判断し、有意差がでたら対策を考えることになります。
補足
補足をありがとうございます。 私がイメージしていたのはまさにそのような状況です。 適切なご意見をありがとうございます! とても参考になります。
- kgu-2
- ベストアンサー率49% (787/1592)
>10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方の検査を受けてもらったとします。 この条件で検定をするのなら、ものの見事に、的を外しています。これほど見事な的外れは、読んだことが・・・。少し考えれば分かることですが。 >それぞれ方法で得られた測定値の平均値を2つの方法間で比較して有意差があるかどうかを検定する場合は、対のあるデータの検定になるということでしょうか? 確かに対応していますが、検定の目的が不明。練習なら、OK。 有意差が見られない、なら何も言えない。 有意差があれば、 1) 1つ目の方法が不正確 2) 2つめの方法がダメ と考えがちですが、 3) どちらもアカンという場合さえあり、 どんな結果になっても現実には何の足しにもならず、時間と経費の浪費。 対応のある場合は、2群のデータ数(n)は、同じになります。必ず。 対応の無い場合は、同じでも、違っていても構いません。が、できるなら同じになるよう近づけます。理由は、対応とは関係ありませんが、実際の検定では不可欠の知識です。 これを説明できれば、「対応」は理解できているということです。 ちなみに、同じレベルの試験、というのは簡単に言えるので可能のように見えますが、検定は「有意差」を見つけるのが目的。検定の目的と反し、証明できません。例えば、センター入試の平均点は、同一にしようと作製していますが、科目によって有利不利があり、同じレベルにならない(できない?)のは周知の事実。全国の教員が集まって知恵を絞って作製しているのに、実際には不可能でしょう。 エクセル以前の問題では・・・。学生時代の私を思い出します。
補足
> 確かに対応していますが、検定の目的が不明。練習なら、OK。 > 有意差が見られない、なら何も言えない。 > 有意差があれば、 > 1) 1つ目の方法が不正確 > 2) 2つめの方法がダメ > と考えがちですが、 > 3) どちらもアカンという場合さえあり、 > どんな結果になっても現実には何の足しにもならず、時間と経費の浪費。 片方の測定方法が従来から使われている測定方法であり、これまでに信頼の高い測定方法であることが認められているとします。それに対して別の新しい測定方法(例えばより簡便な時間のかからない方法)が考えられたとします。そして、後者の測定方法によって得られた測定値が前者での測定値と遜色ないのかどうかを調べるために検定を行うというような状況を考えています。 それでも、この検定は何の足しにもならないですか?
- jamf0421
- ベストアンサー率63% (448/702)
>そして、10人の正常の人に両方の検査を受けてもらって、それぞれ方法で得られた測定 >値の平均値を2つの方法間で比較して有意差があるかどうかを検定する場合は、対のある >データの検定になるということでしょうか? 対のデータです。同じ人の二つの測定データの差は、測定方法に差がなければゼロになることが期待されます。果たしてゼロと考えてよいか誤差で検定することになります。同じ人の二つの測定値xi,yiをセットのように見ます。人数がn人ですと、 di=xi-yi d'(=dの平均)=Σdi/n s={(Σ(di-d')^2)/(n-1)}^(1/2) として、 t=d'/(s√n) を出し、このtを自由度n-1のt分布をするものとして検定します。 >また、10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方 >の検査を受けてもらったとします。そして、前者の検査で得られた測定値の平均値と後 >者で得られた平均値に有意差があるかどうかを検定する場合は、まずF検定を行って等分 >散か非等分散かどうかを検定して、もし前者ならば等分散の2標本を対象とするt検定を >行い、後者ならば非等分散の2標本を対象とするt検定を行うという理解で良いのでしょ >うか? そういうことです。
- DIooggooID
- ベストアンサー率27% (1730/6405)
- DIooggooID
- ベストアンサー率27% (1730/6405)
補足
わかりやすい説明をありがとうございます。 たとえば、同じ量(例えば体温)を測定する方法が2つあったとします。 そして、10人の正常の人に両方の検査を受けてもらって、それぞれ方法で得られた測定値の平均値を2つの方法間で比較して有意差があるかどうかを検定する場合は、対のあるデータの検定になるということでしょうか? また、10人の正常の人には一方の検査を受けてもらい、違う10人の正常の人にもう一方の検査を受けてもらったとします。そして、前者の検査で得られた測定値の平均値と後者で得られた平均値に有意差があるかどうかを検定する場合は、まずF検定を行って等分散か非等分散かどうかを検定して、もし前者ならば等分散の2標本を対象とするt検定を行い、後者ならば非等分散の2標本を対象とするt検定を行うという理解で良いのでしょうか?