- ベストアンサー
Excel2000でのT検定について 統計
- Excel2000でのT検定について統計分析ツールにて一対の標本による平均の検定をおこなっておりますが、納得がいく結果が得られないのでこまっております。
- n=2で危険率5%でt検定。その差が10のものはt=23.4、t境界値両側が12.7ということで有意差が認められました。
- しかし同じように他のものでその差が14もあるものをt検定したところ、t=8.4、t境界値両側が12.7で有意差が認められませんでした。私としましては、その差が大きいものの方が当然有意差があって当たり前だと認識しておりましたが、その差が小さい方が有意差ありと認められ、その差が大きいほうが有意差はないと言う結果がでてしまい、納得がいきません。どなたか、統計とうお詳しい方、教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
T検定でなく、t検定という記述にしましょう。 回答 それぞれの平均値、分散値が不明で、何とも判断のしようがありません。(なお、この2つの値は、t検定の基礎となる数値ですから、どんな場合でも必ず明記しましょう。) 恐らく、平均値では最初のものの方が差が小さいが、分散値も極めて小さいので、有意差が出た。 次のものは、先程のものに比べ平均値の差が大きいものの、分散値が大変大きいので、信頼域が広くなり、有意とは言えなかった。 以上により、ご質問のような結果となったのではないかと推察します。 ご質問からして、同じような検定を2回行っているところからすると、同じような調査(実験)をそれぞれ行っているにもかかわらず、一方では有意、もう一方では差が認められないということは、サンプル数が少ないか、データの抽出方法に問題があった(無作為抽出でない、たまたま偶然に偏ったデータを抽出した)可能性があります。 確認事項 n=2は、サンプル数として少なすぎませんか。正規性のあるデータであるかどうかも疑わしくなってしまいます。たまたま有意差の大きいサンプルをとっただけかもしれず、信頼性に疑問があります。私には何のデータかはわかりませんし、知る必要もありませんが、もし、研究発表等でそのような検定結果を発表されていたら、私がその場に居合わせたならば、絶対に信頼性についての疑問点を質問してます。 各群のサンプルデータが2つ以上(但し同値は含めず)あれば、計算上は検定できますが、平均値、分散値がどの程度信頼性がおけるのかを検討せねばなりません。その値が十分信頼に足るものであればいいのですが、仮に再度データを抽出したときに異なっているようなら、信頼性はありませんので、検定自体が無意味です。 なお、t検定を行うに必要なサンプル数は、だいたい以下の式で大まかに見積もることができます。これだけ集めれば、5%有意水準で有意差がでる可能性が高いといってもいいかもしれません。仮に、ここで出てきたnが抽出しきれないほど極めて大きければ、逆にそれだけ集めないと有意差がでてこないということで、有意な差があるとは言い切れないといえるかもしれません。 n≒6.182682×(2×分散値)/((標本2平均値-標本1平均値)^2):片側検定 n≒2.769062×(2×分散値)/((標本2平均値-標本1平均値)^2):両側検定 ※ともに第1種過誤率=0.05、第2種過誤率=0.2の場合 t検定をするにあたり、まず、等分散性の検定(F検定)を行い、有意差が認められないことを確認して後、1対の・・・t検定か、等分散を仮定したt検定に進みます。 F検定で有意差が認められたら、分散が等しくないと仮定したt検定(Welchの方法)で検定します。 等分散性を仮定できるt検定では、行ってみた1対の標本による平均の検定(対応のあるt検定)と、その他のt検定(対応のないt検定)に大きく分けられます。 ここでの標本1と、標本2の各データは、同じ条件下に設定されたブロック因子間(例えば、Aさんの使用前・使用後など、比較する群の各データが、1:1で対応するような関係のデータ)での比較であれば、行ってみた検定方法でけっこうですが、ブロック因子を設定しておらず、サンプルをアトランダムにとりだしたもの(比較したいグループの各データが、もう一方のグループの各データに1:1の対応が見られず、抽出したデータの並びをランダムに変えて並び替えても支障がないようなデータ、無作為に抽出したデータの比較)であれば、対応のないt検定(等分散を仮定したt検定)を選択します。貴方のデータが、どれに該当するか検証して、適した検定方法を選択してください。 蛇足ですが、この場合、ノンパラメトリック検定ではサンプルデータ数が少ないため、有意差を出すことが不可能ですので、ノンパラ検定を考える必要はありません。 余談ですが、エクセルの統計についての結果は信頼性に欠けるという話は昔からいわれております(下記URL参照)。 今回については、これには該当せず、また、計算としては誤差等の影響はないと思われますので、その点についてはご心配なされる必要はありません。
その他の回答 (2)
- zinchan
- ベストアンサー率49% (97/197)
#1補足欄の質問事項について そうです。「^2」は、二乗の意です。A×A=A^2です。 サイトでは右肩上がりの小さい2(二乗)を表示できないので、このように表現しました。 エクセルで、「=10^2」と入力すると、100と表示されます。 マメ知識ですが、「^」は、「ハット」と読みます。私もこの間までヤマとかヤマギリとか言っていました。他の人も、意味は分かってくれていましたが(脱線)。 分散値はどっちを採るかと言うことについては、対照区、もしくは標準に相当する方でいいです。 #2お礼の欄の質問事項について もし、あなたが、明らかに測定ミスのデータと確信しているのに、それを含めて検定しようと思いますか。また、病気でホルモン分泌が少ないと分かっている検体を、他の正常な検体とともに測定し、検定しようと思いますか。 データを取って、外れ値と思われる値の原因を探らず、もしくは外れ値をはずしてもいいかを検討もせずに、除外して検定するのは不適切です。重要な情報を捨てているかもしれません。 また、作為的にデータを拾い出して検定する行為はいけません。改ざんです。 この場合は、検体が他と同一でなく明らかに(恐らく?)異質のデータとなるものや、測定ミスと思われるという点で、これらが推測にしろ、指示者の長年の経験から原因追及と検討を行っていると解釈してもよろしいかと思います。 厳密に言えば、外れ値の検定を行い、結果をさらに検討せねばなりません。それは不足していたと思います。 さらに、作為的にデータを拾い出した行為にあたるかどうかが論点になると思いますが、データを拾い出したのか、ノイズを除去したのかは外れ値の検定を行ってない以上、分かりません。 ただ、ノイズ(異質データ)により結果が攪乱されることを防ぐことは必要かと思います。 操作は作為的だったかもしれませんが、結果的に異質なデータを除いたと解釈してあげても良いのではないかと思います。 また、検体数が約100頭前後でしたら、サンプル数としては十分なデータ数だと思います。 動物の場合、場所を取る上、同一条件の検体を揃えることがかなり困難になりますね。測定も時間がかかり、最初の測定と最後の測定に誤差が入り込んでしまうかもしれません。指示者はそこまでのリスクを考えていらしたのでしょうかね。 よほど微妙な差で、有意差を出したかったのでしょうか。 完全無作為抽出をしていれば、少ない検体でも差を見いだすことは可能です。検体数を多くしたからと言って、精度の高い検定とはいえません。 約100頭もいれば、そのうちの2頭を、完全に無作為に抽出して除いても、大勢に影響は出ないものと思われます。 しかし、その2頭を含めると有意でないものが、2頭を除外したら有意というのであれば、たくさんの頭数から考えると、微妙です。計算では有意でも、実質的には有意とは言えなかったのかもしれません。やはり外れ値かどうか検定して検討するべきでしたね。 結論として、理論的には問題があり、再検討を要すると考えますが、指示者がデータを一つ一つはずして検定して有意差が出るものを選抜していたならともかく、データを一目見て、2つのデータをはずしてと指示したのでしたら、その方のの経験に敬意を表して、目をつぶってやっても構わないのではないですかね。研究発表会等で、実際の効果の有無について問題がありそうなら、ケンケンガクガク検討されていたことでしょう。
お礼
再びありがとうございます!大変参考になりますし、わかりやすい助言でございます。 すっきりしました。しかしながら、これだけご意見頂いているのに、コメントに自信なしとはちょっとビックリですが、、、どうしてですか?わたしは納得がいくご説明だと思いますので信頼いたしておりますが。謙虚な方だと言うことでしょうか(^^)?
- zinchan
- ベストアンサー率49% (97/197)
早速のご挨拶、恐れ入ります。 さて、お礼の項3~4行目のことについて、一言申し上げたく、再度おじゃまします。 抽出したデータを、何の原因解明もせず、また、数学(統計)的な検討も行わず、棄却してしまってはいけません。 十分精査して、なぜ外れ値が生じたのかをひもといてみなければいけません。 例えば、抽出条件や環境条件が異なっていたとか、余計な反応をさせてしまったとか、もしくは複数の異なる母集団からとったものかもしれないですし、記載間違いであるかもしれません。 それらを検討して、原因を探ってください。原因が判明すれば訂正できるものは訂正して、そうでなければさらにスミルノフ・グラブス検定で外れ値を棄却してよいものかを検定し、なるべく慎重的に棄却してください。 それらを検討せず、都合の悪そうなデータを棄却してしまうくらいなら、再抽出して新たにデータを揃えるようにして下さい。 再度そういうことが見られるようであれば、場合によっては、その外れ値は何か意味があり、とんでもない発見になるかもしれないのです。 あと、同条件と仮定できる場合において抽出されたデータを分けて検定するのは意味がありませんし、いけません。 例えば、正規分布している1つの集団において、それを平均より高いものと低いものに分けて検定する意味がありますか。もしくはデータの外れ値と、そうでないものとを比較することに意味がありますか。検定すれば有意差が出ますが、その有意差に何の意味があるのでしょう。 具体的に例えば、全く同じ環境条件で大根を栽培したとき、肥料の多少による2つの群の収量の差を検定することは意味がありますが、大根の特に大きいもの2本と、その他の大根を比べることで、何が得られるのでしょう。大きい大根は他の大根に比べて有意に大きかったか否かと言うだけで、そこから肥料の多少による効果を判断することができないのと同じ事です。 なお、当初抽出したデータに、改めて新たに抽出したデータを加えて(合算して)検定しては行けません。 なぜなら、当初抽出したときと、改めて抽出したときでは、たとえまったく同じ条件に設定したつもりであったとしても経時的には別の試験であり、細かく言えば、改めて行った抽出法は、まったく同じ条件を保っているとは言い切れません。たとえ話が同じでは芸がないので、魚の成育調査で例えると、人工環境施設で、前回と同じ条件による餌条件、水温で成育したつもりでも、餌の質まで全く同じか、水温の分布範囲が前回と全く同じかとは言い切れないでしょう。 いっときに多数揃えて同時に調査すれば、それらの条件は全く同じと言っても良いですが、時期を変えての調査はあくまでも別の試験として捉えねばなりません。 実験や調査では、事前にサンプル数の確保目標数や、検定法をあらかじめ決めておき、それから実験・調査に移り、必要なサンプル数がとれてから、当初の検定法で検定し、有意差を見、十分な検討を行った後に効果を判定し、結論を得る流れで行います。 統計の検定法は、極めて多数のデータを集めれば、有意差がだんだん出やすくなってしまうため、有意差が出るまでデータを集めるとかも、ルール違反です。 よって、通常は予備実験(調査)を行って後、必要サンプルを集め、本実験(調査)に入り、データを得、検定するというようにしなければ、信頼に足る結論を導き出すことができません。 検定とは、実験(調査)前から検討して始めておかねばならないものです。 あと、何かを抽出するときに最も大事で、大変なことがあります。 それは、無作為(ランダム)に抽出(設定)するということです。つまり、母集団からむらなく抽出することが、全ての実験・調査、全ての検定法における大前提です。これができてないと、実験・調査自体が無意味なものになります。 実験における無作為配置や乱塊法・調査地点のランダム抽出、世論調査の2段階層別抽出など、信頼性を高めるための最適な手段を選択して、抽出するよう心がけていただけますことをお願いいたします。 頑張ってください。
お礼
再度迅速な助言ありがとうございます。おっしゃるとおり、ランダムな検体の選抜が不充分だったと思います。外れた値を呈した原因もわかっておりますので、それを盛り込み再度実験を行いたいと思っております。大変参考になる助言ありがとうございました。 なお、またまた質問して申し訳ないのですが、以前某研究所にて動物実験を行い、その臓器のデータ処理を手伝いました。その際に2検体程データを除いた記憶がございます。検体数は100位あったのですが、この場合、動物なので様々な相互作用があるので、元々病気であったとか、測定ミスである可能性が高いということで、除くよう指示されたように記憶しております。その2検体を除いた結果、有意差がでました。このような場合はやはりデータに絵心を加えたことになるのでしょうか?
お礼
回答ありがとうございました。おっしゃるとおり、n数が少ないので誤差が大きいのかなと思いました。t検定する意味もないかなと思いながらも、誤差も少なかったのでできるかなーと。 実際はnは14でやっておりますが2検体のみ非常にずれた値(正反対)があったので、それを取り除いてn=12で検定しました。そちらの結果は納得がいったのですが、そのずれた2検体(近い値)だったのでそれのみであれば有意差あるのか?と思いやてみたのです。独学でちょろちょろ調べてやっているt検定の復習もかねて。そこでこんな疑問が生じたわけです。私自身も、とりあえずt検定したが信頼性のないデータであると思っておりますので、さらにn数を増やしていく予定です。検定に関して自分が欲しい最低限の知識だけは定着させたいので疑問に答えていただき参考になりました。一人でちょろちょろやっていたので、おそらくあっているだろうという程度の知識に留まっておりました。今後正しい知識の定着のため、また疑問がわきましたら質問させていただきます。助言ありがとうございました。
補足
すみません、zinchanさんのくださった回答に関しまして教えていただきたいことがあります。素人質問で申し訳ないです(;_;) 必要なn数の目安計算なのですが、 n≒6.182682×(2×分散値)/((標本2平均値-標本1平均値)^2):片側検定 n≒2.769062×(2×分散値)/((標本2平均値-標本1平均値)^2):両側検定 まず「^」のマークの意味がわかりません。これって二乗するということでしょうか?あと分散値というのは2変数のどちらの分散値なのでしょうか?