- ベストアンサー
統計解析法
統計解析手法の検定についての質問です。 2つの母平均の差の検定の場合です。 帰無仮説H0:μ1=μ2 対立仮説H1:μ1≠μ2とします。 帰無仮説が棄却された場合は結論として対立 仮説が成り立ち、第1種の過誤はαであり、 このケースは問題ありません。 しかし、帰無仮説が棄却されない場合、第2 種の過誤の問題があり、積極的に結論として 帰無仮説が成り立つとは言えません。 上記問題は、2つの母平均の差の検定の手法を 使って、積極的に2つの母平均に差が無いと言 う結論を統計的に導き出す事の障害になります。 2つの母平均の差の検定の手法をうまく工夫 する事、又は、別の手法で、2つの母平均に差 が無いとの結論を統計的に導く事は出来な いでしょうか? ご教授の程宜しくお願い致します。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
No1です。続きを書きます。 統計学で、AとBの二つのグループを比較する、すなわち、AとBに属する全てのデータを用いると、必ず差があります。例えば、ある学校で、1年生と2年生の身長を比較する、すなわち、平均値を比較するときに、この場合は、全員の身長を入力できますので、同じ平均値になります。この場合は、誰がやっても常に同じ値になるので、必ず差があるわけです(例え、0.1 mmでも)。 しかし、日本全国の1年と2年を比較することは、サンプル数が多すぎて、不可能です。そこでサンプリングが必要になります。このサンプリングによる平均値は、無作為抽出をしても、同じにはならないでしょう。 そこで、検定が必要になります。すなわち、「偶然ではなく、5%以下の危険率で、差があると表現できます」というのが有意差です。 すなわち、現在の統計学は、全てのデータを用いて計算すれば、2つのグループには差がある、ことから出発しているのです。ですから、「差が無い」ということは証明できません。 以上は、私の認識ですから間違っているかもしれません。また、現在の統計学と異なった概念から新たな統計学を確立すれば、証明できるようになるのかもしれませんが。
その他の回答 (4)
- onakyuu
- ベストアンサー率45% (36/80)
こんにちは、No2で回答した者ですが、ふたたび おじゃまします。 No3のselferさんのお答えも一つの手です。 この方法は思うにベイズ統計ではないでしょうか。 すなわち、二つの集団の平均の差を確率変数とみ なして、観測されたサンプルからその差の確率分 布を予測することになります。 2つの集団の平均が同じである場合、サンプル数 をどんどん増やしていくと、この差の確率分布の 幅が小さくなっていくはずです。 平均の差の確率分布が求まれば信頼区間(たとえ ば左右に2.5%)を定めて2つの集団の平均の誤差 を見積もれます。 ベイズ統計の特徴は、オーソドックスな統計学で 定数としているパラメータを確率変数とみなして いることです。このため確率変数の事前分布を主 観的に決めなくてはいけません。 帰無仮説が棄却されないということと等価ではな いです。 このへんのことは、 繁桝算男「ベイズ統計入門」(東京大学出版会)に (特に6章)詳しく書いてあると思います。 もし興味があれば参考にされるとよいでしょう。
お礼
こんばんは。お礼が遅れてすみませんでした。ご教授ありがとうございます。 ベイズ統計について本を読んでみます。
- selfer
- ベストアンサー率76% (104/136)
こんにちは. 私も以前,「2つの母平均に差がない」ということを統計学的に調べられないか,を考えたことがあります.その回答として,正解かどうかはともかくとして,「信頼区画(confidence interval)」が相当するのではないかと思われます. 信頼区画とは,「母平均(u)が○○から△△までの間に存在する確率は□□%」という,uと確率□□%的に同値と推定される範囲のことです. 例えば,標本平均=102,標本の標準偏差=15のデータに,この信頼区画法を使ってみます.信頼係数95%の信頼区画は計算公式により,99.19~104.81となります.つまり,「母平均が99.19から104.81までの間に存在する確率が95%」となります.一般に母平均の推定値は標本平均と同値(102)とされることから,「102」という数値と「99.19~104.81」の範囲の数値は同値だと考えることができます. さて,2平均の差を調べる際に,母平均に差がないということは,その差が「0」となるはずです.無論ぴったり「0」になることは少ないですが,「0」と統計学的に同値の範囲である信頼区画以内の数値は「0」と考えても良いでしょう.もし信頼区画が「-3~+3」ならば,その平均差が「+1.5」であれば,「0」と同値だと考えることができ,すなわち「母平均に差はない」と言うことができるのではないでしょうか? 実はt検定を始めとする検定は,この信頼区画法を裏返しに使っているとも言えます.検定では,母平均の差が「信頼区画から外れている」場合に「有意差あり」という判定を下しているのです.
補足
今日は。ご教授ありがとうございます。とても参考になりました。 統計手法を使った経験がお有りとの事ですので、もしよろしければ、下記 質問にお答え頂けませんでしょうか。 (私の場合は、検定や推定はたまに使う程度です) (1) >実はt検定を始めとする検定は,この信頼区画法を裏返しに使ってい >るとも言えます.検定では,母平均の差が「信頼区画から外れている」 >場合に「有意差あり」という判定を下しているのです. (2) >「102」という数値と「99.19~104.81」の範囲の数値は同値だと考える >ことができます. (2)の”同値である”との考え方は、(1)から考えますと、検定をしたときに 帰無仮説が棄却されなかったので、同等と見なすのと同じ事ではないでし ょうか? (...頭が混乱しています。変な質問になっていたらすみません...) 以上、宜しくお願い致します。
- onakyuu
- ベストアンサー率45% (36/80)
2つの集団間の差が0であることを積極的にいう ことは原理的にできないと思います。 連続分布に従う確率変数がある実数を取る確率は 一般に0だからです。すなわち自然界にまったく 同じものは、原子・分子などミクロなものをのぞ けばまず無いのです。 仮説検定は、平たく言うと2つの集団間に存在す る差が帰無仮説により統計的に予想される差より ずっと大きいといっているに過ぎません。 この差が小さければよいのかというとそうでもな くて、この差が統計的に予想されるより小さいな ら、それはそれで問題があります。つまり、デキ すぎており、何かウラがあることになります。 極端な例を挙げると2つのサイコロを投げて賭け をしているとき2つのサイコロ間の差が常に0だ とすれば、2つのサイコロが従う確率分布が等し いことになるわけだけれど、それは明らかにイン チキなサイコロでしょう。 メンデルが観測したデータが彼の理論の1:3の 比率に合いすぎているためデータ捏造が疑われて るという話も有名です。
お礼
今日は。ご教授ありがとうございます。 2つのグループの平均や標準偏差に差がない事を統計的に 言う事はできませんか....... とても残念です。
- kgu-2
- ベストアンサー率49% (787/1592)
統計学的な有意差は、「有意差はある」という証明できます。 ですが、「有意差は無い」という証明はできません。「有意差を見出せなかった」とは書きますが、「おまえの方法が悪いかも」と反論されれば、言い返す言葉はありません。 「有意差が無い」という証明方法があれば、と考えるのは、私だけではないでしょう。
補足
ご教授ありがとうございます。 補足質問をお願い致します。 2つのグループのデータをプロットして比較し、この2つのグループ の母平均がほぼ同等と見なせる場合、敢えて、有意水準αを0.95に 設定(棄却され易くして)して(通常は、有意水準αは0.05or0.01 に設定しますが敢えて)、それでも、帰無仮説が棄却されずに、尚 且つ、第2種の過誤βも0.05以下になっていた場合、統計的に有意差 なしと結論付けられないでしょうか? 統計学に詳しくない為、とんでもない事を言っていたら、すみません。 しかし、統計的に有意差があると言うのは、5%or1%でしか起こりえ ない事が起こったから、つまり、差があったんだと解釈する以上、上 記のように、有意水準αを0.95と高い設定にして、母平均が同じグル ープだとしても、95%の確率で有意差が出てしまうように設定したに もかかわらず、有意差が出ず、尚且つ、第二種の過誤も0.05以下であ れば、有意差がある場合と同様(第2種の過誤βが0.05以下と言う意味 で)統計的に有意差がないと言えるように思えてしまいます。 以上、宜しくお願い致します。
お礼
こんばんは。お礼が遅れてすみませんでした。 ご教授ありがとうございます。 差が無いとの結論は統計的には出せないのですね。