• ベストアンサー

統計に関する質問です。

統計に関する質問です。 2つの集団が等しいか否かを確認するとき、通常は「2集団間の平均や分散に差がない」ことを帰無仮設としますが、「2集団は異なる」ことを帰無仮設として検定する手法はありますか? 「2集団が同じとは言えない」ではなく「2集団が異なるとは言えない」→「同じ母集団に属している可能性が高い」ことを示したいのです。

質問者が選んだベストアンサー

  • ベストアンサー
  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.1

たとえば,同じ母集団から何個か(たとえば10個)の標本を採ってきて,その平均を求めます。これを何回も繰り返したとき,その平均の分布がどうなるかは,統計的にわかっています。要するに平均に差の無い母集団から採ってきた標本の平均の分布がわかっているのです。仮説検定はこの分布を使った検定です。同じ母集団から採った標本の平均なら,この分布に従うので,この分布から極端にずれた場合は,同じ母集団からの標本ではないだろうとするのです。しがって,「「2集団は異なる」ことを帰無仮設」とした検定はできないことになります。もし,「2集団は異なる」ことを帰無仮説としたいなら,異なる集団から採ってきた,標本の平均の分布が必要でしょうが,うまく統計的に意味のある分布になるかわかりません。うまくいったとしても,異なる程度によって異なる分布になり,無限の分布があることになります。したがって,どの分布を使って検定をするのか決めるのも大変でしょう。現在,一般に行われている検定では,このような検定はできないでしょう。うまく工夫して,これができる方法でも考えられたらいかがでしょう。見込みがあるとも思えませんけど。

ogaty55
質問者

お礼

統計が素人の私に、分かりやすく教えていただきありがとうございました。 困難な理由が理解できました。 「異なる集団から採ってきた標本の分布」というものを設定するのが難しそうですね。

すると、全ての回答が全文表示されます。

その他の回答 (4)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

 「同じ集団」を主張する検定法は無い、ことはご理解いただいた上で。  測定法としてA法があるが、「新たにB法を考案した。B法が使えるか」などの対になっているデータを判定するときに回帰分析を利用します。臨床検査などで、新しい方法を開発したときには、必ずといっていいほど論文に書いてあります。臨床検査だけでなく、一般の測定法の開発でも。回帰式の選択、回帰式の切片がゼロを通らない、などの処理が出来れば、一人前です。  ただ、回帰分析は、測定法のAとBの比較では、初心者でも大丈夫でしょう。が、応用範囲が広く、社会学などに適用すると、専門家でも間違っている論文を多々見ます。

ogaty55
質問者

お礼

お礼へのご返事ありがとうございました。 今回取り組んでいる事柄は、旧A法と新B法を比較することに近いので、 回帰分析を用いた各種論文について勉強し、自分なりの結論が導けるように 頑張りたいと思います。

すると、全ての回答が全文表示されます。
  • ur2c
  • ベストアンサー率63% (264/416)
回答No.4

> 困難であることは分かりました。 困難ではありません。「仮説検定の枠組みでは不可能ですけど、モデル選択の枠組みなら、実質的な困難は標本の大きさくらいしかありません」と言ったつもりでした。 > 標本数が小さい(20~30個程度) 各集団でそれだけあるのですか、両集団を合わせての話ですか? 「各集団で」だとします。モデルが正規分布なら最も複雑な場合でも「2 集団で平均も分散も異なる」ですから、未知母数は 4 つです。それなら c-AIC http://ja.wikipedia.org/wiki/%E8%B5%A4%E6%B1%A0%E6%83%85%E5%A0%B1%E9%87%8F%E8%A6%8F%E6%BA%96 くらいを使っておけば、標本が小さいから無意味だと言う人はいないでしょう。

ogaty55
質問者

お礼

補足していただきありがとうございます。 必要なサンプル数がどれくらいかという点も検討していたところでしたので、 アドバイス大変助かりました。 現在、各集団において10~30程度という微妙なところですが、 ご紹介いただいたc-AICに当てはめてみて最低限必要なサンプル数も把握しておきたいと思います。

すると、全ての回答が全文表示されます。
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>「2集団が異なるとは言えない」→「同じ母集団に属している可能性が高い」ことを示したいのです。 可能性をの部分を無視すれば、「差が無い=同じことを証明したい」と判断します。これは統計学では、基本的には証明できません。これを、私も、数年苦しみ、出来ないことが分かり、「初心者の罠」と呼んでいます。教科書的には、「有意差が見られた」との記述はあっても、「差は無い」と書いているものが皆無(差は無い、と論文に書かれているのを何度が読んだが、初歩的な誤り)なのが証拠です。ただ、何故かを解説している本を読んだことはありません。  百万人を調査して、0.01でも差があれば、同じとは言えないからです。わずか0.01ても、単位が億円なら、現実的には意味があるでしょう。億万長者なら、『0.01憶円(百万円)くらい』と思うかもしれませんが、私には大金です。何をもって同じとするか、判断基準が無いので不可能、が私の結論です。  全員を調査して(一人でも欠けてもダメ)、全く同じ数値になれば、差は無い、と断言できますが。  また、使用前と後、のように、対のデータなら回帰分析を利用して「違っていない」と結論することは可能です。

ogaty55
質問者

お礼

回答ありがとうございます。 通常の検定の反対のようなイメージで捉えていたのですが、 「初心者の罠」ということで生易しい事ではないようですね。 回帰分析による方法についてもっと勉強してみたいと思いますが、 どのような方針で行うのか、よろしければヒントをいただけませんか? 例示していただいた「使用前」と「使用後」であれば、 それぞれについて回帰直線を引いて判断するイメージでしょうか?

すると、全ての回答が全文表示されます。
  • ur2c
  • ベストアンサー率63% (264/416)
回答No.2

z := {x, y} を標本、f を確率分布、p,q,r を母数、Z を確率変数として M0: z は f(Z,r) からの標本である M1: x は f(Z,p)、 y は f(Z,q) からの標本である とします。=/ を不等号として、M1 は通常の仮説検定で用いる複合仮説 p =/ q でなく、具体的な値 (p,q) による単純仮説であることに注意。(ANo.1 は複合仮説を想定した回答です。) 質問は「M1 を帰無仮説、M0 を対立仮説にできるか」であると解釈します。形式的には可能です。しかし M0 の母数は M1 の半分なので、M0 のあてはまりは M1 のあてはまりより常に悪くなります。だから採択されるのは常に M1 で、検定は役に立ちません。 標本に対する説明力の高いモデル(M0 か M1 か)を決定することを、モデル選択と言います。選択の基準はいろいろ提案されており、代表的なのは情報量基準です。これらを使えば質問の意図に対応できる可能性があります。ただ、あくまでも有限個の候補 {M0, M1, ...} からの選択になります。それから、モデル選択は大概が漸近理論に基づいており、標本が小さいと使えません。

ogaty55
質問者

お礼

ご回答ありがとうございました。 私の勉強不足のためご回答が十分に理解できたわけではありませんが、 困難であることは分かりました。 モデル選択の情報量基準などを勉強してみたいと思います。 ただ、今回対象としている標本数が小さい(20~30個程度)のため、 困難なのかなとも思いました。

すると、全ての回答が全文表示されます。

関連するQ&A