- ベストアンサー
統計 考古学調査でのサンプル数と結果の妥当性
- サハラ砂漠にある古墳の中で、「鍵穴型円墳」は紀元前3000年前後のものと断定できるのか疑問です。
- 統計的な妥当性を考えると、7基のサンプル数は少なすぎるのではないかという疑念があります。
- 正規分布でない場合には最低6-8サンプルが必要と言われていますが、この場合の妥当性をどのように評価すれば良いのでしょうか。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」(年代決定の指標として使える)ってことではないかしらん。 ところで、「紀元前3000年前後」の「前後」というところが600年も幅がある。(逆に言えば「紀元前3000年前後ではない」という表現は一体どういう意味なのか)そこがどのぐらいユルい概念であるかによって、話がずいぶん変わりそうな気もします。 また、「正規分布を仮定する」なんてのは、よほどの根拠でもない限り採用できないしょう。で、1000個中7つしか調べてないような段階では、たいした根拠なんざ、ある筈もなかろうと思うんですけどね。 …という注意点を一応気に留めた上で考えてみましょ。 まず、「紀元前3000年前後である」というのが、ま、なんらか「厳密な性質」なのだと思って、これをHと書く事にします。そして、「ランダムに取ったサンプルがHである確率」をpとしましょう。で、観測事実X:「ランダムに取ったn個のサンプルはどれも性質Hを満たすものだった」から、pを推定しろ、という風に考える。(ただ、本当にランダム調査なのかどうかは、ご質問からは分からない。もし近場のやつをまとめて調べたりしてたら、ランダムとはとても言えない。が、ま、ま、それはさておき。) たとえばp=0.65だとすると、p^7≒0.05です。つまり、実は墳墓の65%だけがHを満たす、という状況で、調べた7例が偶然全部Hを満たすということが生じる確率は5%ある。この時に言える推定は、ですから「有意水準5%で、p>0.65だ」ということです。言い換えれば「多分、鍵穴型円墳の2/3ぐらいがHを満たす」という話ですから、これでは仰るところの「断定」にはほど遠い。 そこで、有意水準5%で p>0.9 となるnを計算すると、 n≧29。 つまり、「29個のサンプルがどれもHだった」という観測があったとする。その場合、「鍵穴型円墳の90%以上がHを満たす」と言ったとき、それが間違っている確率は5%以下である。このぐらいになると、ちょっと「断定」っぽくなってきます。(サンプルがランダムでない場合には、間違っている確率はもっと大きくなります。)
お礼
分かりやすいご説明ありがとうございます。 やはりサンプル数が少なすぎるようですね。