- ベストアンサー
棄却検定できないかけ離れた値の扱いについて。
X線回折実験でKClを測定し、波長を決定する途中でわからないことがあったので質問させてください。 全部で8つの2θを得ました。 それぞれについて波長を計算し、平均値、標準偏差を求めました。 そして、99%信頼限界(平均値±(t*標準偏差)/n^1/2)を求めたら、 8つのうち3つがその範囲外の値になってしまいました。 波長を求めているのでそれほど大きな差は無いのですが、 一応のため棄却検定も行いましたが、結果は棄却できず。。。 このような時、99%信頼限界の範囲外の値についてどのように考えればよいのでしょうか? 範囲外の値が正しいかどうか、まともかどうかの判断はどのようにすれば良いのでしょうか? 最後にもうひとつ。 平均値±標準偏差には全測定値の68.3% 平均値±2*標準偏差には95.5% 平均値±3*標準偏差には99.7%が存在している というのは、99%信頼限界とどのように違うのですか? 最終的に波長はこうだ!と決定するとき、上記の表し方ではダメなのですか?
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
8つのデータから平均と標準偏差を計算した。で、8つのデータそれぞれについて、平均との差をとってみたら、標準偏差の何倍も離れたデータが3個も入っていた。ぬわんじゃ、こりゃー!! ということですね。 この事からまず言えるのは、「これらのデータは、データから算出した平均値mと標準偏差σで決まる正規分布に従ってはいない」ということです。というのは、帰無仮説「これらのデータは、データから算出した平均値mと標準偏差σで決まる正規分布に従う」を考えると、8個中3個ものデータがそんなに離れた値になる確率は極めて小さい。だから、この帰無仮説は(ごく僅かな危険率で)棄却されます。 しかしながら、データがおかしいということには必ずしもならないし、データが正規分布に従っていない、と断定することもできません。なぜなら、たまたま8個中5個のデータが互いにものすごく近い値だったために、標準偏差が実際の分布よりうんと小さく算出されたのかも知れないでしょ。 少ない個数のデータから推定した平均値・標準偏差が真の平均値・標準偏差からどれだけずれうるか、という「平均値や標準偏差の推定誤差」を考慮するにはt分布、F分布を利用します。ここで説明するのはかったるいので推計学の教科書を見てください。 一方、X線回折実験では、始める前に誤差の分布(標準偏差も含めて)が理論的に予想できるはずです。(ってか、誤差の予想の計算をしないで実験するのは、本来おかしいんですけどね。)で、その予想値を使って検定をやったらどうなりますでしょうか。
その他の回答 (2)
- usokoku
- ベストアンサー率29% (744/2559)
20年ほどやっていないので、変な内容になってしまうかもしれません(数学の進歩が早いので)。 8つの値から3つを棄却する、なんて検定あったのかしら。両側に1個とか、片側二個ならば棄却検定できるのですが。 試料台の設定の仕方の関係で、同一方向へほぼ同じ角度ずれることがあります。この補正は可能ですか。 今の機械ですと、粉末法でしょう(写真フィルムを現像して、、、なんてやっていたら示された数値が出ないと思いますので)。すると、はいこうせいの問題があります。なれない方ですと、へんなはいこうせいがでて特定のピークか小さくなったり、ブローになったり、非対称性(隣接ピー四区に注意、KCLの数値を覚えていませんので)になったりします。はいこうせいを確認してください(各ピークがどの面になっているか、面同士の関係から誤差が導けないか)。 フィルムを使った場合、SとかMとかの数量化をどう使っていますか、数量化の影響が強く出てしまうのですが。 強度をCPSで使っている場合には、測定精度を確認してください。X線はまともにやって5%の精度があるかにいか、1%の精度を得るにはかなり苦労しますから(機械が新しい場合は改善されているかもしれません)。
- goma_2000
- ベストアンサー率48% (62/129)
信頼限界は平均値の信頼区間のことです。 平均値が含まれる範囲をあらわします。 これは、点推定ではなく区間推定を行なっているということですね。 平均値±標準偏差のはなしは、(正規分布を仮定すれば) データはその範囲にその確率で含まれるという話です。 データの範囲と平均値の範囲の違いですね。 ここを混乱しているのではないでしょうか。 平均値の信頼区間の方が当然小さいので、 棄却されなかったのならデータがその中に含まれなくても 気にしなくて大丈夫です。 区間推定、信頼区間などでぐぐって見てください。