- ベストアンサー
問題:測定器Aで測ったデータと測定器Bで測ったデータの関係性について
- 測定器Aで取得したデータと測定器Bで取得したデータの関係性について考えます。
- 測定器Bで取得したデータを正規分布で表現し、測定器Aとの差分を計算する方法を提案します。
- 120個のデータが正規分布にしたがっているかどうかを通常の判断基準で判断することができるかについても考えます。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
ご質問の最後に「通常判断」と書いてあるのは(意味は分からんが)、おそらく、理論の話じゃなく(つまり、統計学などの演習問題の話ではなくて)、実務でお困りだということを暗示しているんでしょう。 ご質問のような推定をやるためには、少なくとも「AとBの測定値の関係が、物の長さLについて、とても滑らかな関数になっている」と仮定する必要があります。(現場でなら、測定器の仕組み、あるいは観察から、この仮定が妥当かどうか分かるでしょう。たとえば、「Aは火事場から拾ってきた、飴の様に溶けたプラスチック定規だ」というのなら、この仮定は無理そうです。) 方法(1)は大はずれではない。ただし、「Bで測ってYだったものを、Aで測ったら幾ら?」を予測したい場合、近似直線(回帰直線)なら X = aY + b の係数a, bを最小二乗法で決めてやることになります。ところが方式(1)の Y = αX + β では、別の直線(Aの測定結果からBを予測するための直線)が出てしまいます。 また、方式(1)は値のばらつきを無視してしまっているのがまずい。ナマのデータ120個が使えるのであれば、それを使って回帰曲線を作れば良いんです。 なお、近似曲線が直線でいいのか、もっと高次の曲線(2次曲線、3次曲線...)にすべきなのかは、AIC(赤池の情報量規範)を使って判断できます。でもま、この程度の話であればそこまでやらず、「直線でいいや」と決めてかかっても構わないでしょう。 一方、方法(2)は、式の結果が正規分布になるかどうかを心配する以前の話として、 a) 「AとBの関係(狂い方)は正比例である」というエラク強い仮定を置いているようである。A, Bの測定原理等からそう推論できるなど、特別な根拠があれば良いのだが、でも、測定した分散は正比例関係ではないことを示唆しているようにも思われ、この仮定はどうも無理っぽい。 b) 正比例だという仮定の下での回帰直線の計算方法として、この式は適切でない。また、何で中央値を使うのか。(それに、「中央値5%」ってなんだ?)。 という問題点があります。
お礼
詳しくご回答いただきまして、ありがとうございます。 こちらの説明が良くないかも、直線で求めるなら、例えばBで測った15mmの物は Aで測ったら16mmだったら、16mmだけじゃなく、Aで測ったデータのバラツキも知りたい。そうすると、直線式では分からないですね