ANo.4の前半部分、追記です。
昔は「真値」「誤差」という言葉を使って、「Xの値(測定値)がaのとき、真値vは v = a - εである。ここにεは誤差で、これは確率分布ξ(x)に従う確率変数である」という風に捉えることが多かったのですが、今では「不確かさを伴わない測定はなく、従って、そもそも真値なんてものはない」という考え方が主流で、たとえばISO規格においても「真値」という概念は一切排除されています。(ま、あまりうるさいことを言わなければ大抵 v = a - ε で事足りるのですけれども。)
つまり、「本質的に、実数aの周りに不確かさがくっついているものψ(x)しか得られない」と考える。なので「測定値はaだ」というのは、「 ψ(x)=ξ(x-a)である(ただし、不確かさの分布ξ(x)は平均が0)」ってことです。(No.5さんの「ビュッフォンの針」の場合も、この考え方をすれば変な事は起こりません。)
さてNo.4の
P(ψ) = ∫φ(x)ψ(x)dx
のところをもう少し正確に説明すると、実はこの積分は確率密度を与えます。すなわち微小な区間(s, s+Δs)について、ξ(x-a)のaがその区間に入る確率を考えると、
P(a∈(s, s+Δs)) =Δs ∫[t=-∞ ~∞] φ(t)ξ(s-t)dt
ということを意味しています。
これがどうやって出て来るか、簡単に考え方を紹介しますと、φ(x)に従う確率変数Xが微小区間(t, t+Δt)に入る確率は
P(x∈(t, t+Δt))=φ(t)Δt
また、x∈(t, t+Δt)のとき測定値ξ(x-a)のaがa∈(s, s+Δs)である確率は、
P(a∈(s, s+Δs) | x∈(t, t+Δt))
= ∫[a∈(s, s+Δs)]( ∫[x∈(t, t+Δt)](ξ(a-x)/Δt) dt )ds
= ξ(s-t)Δs
なので、φ(x)に従う確率変数xの測定値ξ(x-a)のaが微小な区間(s, s+Δs)に入る確率は
P(a∈(s, s+Δs)) = ∫[t=-∞~∞] ( P(a∈(s, s+Δs)|x∈(t, t+Δt))(P(x∈(t, t+Δt))/Δt) )dt
= Δs∫[t=-∞~∞](φ(t)ξ(s-t)) dt
「測定の話じゃなくて、純粋に数学的な扱いではどうなっているか」というと、こちらは「測度」という概念が不可欠です。最近似たような話をいくつか書いたな →
http://okwave.jp/qa/q7391540.html
http://okwave.jp/qa/q7418906.html
ちうわけで、やはり「無限集合の中のあるひとつの値が実現する確率、というものは0だけれども、有限の測度をもつ部分集合(上記の{x|φ(x)>0}に相当)の中に落ちる確率なら計算できる」という仕組みになっているんです。
別の言い方をすると、確率が0の事象を有限個合わせた集合Aを考えても、「集合Aの要素のどれかが実現する確率」はやはり0。しかし無限個集めたとなると話が違う。その場合、ただ無限個と言っただけでは答が決まらないんで、無限集合の大きさを数値的に表す必要がある。それが「測度」だ、というわけです。
お礼
分布ψの考え方は面白いと思いました。 ありがとうございました。