• ベストアンサー

有効数字の桁数と平均操作

http://oshiete1.goo.ne.jp/qa4080175.html この質問に答えようと思っていましたが締め切られてしまいましたので私の質問として書かせていただきます。 元の質問は10個の測定データがあるとき平均値の有効桁数はいくらかというものです。参考のためにデータを載せておきます。 92.0mm  91.5mm  91.0mm  97.0mm  93.0mm 94.0mm  92.0mm  93.0mm  92.0mm  92.5mm 個々のデータを見れば有効桁数3桁のように見えますがデータごとのばらつきが大きいです。2桁目でばらついています。最大の値と最小の値で6.0も幅があります。データの信頼性で言えば有効数字は2桁だと思います。小数点下第一位の数値は全く信頼性のない値です。 この質問のA#1の参考URLにも書かれていますが 測定を10回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも1つ増やすことが出来ます。 問題はこの測定値の有効桁がいくらかということです。 私は10個のデータの有効桁は2桁だと思います。個々のデータを3桁で測ったということがデータの有効桁を表しているのではないと考えます。 したがって平均値は92.80ではなく92.8が正しいと思います。 (でも質問者様は92.80が正しいということで納得してしまわれたようです。) 統計に詳しい方がおられて回答をもらえるといいのですが。

質問者が選んだベストアンサー

  • ベストアンサー
  • masa2211
  • ベストアンサー率43% (178/411)
回答No.7

>測定を10回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも1つ増やすことが出来ます。 というのは、一般論としては正しいですが、正確には、 測定誤差÷(√n)   (n:測定回数) というべきです。 で、測定データは0.5mmきざみだから、どう贔屓目にみても、 測定誤差は0.25mmであって0.05mmとはなりません。 よって、0.25÷√10で、約0.1mmであるので有効桁は0.1mmの位まで。 詳細に計算する場合、データの標準偏差をもとめ、これが平均値の測定精度になります。 (確率偏差(=標準偏差×0.6745)で考える流儀もあり。) このデータの場合、標準偏差1.7となるので、 92.8±1.7すなわち91.1~94.5となり、有効桁は2桁です。 また、測定値の場合は、測定にミスがあるかどうか検定してから使います。 測定データの97.0は、平均から飛びぬけてずれており約2.5σ離れているので、 おそらくは測定ミスです。 ですので、97.0を測定ミスとして除外すると 平均=92.3 標準偏差=0.6 となるので、それでも有効桁は2桁です。 ただし、計算の途中経過は有効桁+1桁まで保持しないと、その後の計算で誤差が累積する という関係があり、測定データは何かの計算に使うだろうから、3桁目は怪しさ99%ですが、 平均=92.3 と3桁記述するほうが普通でしょう。

htms42
質問者

お礼

皆様ありがとうございます。 お礼が遅くなってしまい申し訳ありませんでした。 個々のデータが3桁で表されているということとデータの信頼性が3桁であるということとは別の話だ、データが10個あれば1桁増やすことが出来るというのは元のデータの信頼性の桁についてだと考えていたのが間違っていなかったという風に思いました。この場合のデータで言えば2桁を確定させるのがせいぜいだということです。 元々の質問にあったのは長さの測定です。学校でやった実験ですから決まった長さの試料を渡し1mの竹尺で測るというものだろうと思います。30cmの竹尺は最小目盛りが1mmですが1mの竹尺の最小目盛りは5mmです。これで新聞紙のようなものを測ったのだろうと思います。新聞紙は規格がありますから最小の5mmの範囲に収まるはずです。数cmの幅があるということは皺、たるみ、目盛りの読み違いが突っ込みになっていると思います。 私なら30cmの竹尺でコピー用紙(更半紙)を使います。きちんとカットされていますからばらつきは0.1mm以下のはずです。 mmまで確定しているはずです。mm以下を目分量で読み取るということをやった時に10個のデータがあればそのところをある程度確定させることが出来るという事になります。 測定の練習であれば「同じもののはずなのにこれだけ値がずれるのは測り方に問題がある」ということを具体例で示すということになります。その場合は有効桁が増えるとかどうとかということは問題にしません。 実験指導をされている先生に問題がありそうです。

その他の回答 (6)

回答No.6

No.3(とNo.4)の場合、93.0は測定値なのかどうかがひとつのポイントです。 これは定数と見るべきで、有効数字を考えるべきではない数字です。 93.0には誤差はまったく入ってませんよね。 誤差が入っているのは-1.0 とか-1.5 のほうで、これを10このデータ分を 合計すると-2.0。これを10で割ると、元が2桁有効なので-0.20と 小数第二位まで有効になります。 なので、この計算は 93.00000・・・・+(-0.20) = 92.80mm でやっぱり四桁が有効です。 有効数字の計算は***測定値***のみに適用されるものなのですが、 それが、しばしば忘れられるようですね。

htms42
質問者

お礼

皆様ありがとうございます。 御礼が遅くなってしまい申し訳ありません。 仮平均を使うと桁数が増えるという説明の仕組みはまだちょっと理解できていません。この説明で言うとデータのバラ付き(分散)は桁数に無関係になります。ばらつきの多い、信頼性のないデータに対して桁数が増えるということが言えるということはないはずだと感じるのですが。 93.0に対するずれの平均が2.0であるということから議論されています。平均が2.0であってももっとばらつきの多い、信頼性のないデータがありえます。そのばあいでも同じ事になってしまいますので納得が行かないのです。 #7のご回答に対するお礼のところにまとめ的ものを書かせていただきました。あわせてご覧下さい。

  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.5

ANo.4 です。 データに間違いがありました。 訂正します。すみません。 92.0 93.0 -1.0 91.5 93.0 -1.5 91.0 93.0 -2.0 97.0 93.0 4.0 93.0 93.0 0.0 94.0 93.0 1.0 92.0 93.0 -1.0 93.0 93.0 0.0 92.0 93.0 -1.0 92.5 93.0 -0.5          -2.0 平均=(93.0*10-2.0)/10=92.8 掛け算、割り算だから有効数字3桁だ。 ついでにですが。 ANo.3さんの心配は。 πやeなどの定数の有効桁数は、現に表示されている桁数。2πrなどの理論上出てくる係数の有効数字は無限大、人、個、点などの普通小数点以下をとらない測定値の有効桁数は無限大でどうですか。

  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.4

有効数字の話はたびたび出てくるが、厳密な議論は難しくなるので、実用的ではなくなる。ある程度、こうしようという了解の下で処理するというのが実情だと思う。その場合、あまり例外的な事を持ち出して云々するとややこしくなるので、できるだけ簡潔になっているほうがいいのだろう。 質問の場合も、「測定を10回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも1つ増やすことが出来ます」などということを一般化しないほうがいいのだろう。「1つ増やすことが」できるということと増やさなければならないということとは違う。一般の了解では、有効数字は3桁のデータとして、平均も3桁で出すのが妥当だと思う。 また、ANo.1さんの計算の平均値4桁というのも、たとえば次のような計算の仕方をすればどうなのかということになる。 92.0  93.0  1.0 91.5  93.0  1.5 91.0  93.0  2.0 97.0  93.0  -4.0 93.0  93.0  0.0 94.0  93.0  -1.0 92.0  93.0  1.0 93.0  93.0  0.0 92.0  93.0  1.0 92.5  93.0  0.5           2.0 平均=(93.0*10+2.0)/10=92.8 掛け算、割り算だから有効数字3桁だ。 だから、この研究を専門にするのでなければ、明らかにおかしいということを除いては、あまり面倒な議論はしないでなるべく簡単にしておきたい。考え方のばらつきはあって、「流派」のようなものもあるのだから。 ここは、平均の有効数字は3桁。

htms42
質問者

お礼

皆様ありがとうございます。 御礼が遅くなって申し訳ありません。 3桁のものの平均は3桁という疑問もある意味で納得できます。 元々の疑問は数字は3桁で示されているがデータ群として信頼性がない場合はどうなるかというものでした。 私は「2桁も怪しいのではないか、平均しても2桁を確定させるのがやっとである、3桁というのはともかく4桁は論外」というところから発想しての質問でした。

noname#77472
noname#77472
回答No.3

そんな事したらまともな偏差値 出てこなくなるよ。 みんな90点以上なんだし。 つ^_^)つ http://homepage1.nifty.com/gfk/average.htm

  • ency
  • ベストアンサー率39% (93/238)
回答No.2

たとえば、「92.0mm」というデータがありますが、このデータの意味するところは「91.95mm以上 92.05mm未満」ということです。 つまり、「91.95mm以上 92.05mm未満」であることは確からしいということで代表値として「92.0mm」といっていると考えても良いでしょう。 ちなみに、この場合 3桁目に誤差を含んでいるわけですが、これを「有効数字3桁」で表現しているといいます。 他の 9つのデータも  91.5mm→91.45mm以上 91.55mm未満  91.0mm→90.95mm以上 91.05mm未満  97.0mm→96.95mm以上 97.05mm未満  93.0mm→92.95mm以上 93.05mm未満  94.0mm→93.95mm以上 94.05mm未満  92.0mm→91.95mm以上 92.05mm未満  93.0mm→92.95mm以上 93.05mm未満  92.0mm→91.95mm以上 92.05mm未満  92.5mm→92.45mm以上 92.55mm未満 となります。 さて、これらの数字を使ってどこまでの精度で計算できるかを確かめてみます。 一番精度の悪い場合を考えるため、誤差の範囲の端の数字同士で平均値を求めてみます。 すると、  92.745mm以上 92.850mm未満 となります。 # 計算間違えてないよね? ご質問の意図は、もとのデータの平均値が「92.8mm か、92.80mm」かということですが、両者の精度はそれぞれ  92.8mm→92.75mm以上 92.85mm未満  92.80mm→92.795mm以上 92.805mm未満 となります。 また、データから得られる平均値の精度は「92.745mm以上 92.850mm未満」でした。 平均値を有効数字 4桁まで求めて 92.80mm (92.795mm以上 92.805mm未満) とするほどの精度はないと考えるべきでしょう。 この場合は、有効数字 3桁まで求めて 92.8mm (92.75mm以上 92.85mm未満) とするのが妥当なのではないかと思います。 …というような話を、学生時代に教えられた記憶があります。 「有効数字の桁数以上の精度は求めない」と覚えておけばよいでしょう。 元の質問に対する ANo1さんは > データ数が多くなると、平均値の有効数字を増やすことができます。 と書かれています。 一般に n=10 を「データ数が多い」とは呼べないと思いますし、参考URLで示しているようなもともとバラツキの少ない例で「n=10 で有効数字を1桁増やせた!」と言われても、回答として不十分だと思うのですが。。。 # データ数が多いといった場合、n≧50 はほしいところではないでしょうか。 まぁ、最後は私見ですのであまり気にしなくても良いです。 ご参考まで。

htms42
質問者

お礼

皆様ありがとうございます。 御礼が遅くなってしまい申し訳ありません。 >一般に n=10 を「データ数が多い」とは呼べないと思いますし、参考URLで示しているようなもともとバラツキの少ない例で「n=10 で有効数字を1桁増やせた!」と言われても、回答として不十分だと思うのですが。。。 # データ数が多いといった場合、n≧50 はほしいところではないでしょうか。 #7のご回答の中にもありますが分散は1/√nで小さくなっていくというのが元々の根拠だろうと思います。 10個のデータで求めた分散と100個のデータで求めた分散を比べると100個の方の分散が0.3倍ぐらいになっているということです。それだけシャープになるのです。 ただこの場合も個々のデータを何桁で測ったかということと平均値の精度はいくらかということとは直接の関係はありません。 #7にも書かれていますがこのデータの場合、せいぜい2桁です。その2桁目の幅が平均によって狭まくなるだけです。 平均しても2桁の精度(信頼性)しかない、という#7のご回答に納得できるものがあります。 50回、100回とやっても3桁にするのがせいぜいでしょう。 とにかく測定の精度が悪すぎます。

回答No.1

有効数字と測定値の信頼性を一緒にしたらだめですよ。 有効数字の計算では、足し算は有効桁の位置を合わせるので、 小数第1位まで有効な数を合計すると、やっぱり有効数字は小数第1位までです。 なのでその10個を合計すると928.0mmになり、小数第1位の0まで有効です。 平均を計算するにはこれをデータ数の10で割ることになりますが、 割り算・掛け算では桁数を合わせます。 データ数の10には有効数字を考えないので、4桁が有効ということになり、 有効数字としては92.80mmで正解です。 しかし、この10個のデータの不確かさを計算してみると、 測定値をxi、その平均を<x>として u=√[Σ(xi-<x>)^2/n(n-1)]=0.538・・・=0.5mm となるので、この測定値で信頼できるのは小数第1位までで、 92.8±0.5mm と、3桁が信用できることになります。 ただし、最近は不確かさを2桁で表記することもあるようなので、 その場合であれば、 92.80±0.54mm と4桁で表記することになります。 有効数字による計算は、あくまでも簡便な計算法に過ぎませんので、 最終的な測定値の信頼性は、不確かさを算出し、それで判定することになります。

htms42
質問者

お礼

ありがとうございます。 御礼が遅くなってしまい申し訳ありません。 私はばらつきが大きいという漠然とした表現を使いました。 hitokotonusiさまは不確かさという量を使っています。 これは標準誤差と言われているものですね。 #7で使われている標準偏差のさらに1/√nになっています。 #7では標準偏差=1.7となっています。これで2桁しか信頼性がないという結論を導いています。 標準誤差だと0.5となって3桁だとなっています。 私には標準誤差と標準偏差の使い分けがよく分かりません。どちらを使うかによって精度が変わるというのもよく分かりません。 こ々でのデータの信頼性に対しての判断では標準偏差の方が標準誤差よりもいいのではないかと思うのですが。

関連するQ&A