ベストアンサー

有効数字の桁数と平均操作

2008/06/06 21:07

http://oshiete1.goo.ne.jp/qa4080175.html この質問に答えようと思っていましたが締め切られてしまいましたので私の質問として書かせていただきます。元の質問は１０個の測定データがあるとき平均値の有効桁数はいくらかというものです。参考のためにデータを載せておきます。 92.0mm　　91.5mm　　91.0mm　　97.0mm　　93.0mm 94.0mm　　92.0mm　　93.0mm　　92.0mm　　92.5mm 個々のデータを見れば有効桁数３桁のように見えますがデータごとのばらつきが大きいです。２桁目でばらついています。最大の値と最小の値で６．０も幅があります。データの信頼性で言えば有効数字は２桁だと思います。小数点下第一位の数値は全く信頼性のない値です。この質問のＡ＃１の参考ＵＲＬにも書かれていますが測定を１０回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも１つ増やすことが出来ます。問題はこの測定値の有効桁がいくらかということです。私は１０個のデータの有効桁は２桁だと思います。個々のデータを３桁で測ったということがデータの有効桁を表しているのではないと考えます。したがって平均値は９２．８０ではなく９２．８が正しいと思います。（でも質問者様は９２．８０が正しいということで納得してしまわれたようです。）統計に詳しい方がおられて回答をもらえるといいのですが。

htms42
お礼率64% (20/31)

物理学
回答数7
ありがとう数6

みんなの回答 （7）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

masa2211
ベストアンサー率43% (178/411)

2008/06/07 03:27 回答No.7

>測定を１０回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも１つ増やすことが出来ます。というのは、一般論としては正しいですが、正確には、測定誤差÷（√ｎ）　　　（ｎ：測定回数）　というべきです。で、測定データは0.5mmきざみだから、どう贔屓目にみても、測定誤差は0.25ｍｍであって0.05ｍｍとはなりません。よって、0.25÷√10で、約0.1ｍｍであるので有効桁は0.1ｍｍの位まで。詳細に計算する場合、データの標準偏差をもとめ、これが平均値の測定精度になります。（確率偏差（＝標準偏差×0.6745）で考える流儀もあり。）このデータの場合、標準偏差1.7となるので、 92.8±1.7すなわち91.1～94.5となり、有効桁は２桁です。また、測定値の場合は、測定にミスがあるかどうか検定してから使います。測定データの97.0は、平均から飛びぬけてずれており約2.5σ離れているので、おそらくは測定ミスです。ですので、97.0を測定ミスとして除外すると平均＝92.3　標準偏差＝0.6 となるので、それでも有効桁は２桁です。ただし、計算の途中経過は有効桁＋1桁まで保持しないと、その後の計算で誤差が累積するという関係があり、測定データは何かの計算に使うだろうから、３桁目は怪しさ99％ですが、平均＝92.3　と３桁記述するほうが普通でしょう。

質問者

お礼 2008/06/20 11:33

皆様ありがとうございます。お礼が遅くなってしまい申し訳ありませんでした。個々のデータが３桁で表されているということとデータの信頼性が３桁であるということとは別の話だ、データが１０個あれば１桁増やすことが出来るというのは元のデータの信頼性の桁についてだと考えていたのが間違っていなかったという風に思いました。この場合のデータで言えば２桁を確定させるのがせいぜいだということです。元々の質問にあったのは長さの測定です。学校でやった実験ですから決まった長さの試料を渡し１ｍの竹尺で測るというものだろうと思います。３０ｃｍの竹尺は最小目盛りが１ｍｍですが１ｍの竹尺の最小目盛りは５ｍｍです。これで新聞紙のようなものを測ったのだろうと思います。新聞紙は規格がありますから最小の５ｍｍの範囲に収まるはずです。数ｃｍの幅があるということは皺、たるみ、目盛りの読み違いが突っ込みになっていると思います。私なら３０ｃｍの竹尺でコピー用紙（更半紙）を使います。きちんとカットされていますからばらつきは０．１ｍｍ以下のはずです。ｍｍまで確定しているはずです。ｍｍ以下を目分量で読み取るということをやった時に１０個のデータがあればそのところをある程度確定させることが出来るという事になります。測定の練習であれば「同じもののはずなのにこれだけ値がずれるのは測り方に問題がある」ということを具体例で示すということになります。その場合は有効桁が増えるとかどうとかということは問題にしません。実験指導をされている先生に問題がありそうです。

その他の回答 (6)

hitokotonusi
ベストアンサー率52% (571/1086)

2008/06/07 01:26 回答No.6

No.3（とNo.4)の場合、93.0は測定値なのかどうかがひとつのポイントです。これは定数と見るべきで、有効数字を考えるべきではない数字です。 93.0には誤差はまったく入ってませんよね。誤差が入っているのは-1.0 とか-1.5 のほうで、これを10このデータ分を合計すると-2.0。これを10で割ると、元が2桁有効なので-0.20と小数第二位まで有効になります。なので、この計算は 93.00000・・・・＋(-0.20) = 92.80mm でやっぱり四桁が有効です。有効数字の計算は***測定値***のみに適用されるものなのですが、それが、しばしば忘れられるようですね。

質問者

お礼 2008/06/20 12:07

皆様ありがとうございます。御礼が遅くなってしまい申し訳ありません。仮平均を使うと桁数が増えるという説明の仕組みはまだちょっと理解できていません。この説明で言うとデータのバラ付き（分散）は桁数に無関係になります。ばらつきの多い、信頼性のないデータに対して桁数が増えるということが言えるということはないはずだと感じるのですが。９３．０に対するずれの平均が２．０であるということから議論されています。平均が２．０であってももっとばらつきの多い、信頼性のないデータがありえます。そのばあいでも同じ事になってしまいますので納得が行かないのです。＃７のご回答に対するお礼のところにまとめ的ものを書かせていただきました。あわせてご覧下さい。

okormazd
ベストアンサー率50% (1224/2412)

2008/06/07 00:40 回答No.5

ANo.4 です。データに間違いがありました。訂正します。すみません。 92.0 93.0 -1.0 91.5 93.0 -1.5 91.0 93.0 -2.0 97.0 93.0 4.0 93.0 93.0 0.0 94.0 93.0 1.0 92.0 93.0 -1.0 93.0 93.0 0.0 92.0 93.0 -1.0 92.5 93.0 -0.5 　　　　　　　　　-2.0 平均＝(93.0*10-2.0)/10＝92.8 掛け算、割り算だから有効数字3桁だ。ついでにですが。 ANo.3さんの心配は。 πやeなどの定数の有効桁数は、現に表示されている桁数。2πrなどの理論上出てくる係数の有効数字は無限大、人、個、点などの普通小数点以下をとらない測定値の有効桁数は無限大でどうですか。

okormazd
ベストアンサー率50% (1224/2412)

2008/06/07 00:22 回答No.4

有効数字の話はたびたび出てくるが、厳密な議論は難しくなるので、実用的ではなくなる。ある程度、こうしようという了解の下で処理するというのが実情だと思う。その場合、あまり例外的な事を持ち出して云々するとややこしくなるので、できるだけ簡潔になっているほうがいいのだろう。質問の場合も、「測定を１０回繰り返すということをやれば平均値の有効桁は測定の有効桁よりも１つ増やすことが出来ます」などということを一般化しないほうがいいのだろう。「１つ増やすことが」できるということと増やさなければならないということとは違う。一般の了解では、有効数字は3桁のデータとして、平均も3桁で出すのが妥当だと思う。また、ANo.1さんの計算の平均値4桁というのも、たとえば次のような計算の仕方をすればどうなのかということになる。 92.0　　93.0　　1.0 91.5　　93.0　　1.5 91.0　　93.0　　2.0 97.0　　93.0　　-4.0 93.0　　93.0　　0.0 94.0　　93.0　　-1.0 92.0　　93.0　　1.0 93.0　　93.0　　0.0 92.0　　93.0　　1.0 92.5　　93.0　　0.5 　　　　　　　　　 2.0 平均＝(93.0*10+2.0)/10＝92.8 掛け算、割り算だから有効数字3桁だ。だから、この研究を専門にするのでなければ、明らかにおかしいということを除いては、あまり面倒な議論はしないでなるべく簡単にしておきたい。考え方のばらつきはあって、「流派」のようなものもあるのだから。ここは、平均の有効数字は3桁。

質問者

お礼 2008/06/20 12:14

皆様ありがとうございます。御礼が遅くなって申し訳ありません。３桁のものの平均は３桁という疑問もある意味で納得できます。元々の疑問は数字は３桁で示されているがデータ群として信頼性がない場合はどうなるかというものでした。私は「２桁も怪しいのではないか、平均しても２桁を確定させるのがやっとである、３桁というのはともかく４桁は論外」というところから発想しての質問でした。

noname#77472

2008/06/06 23:36 回答No.3

そんな事したらまともな偏差値出てこなくなるよ。みんな９０点以上なんだし。　つ＾＿＾）つ http://homepage1.nifty.com/gfk/average.htm

ency
ベストアンサー率39% (93/238)

2008/06/06 23:15 回答No.2

たとえば、「92.0mm」というデータがありますが、このデータの意味するところは「91.95mm以上 92.05mm未満」ということです。つまり、「91.95mm以上 92.05mm未満」であることは確からしいということで代表値として「92.0mm」といっていると考えても良いでしょう。ちなみに、この場合 3桁目に誤差を含んでいるわけですが、これを「有効数字3桁」で表現しているといいます。他の 9つのデータも　91.5mm→91.45mm以上 91.55mm未満　91.0mm→90.95mm以上 91.05mm未満　97.0mm→96.95mm以上 97.05mm未満　93.0mm→92.95mm以上 93.05mm未満　94.0mm→93.95mm以上 94.05mm未満　92.0mm→91.95mm以上 92.05mm未満　93.0mm→92.95mm以上 93.05mm未満　92.0mm→91.95mm以上 92.05mm未満　92.5mm→92.45mm以上 92.55mm未満となります。さて、これらの数字を使ってどこまでの精度で計算できるかを確かめてみます。一番精度の悪い場合を考えるため、誤差の範囲の端の数字同士で平均値を求めてみます。すると、　92.745mm以上 92.850mm未満となります。 # 計算間違えてないよね？ご質問の意図は、もとのデータの平均値が「92.8mm か、92.80mm」かということですが、両者の精度はそれぞれ　92.8mm→92.75mm以上 92.85mm未満　92.80mm→92.795mm以上 92.805mm未満となります。また、データから得られる平均値の精度は「92.745mm以上 92.850mm未満」でした。平均値を有効数字 4桁まで求めて 92.80mm (92.795mm以上 92.805mm未満) とするほどの精度はないと考えるべきでしょう。この場合は、有効数字 3桁まで求めて 92.8mm (92.75mm以上 92.85mm未満) とするのが妥当なのではないかと思います。 …というような話を、学生時代に教えられた記憶があります。「有効数字の桁数以上の精度は求めない」と覚えておけばよいでしょう。元の質問に対する ANo1さんは > データ数が多くなると、平均値の有効数字を増やすことができます。と書かれています。一般に n=10 を「データ数が多い」とは呼べないと思いますし、参考URLで示しているようなもともとバラツキの少ない例で「n=10 で有効数字を1桁増やせた！」と言われても、回答として不十分だと思うのですが。。。 # データ数が多いといった場合、n≧50 はほしいところではないでしょうか。まぁ、最後は私見ですのであまり気にしなくても良いです。ご参考まで。

質問者

お礼 2008/06/20 12:34

皆様ありがとうございます。御礼が遅くなってしまい申し訳ありません。＞一般に n=10 を「データ数が多い」とは呼べないと思いますし、参考URLで示しているようなもともとバラツキの少ない例で「n=10 で有効数字を1桁増やせた！」と言われても、回答として不十分だと思うのですが。。。 # データ数が多いといった場合、n≧50 はほしいところではないでしょうか。＃７のご回答の中にもありますが分散は１／√ｎで小さくなっていくというのが元々の根拠だろうと思います。１０個のデータで求めた分散と１００個のデータで求めた分散を比べると１００個の方の分散が０．３倍ぐらいになっているということです。それだけシャープになるのです。ただこの場合も個々のデータを何桁で測ったかということと平均値の精度はいくらかということとは直接の関係はありません。＃７にも書かれていますがこのデータの場合、せいぜい２桁です。その２桁目の幅が平均によって狭まくなるだけです。平均しても２桁の精度（信頼性）しかない、という＃７のご回答に納得できるものがあります。５０回、１００回とやっても３桁にするのがせいぜいでしょう。とにかく測定の精度が悪すぎます。

hitokotonusi
ベストアンサー率52% (571/1086)

2008/06/06 22:33 回答No.1

有効数字と測定値の信頼性を一緒にしたらだめですよ。有効数字の計算では、足し算は有効桁の位置を合わせるので、小数第1位まで有効な数を合計すると、やっぱり有効数字は小数第1位までです。なのでその10個を合計すると928.0mmになり、小数第1位の0まで有効です。平均を計算するにはこれをデータ数の10で割ることになりますが、割り算・掛け算では桁数を合わせます。データ数の10には有効数字を考えないので、4桁が有効ということになり、有効数字としては92.80mmで正解です。しかし、この10個のデータの不確かさを計算してみると、測定値をxi、その平均を<x>として u=√[Σ(xi-<x>)^2/n(n-1)]=0.538・・・=0.5mm となるので、この測定値で信頼できるのは小数第1位までで、 92.8±0.5mm と、3桁が信用できることになります。ただし、最近は不確かさを2桁で表記することもあるようなので、その場合であれば、 92.80±0.54mm と4桁で表記することになります。有効数字による計算は、あくまでも簡便な計算法に過ぎませんので、最終的な測定値の信頼性は、不確かさを算出し、それで判定することになります。

質問者

お礼 2008/06/20 13:05

ありがとうございます。御礼が遅くなってしまい申し訳ありません。私はばらつきが大きいという漠然とした表現を使いました。ｈｉｔｏｋｏｔｏｎｕｓｉさまは不確かさという量を使っています。これは標準誤差と言われているものですね。＃７で使われている標準偏差のさらに１／√ｎになっています。＃７では標準偏差＝１．７となっています。これで２桁しか信頼性がないという結論を導いています。標準誤差だと０．５となって３桁だとなっています。私には標準誤差と標準偏差の使い分けがよく分かりません。どちらを使うかによって精度が変わるというのもよく分かりません。こ々でのデータの信頼性に対しての判断では標準偏差の方が標準誤差よりもいいのではないかと思うのですが。