- 締切済み
繰り返し測定 3回 の意味
化学実験や物理実験では、同じ測定を3回繰り返してその平均値を使うことが多いのですが、この“3”という数字は統計的に意味のある数字なのですか?
- みんなの回答 (10)
- 専門家の回答
みんなの回答
- arrysthmia
- ベストアンサー率38% (442/1154)
訂正 : No.9 は、たぶん早々に削除されることでしょう。 業界の慣習に沿って無難に処理するということは、 実務上必要でもあるし、考える労力の節約にもなります。 しかし、今回貴方がしたように「それは何故か」と 問うてみることは、物事を一段深いレベルで理解する ための入口になるのです。 慣習だけで済まさないほうがよい。せっかく関心を持ったのだから。 私の回答は、統計上の一側面について書いてみました。 他にもイロイロの観点があろうかと思います。 自分の考え方が、見つかるとよいですね。
- arrysthmia
- ベストアンサー率38% (442/1154)
最後のオチが「習慣に従え」じゃ、 数学カテゴリーとしては、ねぇ… 統計学の質問じゃ、ないの?
- info22
- ベストアンサー率55% (2225/4034)
#1です。 私の研究分野では学会の過去の研究論文や世界の先輩研究者の間で行われてきた標準的な実験データをとる為の試行回数が同じ実験条件に付き16回行ってその平均をとることが行われていましたので、それにしたがって膨大な試行回数の実験をおこなって、研究データを準備しました。 試行データ取得の繰り返し数は多ければ多いほど実験誤差の影響を取り除くことができます。実験には誰が行っても同じデータが得られるという再現性が求められます。そうでないと科学や研究とは言えません。 実験のやり方やデータの取り方や試行回数などは、その分野で認められた過去の実験データやデータ取得の試行数が過去の研究者の研究方法を元にほぼ決まっていることから、それに従えば、その分野の研究データとして学会や会社でも通用するデータになるかと思います。過去の実験方法や試行回数以上の実験を行ってデータを出すのであれば問題がないですが、業界や学会で確立している(常識となっている)実験条件や試行データ取得の繰り返し回数以下の実験データでは一般には通用しないと思います。単なるサボタージュ実験データとしか見做されないかと思います。 あなたのやっている実験についてはその分野で採用されている実験データの取り方(3回やって平均を取るなど)にしたがって、繰り返し回数を決めるといいでしょう。 先生も、そう言った実験データのとり方があなたの意図(できるだけ繰り返し回数を減らしたい)に対して、5回の平均を取るのがその分野の常識?となっていて、それを無視して繰り返し回数を減らす実験には、不安を感じておられるのかも知れません。 繰り返し回数は、統計的には回数が多い方が良いに決まっていますが、最低何回なら良いかという回数は、その分野で確立している(多くの研究者が認めている)過去の多くの人によって行われてきた実験データの取り方や回数を参考にすべきでしょうね。 そういった慣習を破るには、学会で多くの研究者や論文や業界に対して、それを覆すだけの理論的な根拠を示し、膨大な実験データを提示して実証し納得させないといけませんね。 その分野で最初に実験をしそのデータを研究論文等に投稿して受け入れられた場合、それが基になります。後続する同様な実験で多くの研究者が再現実験をしその実験方法や繰り返し回数で、不十分という実証データを提示して実験方法の変更などの提案がなされ多くの研究者に受入られれば、変更が加えられますが、そうで無い限り過去の実験方法が踏襲されます。 ですから、あなたの実験分野で行われている実験回数か、それ以上の回数の繰り返し実験を行うのが無難でしょう。先生も3回では不安に思っておられるのは、多分その分野では少なすぎで5回はやって平均をとるといったことにこだわって見えるのだと思います。 実験の難易度、費用、その他の条件がありますので、測定実験の繰り返し回数は、分野によって異なるのは当然ですね。回数は少ないよりは多い方がいいですね。でもその根拠は、過去のその分野の実験方法で多くの研究者で認められた妥当な回数によって決まるのでしょうね。
- stomachman
- ベストアンサー率57% (1014/1775)
データを捨てることの可否は、何を調べるために何をどう測るか、ということに依るんじゃないですかね。たとえば、ある物理実験を一度やると沢山のデータが出るけれども、それらのうちの最大値こそが測定結果だとします。この実験では、データ全体の分布は非常によく再現するんで、実験自体は安定している。けれどもまれに飛び抜けた最大値が現れることがあり、これは本来調べようとしている現象以外の外乱によるものと思われる(例えば背景放射線がたまたま飛び込んだとか)。で、この実験を様々な条件で行って、条件と測定結果との関係を調べることが目的である。…と、そういう状況では、どの条件でも丁度5回実験をやって、測定結果の最大と最小を捨てて残りを平均する、(あるいは中央値を採用する)というプロトコルを(恣意的でなく)常に行うと決めておくのは妥当かと思います。そうしないと、外乱の影響を強く受けて本来調べたい現象が見えなくなってしまうから。 …と、これは余談でした。 さて、ご質問の場合はANo.2のコメントに「空試験」とありますから、試験の対象は測定手段自体ですね。今後本番の測定を沢山行っていく予定であるが、その前に、測定手段がきちんと機能しているかどうか検証したい、という状況にあると思われます。 空試験における測定結果のばらつきは、この測定系の持つ不安定さの反映だと考えられるでしょう。この系で異常値がどのぐらい現れやすいかを知っていないと、本番の測定で何回繰り返し測定をやれば良さそうなのか、目処も立たない。いや、本番でも同じ対象を繰り返し測ることが出来るのなら、何度も本番を経験する中でばらつきの傾向を見ながら繰り返し回数を減らしていこう、というアプローチもある。けれど、もし、測定に凄くコストが掛かったり、あるいは測定したらサンプルが破壊されて同じサンプルはもうない、という状況だったなら、そうはいかない。空試験をするなり、きちんと準備された標準サンプルを使うなり、要するに本来ならいつも同じ結果が出ると期待される測定を繰り返し行って、測定手段自体の試験をやっておくしかない。 さてそういう状況において、「測定手段が原因となって異常値が確率pでランダムに発生する」という仮定を置くと、たとえば空試験を繰り返しても一度も異常値が出なかったなら、二項分布を使って(ある有意水準において)「pはある値以下だ」と推定できる。繰り返しを増やすほどpの上限値が小さくおさえられる。どのぐらいの上限値が欲しいかによって、繰り返し回数は決まる。なので、欲しい上限値がさほど小さくないのであれば、(ある有意水準において) > 5回測定にメリットが無いことは統計学的に証明出来る かも知れません。
- arrysthmia
- ベストアンサー率38% (442/1154)
ロバストネスの基本事項を、少し補足しておきます。 3項目の中央値に情報量が少ないのは、 3項目の平均に情報量が少ないのと同じことです。 毎日3回づつ測定して10~30の値が続いていたデータに、 ある日50が出現すれば、誰もが「何か変だ」と思います。 だからといって、この50を恣意的に取り除いたら、 データを改竄したことになります。 代表値として平均値を採用していれば、 データは、この50の影響を受けます。 それは、よく言えば、データの変化に鋭敏だということ。 悪く言えば、誤差の混入に脆弱だということ。 その二つは、同じことの両面です。 中央値を採用していれば、 代表値は、50の影響を受けません。 中央値は、平均よりも、鈍感かつ頑堅です。たった3項目の場合にも。
- Ishiwara
- ベストアンサー率24% (462/1914)
3という数に統計学上の意味はありません。あらかじめ得られた情報と、精度上の必要性から来るものです。 先日、2人の医師に「眼圧」を測ってもらったところ、どちらも3回測って平均値をとっていました。それが医学上の常識とマッチするようです。 また、情報という観点からすると、 1回なら平均値 2回なら平均値・分散 3回なら平均値・分散・歪度 4回なら平均値・分散・歪度・尖度が計算できます(それぞれ1次・2次・3次・4次のモーメント)。 また、実験計画法によれば、8回の実験で、1個の平均と7個の要因の影響が得られます。 これらは、n個の方程式でn個の未知数が得られる、という理論と同じです。 もちろん精度の話は別です。精度を上げるには、多くの回数が必要です。
- kgu-2
- ベストアンサー率49% (787/1592)
>5回測定にメリットが無いことは統計学的に証明出来るのでしょうか? 統計学的に証明できるのであれば、統計学の教科書に「測定は、5回すること」と明記しているハズなので、質問をなさる余地はありません。 以下、教科書は書かれていないことを述べます。 統計学的に正しいことと、実利的に適切であることは、一致しない場合が少なくありません。というのも、統計学の基本は、両群に有意差あり、の結論を主張することしかできないことです。例えば、ガン患者の生存期間について、薬Aだと10±1、薬Bで11±2、という結果になったとします。これは、患者数(サンプル数)が少ないときは有意差無し、であっても、患者数を増やせば(理論的には無限に)有意差を認めることができます。 有意差の判定には、単位は無関係です。現実的には、10年と11年と平均値に1年も差があれば、薬Bを選ぶでしょう。しかし、単位が秒なら、どうでしょうか。その1秒差のために、薬Bの値段が倍だったら。 3回と5回の選択は、統計学ではなく、実利からの判断なのです。 上司に「なぜ5回」と訊かれて、私以上の回答なら、尊敬して下さい。教科書にも書けないことをキチンと説明できるわけですから。 3回だと、中央値を使えるというご意見は、賛成できません。3つの中央値、なんぞは信頼性が薄からです。なにより情報量が少ない。たとえば、10、20、30の場合、中央値は、20それだけです。ある日のデータが50になっても、そのデータについて、「おかしい」という判断はできません。平均±不偏標準偏差(σ)なら、20±10になり、51というデータがでれば、『3σより離れているので、何かおかしい」という結論を、統計学的に主張できます。 平均値と中央値の使い分けも、教科書では不十分です。この相違は、統計学の基本中の基本なので、現場に合わせて使い分けができれば、統計学の初心者をようやく卒業でしょう。 と偉そうに書きましたが、私も初心者で、流行の多重比較なんぞは分りません。
- arrysthmia
- ベストアンサー率38% (442/1154)
> 5回測定にメリットが無いことは統計学的に証明出来るのでしょうか? 5回測定にメリットは、あります。 各測定の誤差間に相関がなければ (誤差に一定の傾向が無ければ、ということ)、 測定回数が増えれば増えるほど、測定値の分散(バラツキ)は小さくなる。 中心極限定理(大数の法則)というヤツです。 その意味では、測定は2回でもかまわないし、3,4,5,… と回数が増えれば なお良い。費用対効果は、また別の話ですが。 3回という測定回数が特別なのは、中央値をとることができるデータ数の最小値 だからではないでしょうか。中央値、最頻値などの統計量は、「ロバスト」と いわれ、大きな誤差を含むデータの混入に対して、平均値などより遥かに強い。 家庭用血圧計の使用説明書には、たいてい「3回測って中央値をとれ」と書いて ありますね。 最後に平均値をとってしまうなら、3回という回数にこだわる意味は無いでしょう。
- kgu-2
- ベストアンサー率49% (787/1592)
3回測定すれば、標準偏差が計算できます。測定値は、正規分布をしていると想定できるので、測定値の範囲を推定できます。平均±標準偏差に68%のデータは入るからです。 2回だと、標準偏差は、2つの測定値の半分、と自動的に決まってしまうので、ほとんど意味がありません。 「繰り返して測定して平均値を出すのは何故」と学生に訊くと、「正確に測定するため」なんぞの安易な返事をしてくれます。それに対して「それなら、3回と言わず、5回、10回、100回と、無限に測定したら」と反論すると、まず答えられません。「何回もする暇はない」なんぞが学生から返ってきますが、「1回で済むところを、3回も測定するのは、暇そのものろう」と思います。 救いようがないのは、検量線を3本引いて、その平均値を使え、なんぞ。検量線の方法を何も理解していない、からです。逆に1点検量なんぞの雑な記述も見ますが。 一般的なサンプル(サンプルにばらつきが無い、あるいは微小)測定では、繰り返しは不要です。標準偏差は、単に測定者の腕の悪さを露呈しているすぎないからです。また、測定者の腕以外に、機器や器具の誤差もあり、これは防げません。もちろん、暇と金が余っているのなら、無限に測定するほど、真の値に近づきますが。 逆に、動物実験のように、試料そのものに必ずバラつき(個体差)があるものは、最小でも3例必要です。 また、測定法が技術的に困難で、バラつきが大きいもの(私は、5%を目安にしています)については、動物実験と同様、何度か測定を繰り返しています。 私もたまに間違った回答をしてしまうことがあり、他の書き込みを批判したことはないと思うのですが、他の方の回答は、研究者として疑問を感じます、程度ではありません。どこの研究室か教えてほしいくらいです(本音は、こんな出鱈目な話は聞きたくもありませんが)。悪ふざけか、冗談でしょうか。それとも落とし穴。 5回測定して、上下のデータを削り、残りの3つの平均、というのは間違いです。自分の都合の悪いデータを削除しているので、データの改竄そのもので、絶対に許されません。許されるとご判断されるのなら、学会で堂々とありのまま話して下さい。 平均値ではありませんが、10匹マウスに化合物を投与して9匹には効いた。1匹死んだが、これは外れたデータなので削除、「この薬は、よく効く」なんぞが許されますか。 許されるのは、試薬を入れ忘れたなどが確実で、サンプルが残っておらず、再測定ができない場合など、のみです。それでも、削除した理由を明示する必要があります。 強いてあげると、5点で検量線を引き、『どうも1点外れている』の場合、その1点を外して検量線を引き直すのは、許されています。 スケートなどの採点で上下を外すのは、恣意的な採点がありえるので、そのルールが明示されているからです。科学の世界では、測定値が恣意的に出されるわけではなく(と信じたいが)、改竄は許されていません。
- info22
- ベストアンサー率55% (2225/4034)
2回の実験で異なる結果が出た場合、どちらがより正しい結果か分からないですね。もう一回実験すれば、それによって、間違ったデータ(誤差の大きいデータ)の目安やデータのばらつきなどの判断に使えます。余程おかしなデータでなければ、3個の実験値のデータの平均で、誤差の影響を減らせるかと思います。 最低3回の測定は最低限ですね。 3回より5回、7回と行って、上下の一番外れたデータを除いて、残りの平均を取ることも行われます。 真値が分からない以上、測定誤差の影響をできるだけ少なくする為に平均を取るわけです。 最低3回だけでも、大きな測定誤差が入った場合の測定値を除外できます。
お礼
さっそくの解答、ありがとうございます! 私も、info22さんのように思っていました。この質問をした敬意は、上記(ひとつ上の回答の補足)のとおりです★
補足
<それなら、3回と言わず、5回、10回、100回と、無限に測定したら? 私の知りたいのはズバリこれです!!私の上司は、空試験を5回しろと言います。3回では不安なのだそうです。この上司に5回測定の意味のなさを伝えたいのですが、5回測定にメリットが無いことは統計学的に証明出来るのでしょうか? 愚問でしたらすみません。