- ベストアンサー
狙った値からのずれを数値で表すには散布図でよいのでしょうか
よろしくお願いします。 データのバラツキ、なんと言ったら良いのでしょうかバラツキ具合と言えば良いのでしょうか、それを数値で表す方法を知りたいのですがよく分かりません。 100を狙った時に 110 115 120 115 130 というデータと 100を狙ったときに 98 99 101 97 102 とでは明らかに後者のほうが精度が高いと言えると思いますが このことを数値で表すにはどうすれば良いのでしょうか エクセルで散布図を描くとx軸の数値は100しかありません Y軸の数値は前者は当然バラツキが大きいのですが、とても変な散布図になってしまいます。こんな散布図ってそもそもあるのでしょうか。 それ以前に散布図で表すことに無理があるのでしょうか。 うまく表現できていないために理解に苦しむ点も多いと思いますが どなたか教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
普通、度数分布グラフを描きますが、データ数が少ないので、平均やバラツキなどを直接計算して、数値で比較するのが良いと思います。 【平均と標準偏差(バラツキ)の計算】 (1) 最初のデータ組(110,..,130)をExcelのA列(A1~A5)に貼り付ける→ A6のセルに' =AVERAGE(A1:A5)'を記入(' 'は書かない)してEnter→A7のセルに' =STDEV(A1:A5)'を記入してEnter (2) 次のデータ組(98,..,102)をExcelのB列(B1~B5)に貼り付ける→ B6のセルに' =AVERAGE(B1:B5)'を記入(' 'は書かない)してEnter→B7のセルに' =STDEV(B1:B5)'を記入してEnter 【結果】 (1) 平均 118、標準偏差 7.58 (2) 平均 99.4、標準偏差 2.07 狙い目との差(平均-ねらい目)、標準偏差(平均からのばらつき)いずれも(2)のほいが小さいので(2)のほうが精度が高い。 分析オプションを使う方法もありますが、説明しづらいので、最も簡単な方法を紹介しました。
その他の回答 (4)
- kgu-2
- ベストアンサー率49% (787/1592)
誤差について、区別されていないようなので。 誤差を、正度と確度にわけると分かりやすいと想います。時計を例にすると、 毎日12時に時計をみると、いつも12時前後を指している。しかし、12時10分だったり、11時45分だったり、のように平均値は12時ごろというのを、正度は良いが確度は悪いと表現します。 一方、12時ピッタリだったのに、次の日は13時、次の次の日は14時のように、確実に毎日1時間ずつ進む時計を、正度は悪いが確度は良い、と区別します。 さて、正度は、平均値で表します。平均値が想定した値、すなわち、この場合100に近ければ近いほど正度は良いわけです。 確度は、バラツキといわれる標準偏差が代表的なものです。 グラフでは、正度は棒グラフなら高さであらわし、100の値が必要なら、横の線でも入れてください。 確度は、棒グラフのてっぺんから、標準偏差に相当する値の線を引きます(上下、もしくは上方のみ、場合によっては下へ)。エクセルヘルプで、「誤差」で検索してください。 これは、生物系の論文なら、必ずすることです。棒グラフでも、折れ線グラフでも、バラツキを必ず線で示しています。線はTのような形をしている場合もあります。また、その値は私は標準偏差を使いますが、標準誤差で表す人もいます。生物系の論文に目を通されるか、どなたかに訊いて下さい。 バラツキが標準偏差では駄目な場合は、一つ一つのデータを点で示します。これもありふれたグラフですので、「百聞は一見にしかず」で、生物系の論文をパラパラめくって下さい。
お礼
詳しく例をあげて教えていただきまして大変ありがとうございます。 確かに正度と確度の違いをよくわかっていませんでした。 大変勉強になりました。
- jjon-com
- ベストアンサー率61% (1599/2592)
回答ではなく,ANo.2・ANo.3を読んでの疑問です。 「狙った値」からのずれ,という質問なのに,なぜ平均を求めているのでしょう。 (a)100を狙った時のデータ 110,115,120,115,130 (b)100を狙った時のデータ 120,120,120,120,120 後者の(b)はバラツキがまったくなく「平均からの偏差」はゼロですけれど,「狙った値からの偏差」の合計は, (a)10+15+20+15+30=90 (b)20+20+20+20+20=100 となり,(b)の方が狙った値からより外れているように思えます。 (実用上は,狙う位置を最初から-20調整すればよいので,(b)の方が優秀だと思いますが) 平均の代わりに狙った値を使うだけですから計算は簡単でしょうけれど,おそらくそれは標準偏差とは呼ばないですよね。なにか呼び名はあるのでしょうか?
お礼
アドバイスありがとうございます。 タイトルと質問内容が完璧に違っていたために 回答者の方に迷惑をかけてしまいました。 ご指摘のとおり「狙った値からのずれ」を知りたいと思います。
- kamejiro
- ベストアンサー率28% (136/479)
バラツキ具合を数値で表すのは標準偏差で求めます。検索したらいろいろと求め方の式は調べられます。 http://www.aichi-gakuin.ac.jp/~chino/psycstat/chapter1/sec1.html 噛み砕いて計算手順を挙げると、 第一、平均を求めます。 110、115、120、115、130 の平均は、118 第二、各値との平均の差を求めます。 -8、-3、2、-3、12 第三、各々の値を二乗します。 64、9、4、9、144 第四、これらの値の平均を出します。 (64+9+4+9+144)÷5は、46 最後に、この値の平方根を取ります。 √46は、6.782329983 同じように、98、99、101、97、102 の場合で標準偏差を求めると、 1.854723699 となり、小さい方がバラツキが小さいことが分かります。 全部の数が同じ場合は、バラツキがないので、標準偏差は、0 になります。 散布図は、2つの数の相関(例えば、身長と体重等)を見るためのもので、上記の例の場合には標準偏差を求める方が適切だと思います。 他に、上位四分の一と、下位四分の一の差でバラツキを出す、四分位偏差っていう方法もあります。
お礼
詳しく教えていただきましてありがとうございます。 お陰様で標準偏差がどのような計算ででてくるのかよく理解できました。また散布図を使うケースをわかりやすい事例を上げて教えていただいてよく理解できました。今度のデータは散布図ではだめだということがよくわかりました。大変勉強になりました。ありがとうございました。
補足
親切に教えていただきましてありがとうございます。 私の説明が足りませんでした。 タイトルでは「狙った値からのずれ」と言っておきながら 質問では「ばらつき」という表現を使ってしまいました。 申し訳ありませんでした。 教えていただきたいのは「狙った値からのずれ」です 1回目100を狙って 93、102、101、 97、135と 2回目100を狙って120、120、121、120、119とでは あきらかに2回目はバラツキは少ないですが評価としては最悪です 1回目のデータには135という狙った値と大きくずれた値が一つありますがそれでも評価は最高レベルです。一回の大きなミスよりも 4回が安定して狙った値に近い値を出しています。
- rabbit_cat
- ベストアンサー率40% (829/2062)
数値は、まずは標準偏差(σ)を計算するんでしょうね。 http://www.pursue.ne.jp/Document_xls/xls0023.htm 図を描く場合は、Yの値で単純にヒストグラムを描けばいいのでは。 http://home.kanto-gakuin.ac.jp/~ahero/excel/hist/ もしくは、相対誤差 Y/X の標準偏差なり、ヒストグラムを描くなりしたほうが、いい場合もあるかもしれません。
お礼
ありがとうございました。ヒストグラムが良いことが分かりました。 やってみると意外に簡単でした。
補足
アドバイスありがとうございます 実際のデータは二回で各30近くあります グラフ用紙にプロットすると見た目ではどちらがずれが小さいか一目瞭然なのですが、これを数値で示すのが分かりませんでした 散布図はなんかおかしいなあとは思っていたのですが 教えていただきましたヒストグラムに挑戦してみようと思います 何年か前にもQCで習った覚えはあるのですがどうもうろ覚えで 身についていません。頑張ってやって見ます。
お礼
詳しく教えていただきましてありがとうございました。 狙い目との差(平均-ねらい目)、標準偏差(平均からのばらつき) この違いがやっと理解できました。ありがとうございました。 印刷保存して大事に使わせていただきます。
補足
親切に教えていただきましてありがとうございます。 私の説明が足りませんでした。 タイトルでは「狙った値からのずれ」と言っておきながら 質問では「ばらつき」という表現を使ってしまいました。 申し訳ありませんでした。 教えていただきたいのは「狙った値からのずれ」です 1回目100を狙って 93、102、101、 97、135と 2回目100を狙って120、120、121、120、119とでは あきらかに2回目はバラツキは少ないですが評価としては最悪です 1回目のデータには135という狙った値と大きくずれた値が一つありますがそれでも評価は最高レベルです。一回の大きなミスよりも 4回が安定して狙った値に近い値を出しています。