• ベストアンサー

調査結果は、標準誤差率が何%までなら信頼できるデータといえるのでしょうか

統計に関して全くの素人なもので、お力をお貸しいただけると大変助かります。 現在、仕事でレポートを作成しており、政府統計調査のデータを根拠として示したいのですが、標本調査結果に添付されている「推定値の大きさ別標準誤差率」を見ると、同じ調査でもデータの大きさによって1%未満から30%以上の標本誤差率が存在します。 レポートをまとめる際、例えば同じ「業種別の工場数」の表を記載する場合でも、都道府県ごとなら結果精度が保てても、市区町村ごとでは誤差率が大きくなるため不適切、といったことに注意しなければならないと思うのですが、 一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか(あるいは定義があるのでしょうか)。 ご教示よろしくお願い申し上げます。

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.4

こんにちは。 補足をありがとうございました。 >>>>> そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。 標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思った次第です。 なるほど。ご質問の趣旨がわかってきました。 それは、「有意差検定」と言います。 「有意差」というのは、文字通り、意味のある差という意味です。 2者(A,B)を比較して、 「AとBは、危険率○○%で、有意差がある。」 というような言い方をします。 「危険率」というのは、有意差検定の結論が間違いである確率のことです。 (注意!: 当然ながら危険率は、標準誤差のことではありません。勿論、標準誤差に関係はありますけれども。) 検定を行うに当たっては、どれだけの危険率を設定するかは、検定を行う人の自由です。 危険率を小さく設定すればするほど、信頼の置ける「厳しい検定」となり、その代わり、有意差なしという結論が出やすくなります。 どれだけの危険率で検定を行うかを最初に「決心」した上で、検定を行います。 http://www.blufi.co.jp/archives/24344389.html http://www.shiga-med.ac.jp/~koyama/stat/test.html ここから先は詳しくない(というか、昔やりましたが、ここ10年以上やったことがない)ので、この辺で筆を置かせていただきたいと思います。

hotate2600
質問者

お礼

 ご回答くださりありがとうございました。お礼が遅くなり申し訳ありません。お陰様で、入り口での私の疑問は解決したように思います。  「有意差検定」というのですね。統計学ではきっと基本中の基本みたいなことをお伺いしてしまったにもかかわらず、参考URLまで教えていただきありがとうございました。サイトを拝見したとき、冒頭の数式でもうダメだ・・・と思ってしまったですが、エクセルやWeb上で検定できるプログラムもあることが分かり、試してみようと思います。  いずれにしろ、まずは自分で勉強することが必要なことがよく分かりました。たびたびの拙い質問にご回答いただき、ありがとうございました。  

その他の回答 (3)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 統計学でいう標準誤差とは、いくつかのサンプルを得た場合、その平均値とデータのバラつき(標準偏差という)で示します。また、何度もサンプルを得ると、その平均値は同じにならない、すなわち平均値にもバラつきがあり、これを標準誤差と言います。  このバラつきが小さいほど、その結果に信頼性が高いのですが、統計学では、どの程度だと信頼する、という定義はありません。機器では、精度と表現されていますが、0.1~0.2%程度なら許容範囲でしょう。 データの信頼性については、バラツキ(精度)だけでは不十分です。測定した値そのものの信頼性です。鉛筆の長さをを測定する場合、いい加減なものさしを使うと、長さそのものが違ってきます。これを確度といいます。ですから、測定値の信頼性については、精度と確度の二つを満たす必要があります。 >、標準誤差率が何%までなら「信頼できる推定値」  測定データだと、短い処理か処理工程が長いかにもよりますが、学生の実習だと、5%程度。私は2%以内が目標。分析のプロだと、0.5%以内、と聞いたことがあります。  統計学は、魔法の小箱、という印象があるようですが、検定の結果いえるのは、「有意差がある」ということだけです。「差が無い」はもちろん、「差が大きいとか小さい」とかも、主張できません。その程度の代物です。ですから、「信頼できる推定」を標準誤差から決めるなんぞはできません。ただ、『信頼できない』と判断する数値を公表する人はいないでしょうが(嘘つきになります)、現実には間違っている場合も。 >「業種別の工場数」  工場については、0か1、まぎれることがありません。0.3の潰れかけなんぞは無いからです。誰でも、正確に数えられるので、バラツクことはないと想うのですが。  そうすると、平均はありえませんので、標準誤差も計算できません。  「お宅は、工場ですが」なんぞの同じアンケートを100通だします。これを3回繰り返すと、工場だという回答数は違ってくるので、平均も標準偏差、標準誤差も計算できますが、アンケートを繰り返すような馬鹿な真似はしないでしょうし・・・。  工場の人数なら、工場によって異なるので、標準誤差は出せます。

hotate2600
質問者

お礼

 ご回答くださりありがとうございました。お礼が遅くなり申し訳ありません。 >検定の結果いえるのは、「有意差がある」ということだけです。「差が無い」はもちろん、「差が大きいとか小さい」とかも、主張できません。 >『信頼できない』と判断する数値を公表する人はいないでしょうが(嘘つきになります)、現実には間違っている場合も。  統計の数値と自分が仕事の経験などから得た実感がズレているなあと感じることがあり、標準誤差の大小で採用するデータを決めたらいいのかな?と思ったのですが、そういうことではないのですね。  拙い質問に丁寧にご回答いただき、ありがとうございました。

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.2

 標準誤差率、つまりは無次元化された標準偏差ですよね。これはデータの信頼性を測るものではありません。例えばモノサシで長さを測るとき、測る対象自体の誤差とモノサシが持つ欠陥による測定誤差とが加わったものが測定値として出て来ます。信頼できるデータというのは後者の誤差が少ないことを指すので、両者が混じったデータでは測定値の信頼性を測ることはできません。  それを測るには測定誤差が分かっていて、それがじゅうぶん小さい計器によるデータと当該測定器によるデータを比較することで達成できます。その標準偏差値の差のパーセンテージがじゅうぶんに小さいとき、その計器は信頼性があると判断でき、従って取れたデータが信頼できるということになります。  ですからある村の標準誤差率が高いからその測定が杜撰ということにはならないのです。データ自体がばらついている可能性があるからです。

hotate2600
質問者

お礼

こんな夜中に私の拙い疑問にご回答いただき、ありがとうございました。数学のできる方の文章は理路整然と簡潔ですごいです。それなのに私の質問ときたら・・・・。もう少し勉強して自分の頭を整理したいと思います。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.1

こんばんは。 ちょっと失礼な言い方になりますけど、勘弁してくださいね。 「一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか」 という考え方が、すでに間違っています。 標準誤差や標準偏差というのは、 “ある一定の確率で「±誤差%」という範囲の中に入ります” ということなのです。 つまり、工場Aでの 500±1% と、工場Bでの 500±30% というものを比較したとき、 「500±1%」の信頼度と「500±30%」の信頼度は、全く同じです。 「信頼度」と「ばらつきの大きさ」というのは、全く次元の違う言葉なのです。 市町村毎の結果が、都道府県毎の結果よりもばらつきが大きくなることは当たり前なので、統計処理した結果の表において、大きい標準誤差なり小さい標準誤差なりを、そのまま「正直に」平均値の横に記載すればよいだけの話です。 以上、ご参考になりましたら。

hotate2600
質問者

補足

こんなに早く、訳の分かっていない私にも分かるようにご丁寧な回答をいただき本当にありがとうございました(全然失礼じゃないです)。それなのにまた勉強不足な疑問で大変恐縮なのですが・・・。 そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。 標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思った次第です。 質問の趣旨が分かりにくくてすみません(この考え方自体間違っていましたらご容赦ください・・・)。

関連するQ&A