- 締切済み
統計の信頼性について聞きたいです。数学的に知りたい
統計の信頼性について聞きたいです。数学的に知りたいです。選挙とかで、選挙結果の前に予想とかありますよね?ああいったデータってどれくらい信頼できるんですか?アンケートとってアンケート結果から予測してるわけですよね? つまり、20歳以上、今だったら18歳以上の人口全てにアンケート取らず、その一部からあたかも全体の予想の如くしているわけですよね?本当に信頼できるんですか?数学的に知りたいです。 選挙人口か1億人だっとしたら、どれくらいのサンプルを取ればいいんですか?1億人で仮に1000万のサンプルアンケートだったら信頼性は10パーセント%じゃないんですか? 残り9000万が全く反対の政党支持し出したら全然結果変わりますよね?この計算方法違いますか? 正規分布かなんかで信頼性求めたような、、すっかり忘れてしまいました、、
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- staratras
- ベストアンサー率41% (1498/3648)
選挙のついての世論調査(統計学的に意味のある方法で行ったアンケート調査)には、サンプル調査一般に共通する数学的(統計学的)な誤差に加えて、選挙固有の宿命というか制約があります。 それは「知りたいのは実際の選挙結果(選挙に行く人の投票する内容)なのに、調査対象は選挙に行かない人も含んでいる」という点です。これが例えば「工場で生産した商品の一部をサンプル調査して全体の品質を推定する」などという問題との決定的な違いです。 もちろん、世論調査をする側はそのようなことは百も承知なので、「今度の選挙で投票しますか」という設問を設けるなどしています。これは有権者の関心度(投票率)を予測するうえでの参考にはなりますが、では「必ず行く」「行くつもりだ」と答えた人の回答結果だけを集計すればよいかと言えばそうもいきません。 またサンプルを選び出す方法にも課題があります。日本では大昔は「米穀配給台帳」、昔は「住民票や選挙人名簿」からの無作為抽出(ランダムサンプリング)が用いられて、対象に選んだ有権者と面談する方法がとられていました。この方法は手間がかかるうえ、年々在宅率が低下して回答が得られにくくなりました。 このため最近ではRDD法と呼ばれる、「ランダムに発生させた電話番号に電話をかけて調査する方法」が用いられるようになっています。これも当初は固定電話だけが対象でしたが、それでは世代に偏りがあるなどの問題があるため携帯電話も対象とするようになりました。しかし携帯電話では固定電話では可能な「市街局番による地域限定」が不可能という問題があります。これから有望視されるのはインターネットによる調査ですが、これも世代間などの偏りが想定されます。 こうしたことから、選挙結果を予測するには事前の世論調査には限界があり、むしろ選挙当日に投票所の出口で実際に投票した有権者に聞く「出口調査」の方が信頼できるという考え方が強くなっています。これは確かにその通りで、『投票締め切り直後に選挙結果の予測をテレビ・ラジオで放送する」ような目的にはきわめて有効です。 しかし「投票日当日ではなく選挙戦の最中に全体の情勢を知りたい」という、社会に広く存在するニーズに対応するためには、「事前の世論調査」も、なお継続して行われていて利用する側はその限界(誤差)を理解する必要があります。
- skydaddy
- ベストアンサー率51% (388/749)
数学の説明をすると統計についての数学的基礎知識から始めることになりここには書き切れないので概念的は話をします。 選挙の結果を予測するアンケートは、どのぐらいの精度で結果を予測するかで必要なアンケート数が決まります。当然、沢山の人に聞いた方が当たる確率の高い結果が得られます。一方、統計は予想する対象(選挙なら投票者)が大きくなると一定の分布に近づくことを示します。これは何を意味するかというと対象が大きくなると検討すべきサンプル数が全体の数に合わせて増えるのではなく、割合と全体に対して小さな数でも予想が当たりやすくなることです。実際、対象の数が数千を超えると調査に必要な数はほとんど増えません。日本国民全体でのことを予想するのにたかだか数千のサンプルで99%以上の精度で予測ができます。選挙速報などだと、多分過去の履歴など単純なアンケート以外の要素も考慮しているのでその確率は99.99%以上で当確をだしているはずです。 1億に対して1000万に聞いても残りの9000万が異なると予想が外れるということですが、確率として1億の中から同じ答えを持った1000万だけを取り出す確率は天文学的数値で人の一生ではなく、地球の一生の中で1回起こるかどうか?(選挙が1年に数回程度として)の事です。それは起こるかも知れないと考えるよりほぼ確実に起こらないことと扱うのが統計や確率です。計算として0ではありませんが、起こるより起こらないが圧倒的に大きいという意味です。