• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:無作為抽出で平均年齢30歳になる確率)

無作為抽出で平均年齢30歳になる確率

このQ&Aのポイント
  • 無作為に11名を選んだ時の平均年齢が30歳以下になる確率はどの程度あるのか?
  • 検察審査会の平均年齢が30.9歳という若さに疑問を持ち、無作為抽出の確率を知りたい。
  • 日本人の年齢構成を前提に、20歳以上の11名を無作為に選んだ場合の平均年齢が30歳以下になる確率が気になる。

質問者が選んだベストアンサー

  • ベストアンサー
  • papa-guma
  • ベストアンサー率100% (1/1)
回答No.3

http://www.toukei.metro.tokyo.jp/juukiy/2010/jy10q10601.htm ここで、かなり正確な平成22年現在の東京都の年齢別人口が分かります。 http://sankei.jp.msn.com/affairs/trial/101005/trl1010051955009-n1.htm で報じられているように、検察審査会の11人の平均年齢は、 1回目:34.27歳 2回目の平均年齢:30.90歳 となります。 今回の検察審査会の対象は、東京都民ですが、まず有権者から選ばれ、 検査法第5条から第7条に該当する方が除斥され、検査法第8条に該当する方は辞退可能です。 http://www.houko.com/00/01/S23/147.HTM#s2 辞退出来る人の条件は下の大まかにはリンク先の通りで、70歳以上の方は任意に辞退出来ることになります。 http://www.courts.go.jp/kensin/q_a/q28.html また、島に住んでいる人など、町村に住んでいる人たちは、往復でかなりの負担がかかるため、 やむを得ない事情ということで、抜けることも可能かもしれません。 除斥される方は、まず全体からみて少なく、また、年齢もほぼ一様に広がっていると 考えられるため、考慮する必要はありません。(誤差の範囲になります) 以上の事から、対象を、『平成22年の東京都の区部・市部の20歳以上、70歳未満』に限定して、 計算機を用いてシミュレートしてみました。 114764, 129829, 139317, 156213, 168990, 181678, 185709, 187437, 189819, 193936, 201216, 205167, 207597, 211507, 214705, 226978, 235054, 230807, 227315, 220988, 216615, 213950, 218324, 158336, 202569, 187105, 173772, 164315, 156465, 153510, 147778, 145646, 134967, 136167, 139211, 138967, 141882, 151812, 157961, 171561, 198236, 197308, 201501, 137814, 122194, 150353, 160989, 154820, 155493, 142255, 上のデータは、20歳から69歳までの、条件に該当する人口です。 この人数をそのまま使って、無作為に11人抽出し、その平均を取る操作を1億回行います。 100000000 回(1億回)の試行結果 【 平均年齢が34.3歳未満になる確率:0.01115924 ≒ 1.1% 】 【 平均年齢が31.0歳未満になる確率:0.00064632 ≒ 0.065% 】 平均年齢は、43.6 歳です。(本来は、もっと上がります。) 分布は、添付画像の通りです。 *町村部を含めたり、70歳以上の人が多少なりとも断らないとすれば、もっと確率は下がります。 結果から考えると、1回目が1.1%, 2回目が0.065% となると、2回合わせて、0.0072% などという、文字通り「万に一つも起こらない」ことが起きてしまっていることになります。 これは、検察審査会の選定人が、意図的に若い人のみを選定をしたことが一目で伺える結果で、 マスコミが「市民感覚」などと、あたかもメンバー11人が国民の代表的感覚であるように 宣言することが、如何にインチキくさいことであるか、わかると思います。 これだけ検察の不祥事が続いている中の出来事ですから、 「検察審査会なるものが、政治闘争に利用されたのではないか」という疑問は誰でも 持つはずで、ここの部分の真相を明らかにしてもらいたいところです。 色々噂はありますが審査申立人が不明で、1回目の顧問弁護士「米澤敏雄」は麻生総合法律事務所勤務 ですが、http://www.aso-law.jp/topics.html をみると、政治的に中立であったか甚だ疑問です。 2回目も僅か1週間で決議を下し、その議決書も被疑事実外のことが書かれている、といった、 かなり危ういことが続いているのは事実で、それを全く報じないマスコミと検察主導の 「魔女狩り」裁判が、法治国家日本で行われようとしていると考えると、背筋が凍る思いです。

massaur
質問者

お礼

ありがとうございます。 そうか!パソコンでシミュレーションしてみる、という手がありましたね!! ともかく確率はきわめて少なく、何らかの意図があったと見るのが自然だということですね。 小沢さん側はそれをもっと言うべきだと思うのでが、報道されないのは、言ってないのか、言っているけどマスコミがその意見を封じているのか?マスコミの専制を許さないのもインターネットの大きな役割のひとつだと思います。

その他の回答 (10)

  • papa-guma
  • ベストアンサー率100% (1/1)
回答No.11

No.3 です。 この問題のように、ある確率分布を持ったものから、数個のサンプルを取り、 平均値を取るといった操作を繰り返すのは、サンプル数の増加に従い、 急速に正規分布に収束します。 これは、No.10 さんの解説の通り、中心極限定理で保障されています。 ただ、中心極限定理では、平均値と標準偏差の2つの値で 最初の分布を単純化しているため(この2値で決まる、 というのがまたすごい所で、応用範囲が大きいのです。) 条件が整わないと、精度が今一つになります。 というわけで、シミュレーションで数値を出していたのですが、念のため、 数学的に解いてみました。 こういう離散的な確率の足し算は、畳み込み和で表すことが出来ます。 結論から申しますと、n=8760902 (総和)として、 (114764 + 129829 x + 139317 x^2 + 156213 x^3 + 168990 x^4 + 181678 x^5 + 185709 x^6 + 187437 x^7 + 189819 x^8 + 193936 x^9 + 201216 x^10 + 205167 x^11 + 207597 x^12 + 211507 x^13 + 214705 x^14 + 226978 x^15 + 235054 x^16 + 230807 x^17 + 227315 x^18 + 220988 x^19 + 216615 x^20 + 213950 x^21 + 218324 x^22 + 158336 x^23 + 202569 x^24 + 187105 x^25 + 173772 x^26 + 164315 x^27 + 156465 x^28 + 153510 x^29 + 147778 x^30 + 145646 x^31 + 134967 x^32 + 136167 x^33 + 139211 x^34 + 138967 x^35 + 141882 x^36 + 151812 x^37 + 157961 x^38 + 171561 x^39 + 198236 x^40 + 197308 x^41 + 201501 x^42 + 137814 x^43 + 122194 x^44 + 150353 x^45 + 160989 x^46 + 154820 x^47 + 155493 x^48 + 142255 x^49)^11/n^11 で表される x^m の係数が、11回ランダムに選んで年齢を足した和が m+20*11 になる確率となります。 平均年齢31.0歳未満というのは、11回の和が340以下、 平均年齢34.3歳未満というのは、11回の和が377以下 ということですので、 平均年齢31.0歳未満になる確率は、上述した式の、第121項(x^120)までを とって、x に 1 を代入したものと一致します。 平均年齢34.3歳未満になる確率は、上述した式の、第158項(x^157)までを とって、x に 1 を代入したものと一致します。 よって、【厳密解】は、次のようになります。 【 平均年齢31.0歳未満になる確率は、0.000646731 ≒ 0.0647% 】 【 平均年齢34.3歳未満になる確率は、0.0111554 ≒ 0.0112% 】 No.3 の結果は、これに良く一致することが解ります。 2回判決があって、1回が平均年齢31.0歳未満、あと1回が 平均年齢34.3歳未満になる確率は、 2*0.000646731*0.0111554 = 0.0000144291 であって、 そんなことが起こるのは、約10万回に1度の確率と言えます。 繰り返しますが、この仮定は平均値が若くなりやすいように設定されたもので、 実際には、No.5 にありますように、約百万回に一度のことが起こったと 考えるのが普通です。

massaur
質問者

お礼

何度も投稿いただき、大変感謝しております。 ただ、今回のご指摘は私の理解を超えています。猫に小判になってしまって申し訳ない気持ちです。 No3でのお答えを参考に、自分なりにCrystalBallというソフトを使って100万回の試行をやってみました。平均が30.9以下になったのが560ケース、確率で0.056%という結果を得ました。 ありがとうございました。

  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.10

#3さんの示したサイトの東京都のデータから,20歳以上の都民の平均年齢μとその標準偏差σは,μ=49.46歳とσ=18.26歳です。 統計学で重要な定理に,中心極限定理があります。これは,母集団の分布がどうであれ,それから採られた標本の平均の分布は正規分布になり,その平均x'はμに等しく,標本の大きさ(個数)をnとすれば,標準偏差はσ/√(n)になるというものです。 これを,質問に当てはめます。11人を無作為に選ぶことを繰り返して,その平均年齢を記録します。その平均年齢の平均x'が49.46歳になり,標準偏差は18.26/√(11)=5.50の正規分布になるということです。 これは,正規分布で,平均も標準偏差もわかっているので,11人を選んだときの平均年齢範囲の確率を計算できます。ここでは,11人の平均年齢が30.9歳以下になる確率を計算します。 EXCELでNORMDIST(30.9,49.46,5.50,TRUE)=0.000372です。要するに,11人を無作為に選んだとしたとき,その平均年齢が,30.9歳以下になる確率が,0.0372%だということです。平均的には,3000回も選べば1回くらいは30.9歳以下になるかなという感じです。統計なので,10回選んで出るかもしれないし,10万回選んでも出ないかもしれない。まあ,めったに起こりそうもないという確率です。 ただ,これは100歳以上も含めた確率なので,実際は辞退も認められているようですから,もっと確率は高くなるでしょう。 また,20~69歳の都民とすれば,11人選出の平均年齢43.66歳,標準偏差4.19歳で,30.9歳以下の確率0.00116 になります。%でいえば,0.116%で,1000回に1回程度で,これもめったに起こりそうもないですね。

massaur
質問者

お礼

ありがとうございます。 正規分布を仮定するのでなく、実際の人口分布でかつ20歳以下を除いた場合どうなるか、を知りたいと思いました。 ご指摘ありがとうございます。

  • papa-guma
  • ベストアンサー率100% (1/1)
回答No.9

No.9 正誤表 誤)int heikinList[] = new heikinList[70] 正)int heikinList[] = new int[70]; 誤)j++ 正)i++ 見直さなずに投稿すると、酷いですね・・・

  • papa-guma
  • ベストアンサー率100% (1/1)
回答No.8

>>No.6 さんへ No.3 です。 ohia15さん、平均を取るところまでは No.7 のコードでよいので、 その平均を取る操作を十万回か百万回繰り返し、 平均を(int)に変換して、int heikinList[] = new heikinList[70] なんかを作って、カウントしてみてください。 具体的には、 int N = 1000000; for (int i = 0; i < N; j++) { heikinList[(int)select11()]++; } みたいなことをすれば、頻度表が作れます。 あとは、heikinList の 20番地から、30番地までの和をとれば、 N回試行中、何回平均年齢が31以下が出たかがカウントできます。 最後に、そのカウント数を、全体の試行数N で割ることで、お望みの確率が得られます。 つまり、【N回試行した時、何回平均が31未満になるか】が求まります。 実際、No.7 のコードをほとんどそのまま使って試したところ、No.3 と同じく0.000655が得られました。

  • ohia15
  • ベストアンサー率0% (0/1)
回答No.7

回答No.6です。Javaで作ったプログラムです。もしよかったら試してみてください。 ~~ここから~~ import java.util.*; public class RandomSelect { static int tokyo[] = { 115498, 130556, 140068, 156982, 169774, 182470, 186548, 188299, 190693, 194795, 202166, 206170, 208547, 212535, 215812, 228202, 236284, 232013, 228570, 222138, 217760, 215019, 219456, 159171, 203656, 188078, 174770, 165283, 157426, 154458, 148806, 146720, 135968, 137330, 140346, 140234, 143118, 153217, 159420, 173212, 200053, 199158, 203277, 139026, 123291, 151727, 162423, 156167, 156798, 143502}; static Random rand = new Random(System.currentTimeMillis()); static int total = 0; public static void main(String[] args) throws Exception { total = 0; for (int i = 0; i < tokyo.length; i++) { total += tokyo[i]; } System.out.println("東京都の20~69歳の総人口 = " + total); double totalAverage = 0.0; for (int i = 0; i < 100; i++) { totalAverage += select11(); } System.out.println("全体の平均 = " + (totalAverage / 100.0)); } public static double select11() throws Exception { int selectedMembers[] = new int[11]; int memberTotal = 0; System.out.print("メンバーの年齢 ["); for (int i = 0; i < selectedMembers.length; i++) { int index = rand.nextInt(total); selectedMembers[i] = searchSelectedPerson(index); memberTotal += selectedMembers[i]; System.out.print(selectedMembers[i] + " "); } double average = memberTotal / 11.0; System.out.println("], 平均年齢 = " + average); return average; } public static int searchSelectedPerson(int index) throws Exception { int ruiseki = 0; for (int i = 0; i < tokyo.length; i++) { ruiseki += tokyo[i]; if (index < ruiseki) { return i + 20; } } throw new Exception("Error"); } }

massaur
質問者

お礼

ありがとうございます。 ううん・・・Javaも勉強しないといけないなあ・・・・

  • ohia15
  • ベストアンサー率0% (0/1)
回答No.6

東京の年齢分布を使って、100回、11名を選出するというプログラムを作ってみました。 試してみたところ、平均年齢31.18歳という組み合わせが出たケースがありました。 メンバーの年齢 [31 41 36 51 51 58 42 28 35 22 46 ], 平均年齢 = 40.09090909090909 メンバーの年齢 [48 68 30 25 55 57 28 32 41 60 40 ], 平均年齢 = 44.0 メンバーの年齢 [62 31 25 23 44 39 43 24 69 29 33 ], 平均年齢 = 38.36363636363637 メンバーの年齢 [48 69 64 37 61 27 27 35 38 59 27 ], 平均年齢 = 44.72727272727273 メンバーの年齢 [28 62 66 34 46 29 51 34 30 35 56 ], 平均年齢 = 42.81818181818182 メンバーの年齢 [35 58 62 39 43 33 44 57 59 51 34 ], 平均年齢 = 46.81818181818182 ... メンバーの年齢 [29 34 37 26 34 26 27 32 31 46 21 ], 平均年齢 = 31.181818181818183 ... 全体の平均 = 43.17727272727273 確率・統計学上は、多くの回数、無作為に抽出すれば平均値に近づくということは言えますが、「個々」の選択が平均から離れることが無いとはいえせん。ここでのポイントは「多くの回数」という点です。多くの回数繰り返せば平均に近づきますが、20~69歳という幅に対して、11名しか選出していない場合、個々の選出については偏る可能性もあります。(それが無作為(ランダム)という意味です) 単純なイメージとしては、20~69の目のサイコロを11回振って、その目の平均が45にならなかったといって、問題があると思うかどうかです。100回、1000回と続けて、平均に近づかなかったらおかしいとは言えますが。 平均年齢について、統計学上おかしいと指摘する人がいますが、統計学という学問では、これをおかしいかどうか判定することはできないと思います。

massaur
質問者

お礼

ありがとうございます。 確かに11人の平均年齢がうんと小さくなるケースがあり得ることは間違いないと思います。ただ、その確率がどのくらいか、であって、何百回に1回しか起こらないことなら、その裏に何かあるのではという疑念が湧く、という事かと思います。 実は私もN03の答えを聞いてから、クリスタル・ボールというソフトを使って試行してみました。100万回無作為抽出を行って、平均年齢が30.9歳以下になったのは560ケースありました。確率0.056%です。 これはやはりあり得るけど滅多なことでは起こらない、と考えるのが普通ではないでしょうか。

  • papa-guma
  • ベストアンサー率100% (1/1)
回答No.5

No.3 です。 えっと・・・すごい恥ずかしい間違いしてました。訂正させてください。 >結果から考えると、1回目が1.1%, 2回目が0.065% となると、2回合わせて、0.0072% >などという、文字通り「万に一つも起こらない」ことが起きてしまっていることになります。 の部分ですが、1.1%, 0.065% 合わせて、【0.00072%】ですから、 【10万回に1回も起こらないことが起きている。】が正解です。 すごく恥ずかしい(涙  一応、これは、70歳以上が全く参加しないという前提ですので、かなり若い人に傾きやすい設定です。 実際には、本当に高齢の方(90歳以上?)を除いて、全員が断るとは考えにくく、確率はもっと下がります。 真の値に近づくような設定でシミュレートした結果を一応書いておきます。 人口の分布は、No.3 の統計の所からデータをとったもので、かなり正確です。 「東京都の区部・市部から、無作為に11人選ぶ。  ただし、70歳~79歳の方は、1/3は断る。80歳以上は、必ず断る。」 という条件の元、また1億回試行してみると、 平均年齢 : 46.0歳 【 平均年齢が34.3歳未満になる確率:0.00442832 ≒0.44% 】 【 平均年齢が31.0歳未満になる確率:0.00023758 ≒0.024% 】 1回目:0.44%, 2回目:0.024% 合わせて、1.0*10^-6(百万分の一) ということが起こったことになります。こちらの方が実際の値に近いはずです。 流石に、これを偶然で済ませるのは、なかなか難しそうです。 何らかの意図をもって、人を選んだとなれば、「どのような基準で選んだのか」が 問題になると思います。 マスコミでは、「ド素人の若い人の判断」ということを前面に出していますが、 もし、仮に、無作為でなく、意図的に検察審査会が11人を選んだとするならば、 これは「ド素人の若い人」の意見ではなく、 正真正銘の「プロ」である検察審査会の選定人の意図が強く反映されたものと考えるのが筋です。 決議をする日程を決めることや、審査員を選ぶこと、短期間膨大な捜査資料を読み解くことなどは、 若い人でなくとも、素人では不可能なのであって、世間の人が、この11人の人たちや若者について あれこれ言うのは著しく筋違いで、本質から目を逸らしている(目を逸らさせられている)ように感じます。

massaur
質問者

お礼

ありがとうございます。 70歳以上の条件をちょっと変えただけで、劇的に確率が下がるんですね。ちょっと驚きました。 この結果は選定人の意図なのか、選ばれた人達が何人か断り、結果として若い人だけになったのか?サラリーマンだと会社を休むのが大変だから、断れるものなら断りたいのが心情でしょう。学生なら「面白そうだからやってみよう」という人が多いだろうけど。 何人に断られたのかなど選定の過程も出来れば公表して欲しいですよね。

  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.4

No.1です。 選出される人の分布が20才にカットOFFが有り、台形の様な形を していることから、通常の計算ではできないと考え単に平均だけで おかしいと示すに留めました。 年齢階層別に箱に入った多数の球を考え、それをランダムに取出し、 平均年齢30才という制限条件下での出現確率を求めるという、 統計物理に似た問題と考えましたが、とても定式化はできませんでした。 No.3の回答に敬服です。パチパチ!! 年輩者ですが、今回の件に限らず疑問に思っていたことが有ります。 裁判員裁判でも、インタビューに答えている60才以上の年輩者が 極めて少ない事に違和感を持っていました。この質問の資料にも 見られるように60才以上の人口はかなり多くまだ元気な人が多いのに です。 辞退できるのでそうなるのかと思っていました。 裁判員の様に義務では無く、辞退が容易なら今回の件では 次の可能性も考えられます。 ランダム(?)に選ばれた審査員のプールから「そんな事には 関わりたくない、興味はない」と言わせるように依頼を持って行く。 残るのは世論に影響を受けやすい正義感(?)の高い若い人で暇な人。 世論とか世論調査に振る舞わされる作今ですが、こういう重要な点を 検証無しで垂れ流すTV、新聞には警鐘を鳴らしたいものです。 以前「何故どの世論調査も有効回答率は60%程度なの」と言う質問に 「現在の生活では、固定電話で捕まる人の割合はほぼ一定で、それが 60%。忙しく動き回る働き盛りの人は捕まらず、調査結果にはあまり 反映されない事に注意する必要が有ります。」と答えた事が有ります。 質問者と興味有る回答に改めて「教えて!Goo ってい~もんだな~」と 実感しました。

massaur
質問者

お礼

そうですね。民主主義は公平性と透明性の確保が非常に大切だと思いますが、透明性とプライバシーは時として反するのでそこが問題だと思います。 裁判員とか検察審査会の委員とか、個人情報が漏れるのは大いに問題なのでしょうが、せめて性別と年齢くらいは公表してほしいですね。それくらいの透明性がないと、仮に自分が当事者になったとき、やってられないという思いがするでしょう。今の小沢さんがまさにそうでしょうが。

  • magiru
  • ベストアンサー率0% (0/1)
回答No.2

 統計の専門家ではないので誤りがあるかもしれませんが、計算をしてみました。  参考URLページから東京都の年齢階級別人口の一部を引用すると、 20~24歳  712,878 25~29歳  942,805 30~34歳 1,045,230 35~39歳 1,147,207 40~44歳 1,015,062 45~49歳  840,015 50~54歳  709,170 55~59歳  769,201 60~64歳  864,805 65~69歳  770,617 のようになっています。70歳以上の人口も無視できない規模ありますが、70歳以上は年齢を理由として検察審査員を辞退できるようなので除外(*1)します。  母集団の平均μと標準偏差σを計算すると、μ=43.7、σ=13.9となります。  この母集団から大きさ11の標本を無作為抽出する場合、標本平均は近似的に平均m=μ=43.7、標準偏差s=σ/√11=4.2の正規分布に従います(*2)。  正規分布表から、標本平均が30.9以下(m-3.05s以下)となる標本が抽出される確率は約0.11%と求められます。  なお、1回目の「起訴相当」を議決した際の平均年齢である34.3歳の場合は、標本平均がそれ以下(m-2.24s以下)となる標本が抽出される確率は約1.25%となります。たった3.4歳違うだけですが、確率的には10倍の起こりやすさの差があります。 *1 これによって母集団の平均、標準偏差はともに小さくなります。 *2 標本の大きさがやや小さいので、近似の精度はあまり高くなりません。

参考URL:
http://www.toukei.metro.tokyo.jp/juukiy/2010/jy10000001.htm
massaur
質問者

お礼

ありがとうございます。 平均値から乖離具合と標準偏差の関係から確率を推定するのですね。なるほど!! それにしても確率が0.1%とは!これは無作為抽出とはいいがたいのではないでしょうか。小沢さんの「実態がベールに包まれている」という指摘も当たっているかも。

  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.1

ご指摘を受け、なるほどと考えてみました。 確率統計学的な検証は後の機会または誰か専門の人にと言うことで、 とりあえずの検討結果を。 検討には、参照URLの2-6から全国を採用しました。以下の数字です。 年齢  人口   代表年齢  人口x代年 00~14 17.2     7     120 15~19  6.2   17     105 20~24  7.1   22     111 25~34 16.6   30     498 35~44 18.0   45     810 45~54 15.6   50     780 55~64 18.8   60    1128 65~   28.8   75    2115 人口の単位は100万人です 00~  127.7         5667 20~  104.3         5442 日本国民の平均年齢は、44.4歳、 成人以上の人に限れば52.2歳となります。 成人からランダムに選ばれた11人の平均年齢が30.9歳と言うことは 平均値より20歳も若く、抽出に何らかの誤りか作為が有ったと考えられます。 65歳以上の年輩者を排除した場合、44.1歳。 55歳以上の年輩者を排除した場合、38.8歳。 東京都は若い人が多いと考えても、全国人口の1割の線を若い年齢層で 若干上回り年輩者で若干下回る程度ですから、年輩者を排除しない 限り平均30.9歳は不自然な数字です。

massaur
質問者

お礼

ありがとうございます。 平均年齢から考えると30.9歳というのは本当に不自然な感じがします。ただ、それが本当に有意であるのかどうか、無作為に選んでも30歳になる確率が5%以上あるのかどうか、を知りたいと思いました。 裁判員の平均年齢などは公表されているのかどうか知りませんが、こちらとの差も興味あるところです。

関連するQ&A