- ベストアンサー
平均年齢の計算
年齢を訊かれた時に、四捨五入(182捨183入?)して答える人は少なく満年齢で答えることが一般的だと思います。 それを前提に考えると、次の事実は正しい(と考えられる)でしょうか? もし正しいとした場合、一般的な統計調査ではどうなっているのでしょうか? 1.「自分の年齢は33歳」と答えた集団の平均年齢は約33.5歳 2.「自分の年齢が30歳」と答えた人が50人、「自分の年齢が34歳」と答えた人が50人いるような100人の集団の平均年齢は32.5歳
- みんなの回答 (14)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
>「一般に、満年齢で調査した時は平均年齢を小数で表し、 何歳何ヶ月まで回答させた時は平均年齢も何歳何ヶ月という形で表す。後者の形式で表記したいなら、前者の値に0.5を足してから行うべきである。」 ほぼ正解だと思います。ただ、No.11で書いた「小数点以下は整数部分から月数が超えていることを意味するわけではない」ということも踏まえていただければ幸いです。 たとえば満年齢平均32.1歳という数字が出たとします。これは書いたように、究極的に32歳が9人と33歳が1人の集団です。そして、この集団の誕生日が一様であると認識して初めて、その平均は「32歳7ヵ月と1週間」と変換できます。ですから、「平均は32.1歳」を、その蓋然性の高さを踏まえた上で「平均は32歳7ヵ月」と発表するのは近似的に間違ってはいないでしょう。 ただし、これを「32.6歳」として発表するのは×です。これだと「究極は32歳2人と33歳3人の集団」という調査結果に変えてしまうことになりますから……うーん、ただし、「小数点以下が月に対応するように補正しました、平均は32.6歳です」と発表すれば、とりあえず32.6歳という数字を使っても間違いではないのでしょうが、これはつまり「変換作業を行った」と同義であり、小数点以下の意味合いが元の調査とは変質しています(究極的な集団の割合を示すものから、月まで含めた歳の細分を示すものへ)。それだったら32歳7ヵ月と書いた方が親切かと。 質問者様のご意見をふまえて、わたしの結論としてはこうです。 ・満年齢の調査なら、32.1歳と発表することは純粋に計算結果を示すことであり、それはそれで意味がある(そもそもこの数値がなければ変換もできない)。 ・質問者様のように補正すべきと考え、そうしたのなら、「補正しました」と書いた上で、32歳7ヵ月と発表すればよい。小数点以下の意味を明記した上で32.6歳としても間違いではないが、不親切。 ・なにも書いていなければおそらく満年齢調査だと考えられるので、結果を見る側がもっと細かく知りたいのならば、発表された数値を変換する(誕生日が一様ならば、発表数値に0.5を足して月変換すればそれなりに近い数字が出ると思われる)。 ・おそらく最も親切なのは、「満年齢の相加平均は32.1歳です、これは誕生日の分布を勘案すると32歳7ヵ月1週間に相当すると言えます」という発表。 そして最終的に、 > 「TV局や新聞社がどうやって発表するかまで、統計する側では制御できない」と言うのであれば、統計する段階で何らかの配慮(0.5をプラスするなど)を行うべきなのではないかと思うのですが、どうやっているのでしょうか? という質問に対しては、「どうやっている」どころか、おそらくそのような配慮は「なにも」しておらず、満年齢をぜんぶ足して、総数で割った数字を発表しているだけでしょう(やっているなら質問者様も私も目にしているはずです)。だからそれを知らされるこちら側がもっと細かく知りたいのなら、変換する必要があります、ということになります。
その他の回答 (13)
>統計作業は「満年齢で考える前提が置かれている」ではなく「満年齢までしか回答させていない」と いうことではないのでしょうか? その通りと言えるでしょう。だから「結果を見る側」も「満年齢」で考え「なくてはならない」んです 。 >言わば「切捨てした値でしか表示できない測定器」のようなものであり、 >測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか? なるほど、おっしゃりたいことが分かってきました。ではそういうデジタル温度計で水温を測ってみましょう。40000個のビーカーの水を測定すると、それぞれ10000個ずつ4℃、6℃、7℃、8℃と出ました。平均は6.25℃です。「この測定で言えること」は、「6℃のビーカーはすべて平均より冷たい」ということです。「6℃のビーカーには6.0℃も6.9℃もあるかもしれない、しかし6℃として扱ったときの平均」ですから。ところが突然0.1℃単位の温度計を持った人が現れて6℃のビーカーのうちふたつを測り、「このビーカーは6.7℃、こっちは6.8℃だ。だからこのふたつは平均より熱いんだ」と言いだしました。この「0.1℃単位の温度計を持った人」が質問者さまです。 これらのの水が本当に平均より熱いかどうかは、「実際に0.1℃単位ですべてのビーカーの温度を測 る」(つまりn歳mヶ月まで調査する)か、あるいは「ビーカーの温度は0.1℃単位で一様に散らばっ ていると仮定して計算し直す」(つまり誕生日分布をもとに計算する)かしかありません。ここで質問者さまは散らばっていると仮定して計算することを選びました。平均は6.74995℃のようです。ここにおいて「初めて」、6.7℃は平均より冷たく、6.8℃は熱いことが判明しました。 満年齢の場合も同じです。満年齢をもとにして平均年齢が32.1歳になったとき、「この段階」では32歳0ヶ月も32歳11ヶ月も32歳として扱われます(切り捨てた値の測定)から、32歳11ヶ月は「平均よりも年下」です。ただし、誕生日が一様に散らばっていると仮定した場合(より細かい測定の代わりに計算を行う)、「どうやら32歳7ヶ月1週間あたりがより細かい平均であるという蓋然性が高そうだ」となり、そこまで考えて「初めて」、「32歳11ヶ月は平均32.1歳より年上と考えるのが妥当かな」と言えるわけです(その意味ではNo.8の最後の段落は不正確でした。お詫びします)。 >測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか? おっしゃるとおりです。サンプルが多数で一様な場合、確かに妥当性は存在すると思います。しかし、それを主張なさるなら、同時に「そのような細かい分析は予定されていない」という調査段階でのルールも受け入れてください。整数単位での調査なら整数単位で分析されるのです。No.12でも言われていますが、その下の単位の分析をしたいなら別のルールを導入する必要があり、「いきなり」「切り捨て平均32は実質32.5が妥当」とは、たとえそれが正解でも、最初のルールに存在していない以上言えません。なぜなら、そこでルールを飛び越してしまうと、0.01℃まで測れる温度計を持った人が現れて、「このビーカーは6.75℃だ」と言い、再計算の果てに0.001℃まで測れる人が現れ……と、下の単位へと際限なく広がっていくことを許してしまうからです。 調査には定められた単位のラインがあり、分析はそれにそって行う。そうであることと、質問者さまのおっしゃる「妥当」は別の次元に存在する、ということです。
補足
デジタル温度計の例で言えば「4.0℃」と表示されるのは4.0℃~4.99…℃の場合 ですから、階級値で言えば4.5℃になるのではないのでしょうか? 機械がするのよりも精密な作業をする職人がいるそうですが、 もし、そんな職人が、このデジタル温度計を使って仕事をする時には、 「このデジタル温度計は他の温度計より0.5℃低めに出る」と思いながら作業をするでしょう。 切捨ては四捨五入以上に真の値から遠ざかる蓋然性が高く“一般的”ではないからです。 「切捨てで表示される温度計」とは言わば「平均して-0.5℃低めに出る温度計」なわけであり その温度計で測定した結果の単純平均を何の補正も無しに発表するわけです。 それでも「これは切捨てをする温度計で測定しました」と併記されているなら構いません。 しかし切捨てであることを併記しないで「平均が6.25℃だった」と発表することは、 悪意に捉えれば、わざと約0.5℃低めに発表した、とも受け取れます。 さて、ここで私が本当に質問したいことなのですが、一般にTVや新聞での記事には、 満年齢で回答させたか、何歳何ヶ月まで回答させたかは明記されていません。 明記が無いことによって0.5の誤解を生むかもしれないのに、です。 以前に回答いただいた中に「年齢を偽って答える人がいるかもしれない」とありましたが それは私が問題にしていることより、影響は小さいと思います。なぜなら、 1歳マイナスして回答する人と同じくらい1歳プラスして回答する人もいるだろうと 推測できるからです。それに調査時に気をつければ減らすことはできるでしょう。 しかし満年齢であることが明記されずに発表される可能性が高いにもかかわらず 満年齢で回答させるのは「全員が平均して-0.5歳偽って回答する」のと同じなわけです。 「TV局や新聞社がどうやって発表するかまで、統計する側では制御できない」と 言うのであれば、統計する段階で何らかの配慮(0.5をプラスするなど)を 行うべきなのではないかと思うのですが、どうやっているのでしょうか? というのが、私の質問の趣旨です。 こういう回答でも構わないのですが、これは正しいでしょうか? 「一般に、満年齢で調査した時は平均年齢を小数で表し、 何歳何ヶ月まで回答させた時は平均年齢も何歳何ヶ月という形で表す。 後者の形式で表記したいなら、前者の値に0.5を足してから行うべきである。」
- proto
- ベストアンサー率47% (366/775)
>ちょうど平均年齢(満年齢を単純平均したもの)が32.1歳になるような9人の集団を考える。 >ここに32歳11ヶ月のAさんが入り込み10人の集団を作る。 >この集団を生年月日の古い順に5人ずつにわけ、年寄り組と、若者組に分けたとする。 >このとき、Aさんが年寄り組にいる確率と、若者組にいる確率はどちらが大きいか? 満年齢で考えるという前提が置かれているならば、Aさんの年齢は32歳であってそれ以外ではあり得ないと思うんですが。 数学的に統計的にn歳mヶ月をn歳と扱うと決めてしまえば、比較するときにもn歳mヶ月をn歳としか扱えないんだから月まで考慮しての比較は出来ないと思います。 (平均の小数部まで考慮することは出来ますが、これは月とは別の考えですから) 32歳1ヶ月と32歳11ヶ月の二人でも、上の決まりに従って32歳と32歳の二人としてしまえば区別は出来ないし同い年でしかあり得ないと思います。 年齢を尋ねる際に月を考えないんだったら、0歳10ヶ月年上だと主張することには意味はありません、それは0歳年上だと言っているのと変わりません。 このことは月まで考慮するとか、四捨五入した年齢を考えるとか、別のルールにしてしまえばまた話は違ってくるでしょう。
補足
統計作業は「満年齢で考える前提が置かれている」ではなく「満年齢までしか回答させていない」ということではないのでしょうか? 言わば「切捨てした値でしか表示できない測定器」のようなものであり 測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか?
4度目、登場させていただきます。 >そうなると「平均年齢32.1歳」の場合、32歳11ヶ月の人も「まだ平均より年下」ということになるでしょうか? >「調査された人は全て○歳11ヶ月である」というならまだしも「誕生日の分布は一様である」という仮定は不自然な仮定ではないと思うのですが、その仮定に基づくと「平均より年上」となってしまいます。なぜこのような結論の不一致が起こってしまうのでしょうか? 分かった!(ほんとかよ) 質問者様は、この平均32.x歳を「32歳を少し超えた『年齢である状態』」と見なしているのではないですか?(そう取ると再質問が腑に落ちるのです) そうではないんです。調査を整数としているこの場合、たとえば32.1歳という平均は、「平均値に近い整数でもって『互いに素』になるまで均していくと、最終的に32歳が9人と33歳が1人の集団ができる」ということです。32.5歳なら最終的に32歳と33歳が1人ずつ。32.8歳なら最終的に32歳1人と33歳4人です。 最初に戻りますが、32.5歳が32歳6ヵ月を意味しないのはそういうことなんです。 さらにこれでどうでしょう。平均32.1歳というのは、「究極的」には「32歳が9人、33歳が1人の集団」であり、しかも「彼らの誕生日はランダム」なのです(*)。その上、彼らは自分の年齢を申告するときに満年齢でやっており、さらにみんな月齢は気にしていません(満年齢で調査して月齢を切り捨てるとはそういうことです)。 この条件下において32歳11ヵ月の人が集団を見回します。すると、「同い年」が自分も含め9人いて、「1つ上」が1人いる。結果、「俺(わたし)は平均値32.1歳には届いていない!」となるではないですか(**)。 この状態が拡大していったものが、「調査で得られた平均32.1歳なのです。前提段階で差異を持たせていないから、32歳11ヵ月と32歳0ヵ月は等価値であり、32歳11ヵ月も平均(32.1歳)より若いのです(***)。 これ以上の説明を思い浮かぶ自信がないです(笑)。 いかがでしょう。 ――――――――――― (*)これだと偏りが大きいですが、それは「究極的に縮めてしまった」からです。本来は母数が大きいので偏りはないはずです。もちろん結果はおなじです。 (**)重ね重ね申し上げますが、ここで、「でもあんた32歳11ヵ月だよね」というのは反則です。この集団は満年齢で集めた集団であり、月齢は無視するという「前提」(質問者様のおっしゃる前提)があるのですから。前提にないものを結論部でだけ持ち出してはなりません。 (***)それでもなお32歳11ヵ月が平均より若いかどうかを確かめたければ、「満年齢で集めた平均32.1歳の集団は、誕生日分布に従えば平均何歳何ヶ月に該当するか」を計算し、その数値と較べるしかないでしょう。これは「下位の単位」を付け加える作業であり、前提の変更になります(満年齢で答えるのが一般的→月齢で答える)。しかし調査したあとに前提を変えるなら最初からその前提(月齢)で調査すればいい、というのがNo.8の後半部分の趣旨です(たぶんNo.7のかたの温度計の話もそうではないでしょうか)。 ―――――――――――― ところで、「月齢」という言葉を本来の用法とはかけ離れて使ってしまいましたが、「満年齢」と対比させる言葉が欲しかったためです。ツッコミはなしでお願いします(笑)。
補足
こういう議論だったらいかがでしょうか? ちょうど平均年齢(満年齢を単純平均したもの)が32.1歳になるような9人の集団を考える。 ここに32歳11ヶ月のAさんが入り込み10人の集団を作る。 この集団を生年月日の古い順に5人ずつにわけ、年寄り組と、若者組に分けたとする。 このとき、Aさんが年寄り組にいる確率と、若者組にいる確率はどちらが大きいか? あくまで確率の問題ですが、0.5を加えたものと比較する方が良い結果を生むような気がするのですが、いかがでしょうか?
>「結婚年齢は32.5歳」は「結婚平均年齢32.5歳」の誤りですが、それでも回答に違いはでないでしょうか? はい、おなじです。私も平均年齢32.5歳と捉えていました。 >この比較の計算手順を説明していただけないでしょうか? 計算と言うより考え方ですね。説明が難しい……。箇条書きにすると、こうかな。 ・調査の段階で、32歳0ヶ月も32歳11ヶ月も「32歳」とする(32歳Xヶ月=32歳)。 ・よって、平均値32.5歳は「32歳ならそれより低く、33歳ならそれより高い」という「目安」を示す(32歳「6ヶ月」という下位の単位を含意するわけではない)。 ・32<32.5<33(ただし、年齢は小数点以下を持ち得ない) ・最初のとおり、32歳Xヶ月=32歳なので、Xがいくつであろうとも彼(女)は平均値より若い。 ・誕生日を迎えると(概念の話なので、この年齢変化は調査結果に影響を及ぼさないとしてください)32歳Xヶ月→33歳Xヶ月になる。 ・32<32.5<33なので、33歳Xヶ月は平均値より若くない。 どうでしょうか。質問者さまが何に引っかかっているのか、何となくは分かるのですが、その部分をどうもうまく説明できません。くどすぎて失礼な部分があったらお詫びします。 あるいは、極端に「月齢なんて存在しない! 32の次は33だ!」といちど割り切ってしまった方が話は早いのかもしれません。
補足
何度も回答ありがとうございます。 そうなると「平均年齢32.1歳」の場合、32歳11ヶ月の人も「まだ平均より年下」ということになるでしょうか? 「調査された人は全て○歳11ヶ月である」というならまだしも 「誕生日の分布は一様である」という仮定は不自然な仮定ではないと思うのですが、 その仮定に基づくと「平均より年上」となってしまいます。 なぜこのような結論の不一致が起こってしまうのでしょうか?
No.8です。 >満年齢で回答させた場合に平均年齢が32.5歳だったとき、何歳何ヶ月何日かまで回答させると平均年齢(月齢)が32歳6ヶ月になる(近い)という意味でしょうか? すみません、自分でも送ってからバカだなと気づきました。ミスです。近づくわけがないですね。最初のご質問文にある、 1.「自分の年齢は33歳」と答えた集団の平均年齢は約33.5歳 というのが頭に残っていて、「誕生日が一様ならば、33歳の集団を月齢調査すれば平均33歳6ヶ月になりうる」というのは納得できるなと思っていたことが変な形で表出してしまいました。、その部分の具体的な数字は撤回します。言いたかったことはこんな感じです。 ある母集団において年齢だけを聞いたときに出てくる平均値は1つだけ(32.5歳としましょう)で、月齢まで聞いたときの平均値も1つだけ(33歳0.0ヶ月とします)ですよね。誕生日が一様で母集団が十分ならば、両者は近づいて、32.5歳(年齢調査)≒33歳0.0ヶ月(月齢調査)とは言えるでしょうが、その比較は計算の結果論であって、最初から意味として組み込まれているものではない、ということです。 >>しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。 >これはアンケートに回答してくれた人でなく母集団の誕生日分布を使うのが本来ではないのでしょうか? それとも母集団の誕生日分布は、代用でしかないのでしょうか? わかりにくかったかもしれませんね。これは実際にそうするかではなく、考え方の問題です。先の回答文「誕生日が一様に散らばっているという仮定の下」の部分を「誕生日分布をもとにして」と変えていただいても私の言いたいことは同じです。 最終的に…… >例えば学校で「テストの平均点は32.5点」と言われたとして、33点をとった生徒は一応ほっとできます。 に対してです。まず質問者さまご自身が「調査には満年齢で答えている(月齢を切り捨てている)」という前提を置いていらっしゃいますので、そこは動かしません。 ですので調査に対する回答は30歳、31歳、32歳……と返ってきます。中間はありません。その平均を求めてみたら、「結婚年齢32.5歳」と出た。ポイントは、先に書いたように調査の段階で中間がないことです。となれば結果にも中間を求められません。その結果を見て感想を持つ人もまた30歳、31歳、32歳……でしかないわけです。 よって、 >「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか? に関しては、自分が32歳0ヶ月だろうと32歳11ヶ月だろうと「まだ平均より若い」と理解することができます。そして33歳の誕生日を迎えた瞬間、「もう平均より若くない」に変わります。「中間はない」のです。
補足
>>「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか? すみません「結婚年齢は32.5歳」は「結婚平均年齢32.5歳」の誤りですが、それでも回答に違いはでないでしょうか? >に関しては、自分が32歳0ヶ月だろうと32歳11ヶ月だろうと「まだ平均より若い」と理解することができます。 >そして33歳の誕生日を迎えた瞬間、「もう平均より若くない」に変わります。「中間はない」のです。 この比較の計算手順を説明していただけないでしょうか?
補足に対して (A)違います。「○○な人の平均年齢は32.5歳」は、32歳6ヶ月とイコールではありません。「歳」で調査されているなら、「場の最低単位」は「歳」です。 ですからこの場合、あくまで「全部足して総数で割った結果、小数点以下が現れた」ということです。それは単純に計算の結果ですので、下位の単位を示すものではありません。No.6のかたが「「小数年齢」自体を意味の中に入れてはいけません」とおっしゃるのはそういうことでしょう。 誕生日が一様に散らばっていると仮定すれば、確かに32.5歳と32歳6ヶ月は近づくでしょう。しかしそれは結果論です。計算する前は存在しなかった概念を、計算結果の時にだけ組み入れるのは不合理です。 (C)ということで、誤りとなるでしょう。32歳8ヶ月の男性も、調査対象であれば32歳です。調査はそこから始まっているのに、結果の時だけ8ヶ月を足すのは感心できる態度とは言えません。ですから「平均より年下」です。 このずれは、始まりと終わりで単位を変えているからと言えます。始まりが「歳」なら、終わりも「歳」。終わりを「月」として扱いたいなら、始まりも「月」にしなければなりません。 だからこそ、No.7さまも「月まで考慮したいなら、そこまで細かく聞くか、調査の際に四捨五入した年齢を答えさせる」必要があるとおっしゃるのです。 (B)ですが誕生日が一様に散らばっているという仮定の下、ご自身で「32.5歳は実質33歳」と思うことはありかもしれません。しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。それはあまり意味のない行為かもしれません。 なぜなら、お気づきになられたかもしれませんが、ここでも(c)の答えは出てくるからです。「実質平均33歳0ヶ月」と「32歳8ヶ月」を比べれば、やっぱり32歳8ヶ月の方が年下になるのです。
補足
いくつか理解できない点があるので、質問させてください。 >誕生日が一様に散らばっていると仮定すれば、確かに32.5歳と32歳6ヶ月は近づくでしょう。 満年齢で回答させた場合に平均年齢が32.5歳だったとき、 何歳何ヶ月何日かまで回答させると平均年齢(月齢)が32歳6ヶ月になる(近い)という意味でしょうか? >しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。 これはアンケートに回答してくれた人でなく母集団の誕生日分布( http://wwwdbtk.mhlw.go.jp/toukei/data/012/2001/toukeihyou/0003958/t0067828/h021_002.html のようなもの)を使うのが本来ではないのでしょうか? それとも母集団の誕生日分布は、代用でしかないのでしょうか? 例えば学校で「テストの平均点は32.5点」と言われたとして、33点をとった生徒は一応ほっとできます。 同様な価値基準で考えた場合「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか? 「統計上の数であり何ら価値がない」では統計する意味すらないと思うのですが。
- proto
- ベストアンサー率47% (366/775)
もしも年齢を年までしか調査していないのに月まで考慮して考えたい、というような話ならば平均33歳を33.5歳と解釈するのもいいかもしれません。 しかし月まで考慮したいなら、そこまで細かく聞くか、調査の際に四捨五入した年齢を答えさせるなどの調査の段階での配慮が必要でしょう。 そこまで細かく考えなくてもokなら、切り捨てで統計処理するように割り切ってもかまわないことになります。 しかし調査で平均33歳と結果が出ても本当の平均(母集団平均)が33歳かどうかはわかりません、誤差がありますから。 本当の平均は32歳かもしれないし34歳かもしれません、どちらにしても多くの人を調査していれば標本平均から大きくはずれることは無いだろうと言うことです。 そういう意味でどちらもあまり変わらないと言ったのです。 例えば1.0℃単位でしか体温を測れない体温計を使っておいて後で36℃だの36.5℃だの言うより、最初から0.1℃単位まで測れる体温計を使った方が正確でしょう? >TVや新聞での統計調査は世論調査が多いと思いますが、年月日まで答えさせるのは個人情報保護の観点からして適当でないと思います。 これに関しては個人情報保護はあまり関係ありません。 統計で個人情報保護のためにすることはデータの取り方として「Aさん30歳、Bさん25歳、Cさん32歳…」とせずに「30歳が10人、31歳が12人、32歳が9人…」とすることです。 そうすれば結果を見てAさんの年齢を知ることは不可能になり個人情報が保護されます。 さらにデータの平均を取ってしまえば何人から調査したのかも直接にはわからなくなります。 例えば年収を調査する場合100万単位で聞くのはokだけど10万単位で聞くのはダメ、ということにはならないでしょう。 給与明細見せてくださいとか言い出せば別の意味でダメでしょうが。
補足
回答ありがとうございます。 私は統計を行う立場の人間ではなく、本当は新聞やTVで見かける統計について知りたいのです。 と言っても「それならTV局や新聞社に質問すれば?」という回答を私は期待していませんので、一般論としておうかがいしているのです。 >しかし調査で平均33歳と結果が出ても本当の平均(母集団平均)が33歳かどうかはわかりません、誤差がありますから。 どんな誤差のことを言われているのでしょうか? 「年齢を偽ったり誤ったりして答える人がいる」ということですか? それとも抽出によって得られた平均値と母集団の平均値の差のことですか? 後者であれば、多くの人を調査することによって誤差(の期待値)を1歳未満にできるのではないですか? >例えば1.0℃単位でしか体温を測れない体温計を使っておいて後で36℃だの36.5℃だの言うより、 >最初から0.1℃単位まで測れる体温計を使った方が正確でしょう? では「○○の平均年齢は32.5歳」などという報道を見かけた時に「平均年齢を小数まで発表している ということは何歳何ヶ月まで回答させているアンケートを実施したのだな」と思って良いのでしょうか? >これに関しては個人情報保護はあまり関係ありません。 もし仮に生年月日まで質問されるようなアンケートがあったら私は拒否すると思います。 拒否する人が多く出るようなアンケートが正確とは思えません。
- yanasawa
- ベストアンサー率20% (46/220)
1 「自分の年齢は33歳」と答えている人は、すべて「33歳」なので、平均は33歳。 2 32歳。 すべて満年齢の平均であり、求めた結果は満年齢です。小数が出たら、そのつど解釈せざるを得ないですが、その「少数年齢」自体を意味の中に入れてはいけません。
補足
回答ありがとうございます。 できたら補足質問させていただきたいのですが「○○な人の平均年齢は32.5歳」というニュースがあった場合 (A)「32.5歳」というのは満年齢ということですか。 (B)実際上は「33歳0日と同等」と考えてよいのでしょうが「33歳0日」は満年齢ではないということですね。 (C)それを聞いた32歳8ヶ月の男性が「俺は平均より年上」と思うのは誤りとなりますか。
- Ishiwara
- ベストアンサー率24% (462/1914)
数学は、もともと見解の相違があり得ない学問ですが、ときどき「暗黙の了解」の解釈によって見解が異なる場合があります。 しかし、ごく常識的に考えれば、アンケートの回答では、だれでも端数を切り捨てるでしょうから、あなたの提示した1も2も正しいと言えます。 ただし、表現には数学的でないところがあります。 「平均年齢は約33.5」は「推定母平均(母集団の平均の不偏推定値)は33.5」でなければなりません。「平均」という言葉は「データの平均」なのか「母集団の平均」なのかを明確にしなければなりません。またこの場合は、推定値に「約」をつけてはいけません。推定値が33.51であったことを他人に伝える際に「約33.5」と言うことは構いませんが。
補足
回答ありがとうございます。 「約」とつけたのは、364/365÷2ないし365/366÷2をほぼ0.5と見なしたい、という考えたからです。 後半の文には「約」をつけないのは中途半端でしたが。
- proto
- ベストアンサー率47% (366/775)
数学的な答えでは無いかもしれませんが、 統計処理において平均を取ることのメリットは、平均をとることで誤差が打ち消し合って、ばらつきが小さくなることです。 あるアンケートを採って、 「自分の年齢が30歳」と答えた人が50人、「自分の年齢が34歳」と答えた人が50人 だった場合、その平均は32歳か?32.5歳か?を考えます。 母集団全体を調べれば母集団平均がただ一つ求まります、 しかし全員ではなく無作為に一部の人を選んでアンケートなどして母集団平均を推測する場合、結局誤差を含んだ平均しかわかりません。 つまり先ほどの例の場合、本当の平均は32歳+誤差(または32.5歳+誤差)なんです。 ですから結局32歳でも32.5歳でもあまり変わらないと思います。 それに本当にそこまで厳密な話がしたいのであれば、 「あなたの年齢は何歳何ヶ月何日ですか?」と聞けば、それこそ正確に知ることが出来ます。
補足
TVや新聞で目にする統計調査においてどうしてるのか(0.5を足してるのか否か)を知りたいというのが、今回の質問のもともとの意図です。 そういう統計調査をしている人は統計学を学んでいるでしょうが、授業で年齢のような「切捨てされた値が回答されるデータ」の扱いを統計学の授業で習っているのだろうか?と思ったのです。 抽出した集団の人数から誤差の期待値を求めることができると思いますが、TVや新聞で目にする統計調査における誤差の期待値は、0.5の差が「あまり変わらない」ほどのものなのでしょうか。 TVや新聞での統計調査は世論調査が多いと思いますが、年月日まで答えさせるのは個人情報保護の観点からして適当でないと思います。
- 1
- 2
お礼
何度も回答ありがとうございました。 この質問をするまで、漠然と「満年齢である」とは思いながらも はっきりと「切捨てである」という認識をせずに記事を眺めてしまっており、 ある意味「数字の恐さ」を思い知りました。 例えば10万数千から10万に減っているだけなのに、グラフは10万以上の 部分だけを示して「激減している」などという印象をもたせるような 「悪どい」ものも見かけると、発表する側の良心を疑いたくなります。 次に何か新たな疑問が出て、締め切りの必要がでるまで、 締め切るのは保留にさせていただきたいと思います。