- ベストアンサー
患者数推定
よろしくお願いします。 ある病気の患者数が性別毎に5歳階級別に発表されているとします。これから、総務省発表の年齢男女別一般人口を基に患者割合を算出します。さらに、この割合を用い、ある県の市町村毎の男女別5歳階級別人口表から市町村別推定患者数を割り出すことはできますか?? 分かりにくい質問ですみません。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
「その市町村の性・年齢別の患者発生割合が全国平均と同じ」とみなせるなら、その割合をその市町村の性・年齢別人口に乗じて、患者数を推計することができます。また、その誤差も、2項分布を使って見積もることができます。 ただ、患者発生割合は、その地域の生活習慣や遺伝子特性などに左右されることが考えられるので、上の仮定が妥当するかどうかは、慎重に考える必要があると思います。
その他の回答 (2)
- ramayana
- ベストアンサー率75% (215/285)
ご質問1「単純に発生率をある市町村の人口数に掛けてはいけないのですか?」 とんでもありません。そのように推計するのが自然だと思います。ANo.2の数式は、そういうことを書いたつもりだったのですが、分かりにくくてすみませんでした。 ご質問2「T検定などして、棄却できず『差がない』という結果を得てもそれは何の説得力を持ちませんか?」 どういう風にしてT検定するのか、ちょっと想像がつかないので、的外れかもしれませんが… そもそも、発生率を人口数にかけて推計するのは、全国と対象の市で(性・年齢階級別の)発生率に差がないことを前提にしているはずです。そういう前提があるにもかかわらず、発生率に差があるかどうかを検定しようとするのは、自己撞着のように見えます。その市の、(上のような推計値でなく)実際の観測値があって初めて検定が意味を持つのではないでしょうか。
- ramayana
- ベストアンサー率75% (215/285)
ANo.1です。 全国の性・年齢階級別患者数を全国の性・年齢階級別人口で割って、性・年齢階級別患者発生率を計算します。それで、第i区分の患者発生率をpiとします。例えば、性が2区分で年齢階級が10区分なら、iは、1から20までを動きます。 対象となっている市町村で、次の仮定が満たされるものとします。 (1)個々の人が患者であるかどうかは、独立である。 (2)i番目の性・年齢階級に属する個人が患者である確率は、piに等しい。 すると、その市町村のi番目の性・年齢階級における患者数は、2項分布に従います。すなわち、i番目の性・年齢階級の人口をni、その区分の患者数の期待値をxi、その区分の患者数の分散をsi^2とすれば、 xi = nipi si^2 = nipi(1 – pi) です。さらに、その市町村の総患者数の期待値をx、総患者数の分散をs^2とすれば、区分の数をkとして、次のようになります。 x = x1 + x2 + … + xk = n1p1 + n2p2 + … + nkpk s^2 = s1^2 + s2^2 + … + sk^2 = n1p1(1 – p1) + n2p2(1 – p2) + … + nkpk(1 – pk) このxでもって総患者数の推計値とするのが自然でしょう。また、普通は、総患者数の標準偏差(分散の平方根)でもって、誤差の尺度(「標準誤差」という)とするので、 標準誤差 = ( n1p1(1 – p1) + n2p2(1 – p2) + … + nkpk(1 – pk))^0.5 となります。 ただ、しつこいようですが、上の(1)(2)の仮定が満たされるかどうかは、別途判断する必要があります。
お礼
何度もご回答ありがとうございます。 難しいですね。これは、単純に発生率をある市町村の人口数に掛けてはいけないのですか?ダメだから、説明したんだろって言われそうですね。 ある市の推定の患者数と全国の実在の患者数をT検定などして、棄却できず「差がない」という結果を得てもそれは何の説得力を持ちませんか? 意味の分からないことを聞いていたらすみません。
お礼
早速のご回答ありがとうございます。 申し訳ありませんが、「また、その誤差も、2項分布を使って見積もることができます。」というところをもう少しご説明いただけると助かります。