- ベストアンサー
度数分布表における~以下、~以上の扱いについて
統計の計算方法についてなのですが、たとえば度数分布表において以下のようになっていた時、 Aを持っている人の度数分布 3個以下 10人 4~8個 12人 8~12個 35人 12個以上 18人 平均を取りたい場合「~以下」「~以上」とされた度数は、 どのようにして結果に取り込めばいいのか分かりません。 もしかしたらAを持っている3個以下の人は全員が1個かもしれませんし3個かもしれませんので、 やはり、平均を取る際は無視して残りで平均を取るべきなのでしょうか? よろしくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
「3個以下が10人」ならば、とりあえず代表値として1.5個を選び、そこに10人が集中しているとして処理します。 しかし、この場合は1つの区間内を完全に平等に扱うには疑問を感じますよね。多くの場合、区間幅は、処理結果(特に不偏分散)に影響を与えます。この問題を考えたのは、Yates(イェーツ)という人で、区間幅の影響を除きたい人のために、補正方法を提案しています。「Yatesの補正」で検索してみてください。 なお「8~12」と「12以上」は共存できません。「8~12」「12を超える」と分類してください。 また「12~∞」の代表値は、一般に指定できません。分布の「裾(すぞ)」であることが明瞭であれば「12+(直前の幅の半分)」でしょうが。
その他の回答 (1)
- arrysthmia
- ベストアンサー率38% (442/1154)
それを言うなら、4~8個の12人だって、 全員が4個かもしれないし、全員が8個かもしれません。 各階級に適当な代表値を設定して、 その平均を取るしかないでしょう。
お礼
なるほど…そうですよね。~以上とされている区間も収束していれば推定はできそうですが、 この場合は何とも言えませんね。たとえが悪かったかもしれません…スイマセン。 勉強になりました。ありがとうございました。
お礼
9-13個、14個以上でした。すいません… 下限があれば代表で値を取るのですね。上限が無限だと外すべきですね。 区間の幅を変えても補正することができるのですか。 ご回答ありがとうございました。