• ベストアンサー

度数分布表における~以下、~以上の扱いについて

統計の計算方法についてなのですが、たとえば度数分布表において以下のようになっていた時、 Aを持っている人の度数分布 3個以下 10人 4~8個 12人 8~12個 35人 12個以上 18人 平均を取りたい場合「~以下」「~以上」とされた度数は、 どのようにして結果に取り込めばいいのか分かりません。 もしかしたらAを持っている3個以下の人は全員が1個かもしれませんし3個かもしれませんので、 やはり、平均を取る際は無視して残りで平均を取るべきなのでしょうか? よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

「3個以下が10人」ならば、とりあえず代表値として1.5個を選び、そこに10人が集中しているとして処理します。 しかし、この場合は1つの区間内を完全に平等に扱うには疑問を感じますよね。多くの場合、区間幅は、処理結果(特に不偏分散)に影響を与えます。この問題を考えたのは、Yates(イェーツ)という人で、区間幅の影響を除きたい人のために、補正方法を提案しています。「Yatesの補正」で検索してみてください。 なお「8~12」と「12以上」は共存できません。「8~12」「12を超える」と分類してください。 また「12~∞」の代表値は、一般に指定できません。分布の「裾(すぞ)」であることが明瞭であれば「12+(直前の幅の半分)」でしょうが。

shi-110
質問者

お礼

9-13個、14個以上でした。すいません… 下限があれば代表で値を取るのですね。上限が無限だと外すべきですね。 区間の幅を変えても補正することができるのですか。 ご回答ありがとうございました。

その他の回答 (1)

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.1

それを言うなら、4~8個の12人だって、 全員が4個かもしれないし、全員が8個かもしれません。 各階級に適当な代表値を設定して、 その平均を取るしかないでしょう。

shi-110
質問者

お礼

なるほど…そうですよね。~以上とされている区間も収束していれば推定はできそうですが、 この場合は何とも言えませんね。たとえが悪かったかもしれません…スイマセン。 勉強になりました。ありがとうございました。

関連するQ&A