• ベストアンサー

度数分布表の階級幅の決め方

度数分布表を作成するときの「階級幅」の決め方についての質問です。 JIS規格には 「R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、その幅が5~20になるものを選ぶ。これが2通りになった場合、サンプル数が100以上のときに級幅の小さいほうを、99以下のときに級幅の大きいほうを用いる。」 とあるらしいのですが、いまいちよくわかりません。 サンプル数100個 R=6.4 の場合どのようになるのでしょうか? よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • noocyte
  • ベストアンサー率58% (171/291)
回答No.4

#1 です. > JIS 規格は > 『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を > 選びなさい (中略)』と言っていると考えてもいいんでしょうか? 要するに JIS 規格が言いたいのは, 「階級幅は10進数で切りのよい値にせよ」 ということですね.1,2,5 はどれも10の約数ですから. 階級幅を一般的に書くと,次のようになります. m × 10のn乗 (仮数部mは10の約数 (つまり1,2,5),指数部nは任意の整数) したがって,JIS 規格の要旨は次のようになるでしょう. ・階級幅は10進数で切りのよい値にする. ・階級数が 5~20 の範囲内に収まるようにする. (この5と20も10進数で切りのよい値だ….) ・1つの階級に含まれるサンプル数があまり変動しないようにする. (サンプル数が多ければ階級幅を小さくし,少なければ大きくして 変動を抑える.) >(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』 「問題外」というと語弊があると思いますが.(笑) 今回の場合は JIS の基準に照らして「範囲外」ですね. ■余談 JIS Z 9041-1 は10進法が前提となっていますが,それ以外の場合の規格は ないんでしょうか? 例えばコンピュータがらみの統計だったら2進法ベースの方が都合がいいですし. その場合,mは常に1だから,階級幅は2の冪乗ということになりますね.

sisuado
質問者

お礼

何度もありがとうございます。 >JIS 規格の要旨は次のようになるでしょう. とてもわかりやすいです!

その他の回答 (3)

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.3

#2です。 級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと 思いますよ。それを表現で表したのが 『1,2,5(または10,20,50や0.1,0.2,0.5など)』なのでしょう。 ・・・0.01,0.02,0.05,0.1,0.2,0.5,1,2,5,10,20,50,・・・ これらから分類数が5-20になるものを選びなさいと言っているのではないですか。 で、2つ候補が出たときは、サンプル数が多い時は分類数が多いほう(幅が狭い方)を、 サンプル数が少ない時は分類数が少ない方(=幅が広い方)を選べと言ってますね。

sisuado
質問者

お礼

何度もありがとうございます。 >級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと 思いますよ。 私が#1さんに言いたかったことです!!ありがとうございます。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

#1さんが言われる通りでしょう。 JIS Z 9041-1:1999 5.2.2 a) 2)級幅の決定 最小値と最大値を含む級を5~20の等間隔の級に分けるように区間の幅を決める。 級幅はRを1,2,5(又は10,20,50;0.1,0.2,0.5など)で除し、その値が5~20に なるものを選ぶ。これが・・・以下省略。 要は5~20個に分割して集計できるように幅を決定せよと言うことですね。 測定値が幾つだったかは書いてませんが、例えば0.7-7.1だったのなら 0.5-1未満,1-1.5未満,・・・,7-7.5未満 と分ければいいのではいいのではないですか。

sisuado
質問者

お礼

回答ありがとうございました。 正しいJIS規格を教えていただきありがとうございました。

  • noocyte
  • ベストアンサー率58% (171/291)
回答No.1

> R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、 > その幅が5~20になるものを選ぶ。 この「幅が5~20」という部分は「階級数が5~20」の間違いではないでしょうか? 何の度数分布かにより,レンジの値はオーダーさえ異なってくると思うのですが. 例えば「人の体重分布」と「リンゴの重さの分布」では全然桁が違います. さらに「釣った魚の体長分布」となると,桁どころか物理的次元も異なります. 以下,「階級数が5~20」という前提で書きます. 階級幅を Wc,階級数を Nc とすると, 5 ≦ Nc = R / Wc ≦ 20 ∴ R / 20 ≦ Wc = R / Nc ≦ R / 5 R = 6.4 なので 0.32 ≦ Wc ≦ 1.28 Wc の取り得る値は > 1,2,5(または10,20,50や0.1,0.2,0.5など) だから,Wc=0.5 または Wc=1.0. サンプル数が100だから,階級幅の小さい Wc=0.5 の方を選ぶことになります. もし「幅が5~20」が正しいとすると,上の計算で Nc と Wc を入れ替えて, 0.32 ≦ Nc ≦ 1.28 したがって Nc=1 (したがって Wc=6.4) となり,度数分布表を作る意味がなくなります. 度数分布にも JIS 規格があるというのは初めて知りました. 丁度今,画像処理でヒストグラムを扱っているので私も勉強になりました.

sisuado
質問者

補足

回答ありがとうございました。 noocyteさんにうまく伝わるかわかりませんが JIS 規格は 『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を選びなさい(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』 と言っていると考えてもいいんでしょうか?

関連するQ&A