• 締切済み

離散データのときの四分位数の定義についてです。

離散データのときの四分位数の定義についてです。 例えば第1四分位数(Q1とします)を例にとると、本によっては、 「下から25%のところにQ1をとる」と書いてある本もあれば 「~Q1、Q1~中央値(M)、M~第3四分位数(Q3)、Q3~に同じだけデータがあるようにQ1をとる」 と書いてある本もあります。 下の定義はQ1、M、Q3を「含んで」分けるかどうかで議論が分かれる、ということは分かりますが、 そこを置いておいて、純粋に上の2つの定義だけで比較すると、本質的な違いはあるのでしょうか? 例えば、何かが変わってくるとか。。。お願いします。

みんなの回答

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

参照URLを見ていただければ、分位点の定義が何通りかあることが分かると思います。計算方式によって分位点の数値が変わりますので、数値が違うと言うのが本質的であるというのなら、本質的な違いはあることになります。例えばエクセルとSASのデフォルトでは計算方式が違うので、四分位点が一致しないことがあります。

参考URL:
http://support.sas.com/documentation/cdl/en/procstat/63104/HTML/default/procstat_univariate_sect028.htm
Shauetsu
質問者

補足

私のいう定義とは「計算方法」ではなく「四分位数とはなんぞや」という意味なんです。 「数値が違う」というのが私が聞きたい「本質的」ではなく、質問に載せた2つの定義の「意味が違ってくるのか」ということです。よろしければお願いします。

関連するQ&A