- ベストアンサー
質的データの中央値の求め方
質的データの中央値の求め方を教えてください。 例えば、[2,4,3,2,2,1,3,5]の中央値は[2.5]ということはわかるのですが [b,d,c,b,b,a,c,e]の中央値だと何になるのでしょうか。 統計学はまったくの初心者です。 よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
[b,d,c,b,b,a,c,e] このデータは、名義尺度、つまり、順序づけができないカテゴリカリーデータであるので、分布の代表値としては、中央値ではなく、最頻値(モード、mode)を使用します。 最頻値は、文字通り、最も頻度の高い値です。 したがって、[b,d,c,b,b,a,c,e]の最頻値は、bとなります。 中央値は、データを昇順に並べたときに、ちょうど真ん中の位置にあるデータです。したがって、中央値を算出するためには、順序づけできるデータでないといけません。[順序尺度以上:順序尺度、間隔尺度、比例尺度] まずは、名義尺度、順序尺度、間隔尺度、比例尺度の4つの尺度の意味を理解するようにしましょう。
その他の回答 (2)
- Hurrypon
- ベストアンサー率44% (12/27)
回答No.3
[b,d,c,b,b,a,c,e]というデータの場合,カテゴリカルデータになるので中央値は出せません。最頻値は出せますが・・・ 中央値を出すためには,データが順序変数,間隔変数,比例変数(「変数」の部分は「尺度」と呼ばれることもあります)のいずれかでないと算出できません。今回のご質問の場合,データが「名義変数」なので中央値を算出できません。
- rabbit_cat
- ベストアンサー率40% (829/2062)
回答No.1
>[b,d,c,b,b,a,c,e]の中央値 陽に式として書きたいなら、a,b,c,d,eの大小関係について地道に場合分けするしかないです。
補足
ありがとうございます。 ということは、この場合の中央値を求めよというのは設問自体がおかしいということでしょうか?? 授業ではaからeを並べ替え、(ただし、a,b,c,d,eがどういうものであるかの説明はまったくありません)順序で分けることができると習ったような気がするのですが、それがどういうことなのかさっぱりわかりませんでした。 最頻値を書いて提出してみます。