• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:代表値を選択する際の基準について)

代表値の選択基準と外れ値の影響について

このQ&Aのポイント
  • データ分析において代表値を選ぶ際の基準について説明します。
  • 中央値を代表値とする理由や、歪度などの数値的な基準についても解説します。
  • また、外れ値の存在が結果に与える影響も明らかにします。

質問者が選んだベストアンサー

  • ベストアンサー
  • vzb04330
  • ベストアンサー率74% (577/778)
回答No.1

はじめに確認しますが,データの尺度水準は,間隔尺度以上ですね? 間隔尺度以上の場合に,平均,中央値,最頻値のいずれも用いることができます. 質問の内容に関しては,絶対的な基準は存在しません(森・吉田,1990). また,他のデータに比べ,どの程度離れていれば,外れ値とみなすかについても明確な基準はありません(吉田,1998). したがって,どの代表値を用いるかや,どの個別データを外れ値とみなすかについては,主観的な判断に任されているといっても過言ではありません. ただし,南風原(2002)にあるように,次のように考えることはできると思います(南風原,2002,pp.17-27): 1.代表値の適切さの基準を明確に定義し,それを最大にする値を求めるというアプローチを基本的には,採用する. 2.データがN個あると仮定して,「代表値tと,そこに含まれるN個のデータとの近さ」という基準を,「tと各値との距離の絶対値の総和の小ささ」と解釈する,と考える. 3.このように考えると,その総和を最小にするtが,「データ全体に含まれる各値にもっとも近い」という基準を満たす,適切な代表値ということになる. なお,外れ値の存在が,測定ミスによるものではなく,正しく測定されたにもかかわらず,他のデータからは,相当はずれた値になったという前提で,この説明は成り立ちます. また,最近の統計書にはあまり書かれていないようですが,正規分布から外れた値と見なせるかどうかに関して,「棄却検定法」があります. 古い本ですが,岩原(1967)のp.135にその説明が,あります. 数式を記述するのが煩雑でしたので,文章で説明してみました. 文献リストを掲げておきますから,ご覧ください. 森敏昭・吉田寿夫(編著)(1990):心理学のためのデータ解析テクニカルブック.北大路書房. 吉田寿夫(1998):本当にわかりやすい すごく大切なことが書いてある ごく初歩の統計の本.北大路書房. 南風原朝和(2002):心理統計学の基礎-統合的理解のために-.有斐閣(有斐閣アルマ). 岩原信九郎(1967):増補版推計学による新教育統計法.日本文化科学社.

igamata
質問者

お礼

詳しいご回答ありがとうございます.絶対的な基準はないようですね.討論する際に代表値の選定やはずれ値の基準を聞かれますので,何かあればと思ったのですが・・・.ご紹介いただいた文献を読んでみて,再考してみます.ありがとうございました.

関連するQ&A