• 締切済み

トリム平均の良いやり方

教えてください。 外れ値を除いて平均値を出したいとき、トリム平均(あるいは中央平均)というものがあると思います。 このとき、トリムが10%だったり、20%だったりするのは恣意的な基準だと思ってしまいます。 そこで、標準偏差2つ、または3つ以上外れた数字を外れ値として定義し、外れ値を取り除いて再度平均値を求めることであるグループの数値的な特徴を把握しようとしていますが、これについて、良い方法だと思いますか? また、ほかの方法で、恣意的ではない平均値の求め方がありましたら、何か教えて頂けますでしょうか。 よろしくお願いします。

みんなの回答

回答No.2

  >3シグマを外れた数値は経験論的にも『稀な事象』と認識されるようです そうですよ そうなら、稀な物を除外すると言う事は「なにも除外しない」のと同じ。 感覚的に理解できない人が多い標準偏差とかシグマを出して胡麻化してるだけでしょ。

YKANAJAN
質問者

お礼

回答ありがとうございます。 稀な物を除外すると言う事は「なにも除外しない」のと同じ、確かに言われてみればそんな気がしてきました。 シグマによって除外することに正当性があるならば、正規分布しているという前提に立っているということであり、正規分布しているなら別にシグマを使って外れ値を定義する必要がない気がしてきました。 ところで、別の方法を考えるとして、どのような方法ならば恣意的ではない平均値を出せると思いますか?

回答No.1

  >標準偏差2つ、または3つ以上外れた数字を外れ・・・ 2σは約95%なのでトリム5%と同じ 3σは約99.7%なのでトリム0.3%と同じ こうなりませんか?  

YKANAJAN
質問者

お礼

まあ数字で示すと同じような感じになりますが、シグマ(標準偏差)を使うとより恣意性が薄くなるような気がしているのです。 3シグマを外れた数値は経験論的にも『稀な事象』と認識されるようです。 以下引用ですが、 『経験論的には、いわゆる「3シグマのルール」や「千三ツの法則」と呼ばれるものであり、ほぼすべての値が平均の3標準偏差以内にあるという従来のヒューリスティックを表している』 https://ja.wikipedia.org/wiki/68–95–99.7則

関連するQ&A