- ベストアンサー
Logをとる意味は?
2変数の関係(散布図など)を調べる時、よくLogをとり計算しています。統計の分野で正規性のないデータのLogをとり、無理やり正規化して統計手法を使う・・このような方法で統計計算を行っても良いのでしょうか?結構多用してるのですが、いまいち自信が持てません。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
なんの根拠もなくlogをとっても仕方ないです。 logをとって正規分布になるってことは、もとの分布は対数正規分布にしたがっているってことですね。そう言える根拠があるのであればOKです。 実際上は、その確率変数が下のような条件に当てはまってればOKです。 ある確率変数Xが対数正規分布に従うためには、大数の法則によれば、 ・確率変数Xは、たくさんの小さい要素の和としてあらわされるものである。 ・個々の小さい要素の大きさが、その時点での和Xに比例する という条件が必要です。(他の可能性もないとは言えないが、実際の統計解析ででてくる対数席分布はまず間違いなく、この仕組みで生じている) 例えば、ある国に住んでいる人の財産の分布は対数正規分布になると言われていますね。(貧乏な多数の人と、超お金持ちの極小数の人) 財産てのは、その人がそれまでにしたたくさんの小さな仕事の報酬の和なわけです。 で、個々の小さな仕事の報酬ってのが、その時点での財産に比例する、つまり 「金は金持ちのところに集まる」 が正しいならば上の条件を満たし、財産の分布が対数正規分布になります。これは、実際に言えそうな気がしますね。
お礼
ご回答ありがとうございました。 分布が対数正規分布で、ある一点の確率が、 それまでの過程や経験の和に影響している と考えられる場合にLogをとっても良い・・ というイメージでよろしいですか? 今まで根拠なく使っていたのですが、少し 自信がでてきました。