※ ChatGPTを利用し、要約された質問です(原文:中心極限定理とパレート分布)
中心極限定理とパレート分布
このQ&Aのポイント
中心極限定理によると、パレート分布でもサンプリングを繰り返せば正規分布に近づく可能性があります。
所得の分布では、中央値の方が平均よりも事実に近い値を示すことがあります。しかし、期待値で計算することも有効な方法です。
統計学的には、期待値で計算する理由がなかったり、平均を使用することが一般的です。
(1)所得はパレート分布もしくは対数正規分布をすると言われていますが、パレート分布においても、中心極限定理があてはまり、サンプリングを繰り返した時、正規分布するのでしょうか?もし、正規分布をするのであっても、母集団がパレート分布するはずの所得に対して、中心極限定理から導かれた分散、σ/√nを利用して所得の平均の信頼区間を推測することに違和感を感じます。大学の授業で先生が計算していました。
(2)所得の分布では、平均を見るよりも中央値の方が事実に近い結果を示すと言われていますが、平均(Σx_i/n)ではなく、期待値(Σx_i*P(X=x_i))で計算する方が、高額所得者に対しても低確率で重みづけられて、平均で計算するよりも妥当な値が得られそうなのですが、インターネットでも期待値で計算している例はありませんでした。統計学的に、このような計算をしない理由があれば教えてください。
初学者なので、間違いがあれば指摘していただけると幸いです。
お礼
回答ありがとうございます。 理解できました。 与えられた式に数字を放り込むのではなく、 その数値が持つ意味をもっと考えないといけない、ということに気づかされました。 ありがとうございます。