- ベストアンサー
標準化とは?
標準化というと、平均を0、標準偏差1とする と説明されています。 そして正規分布にしたがって計算することを学んでいます。 例えば平均170センチであれば 185-170、それをσで割る公式があります。 平均を0とするのに170で引く行為は理解できます。 しかしそこから導いた値15をσで割るということがどうしても理解できません。 割るという行為は 1あたりの平均を出す と理解していますが・・・・ σで割るということがしっくりきません。 どなたか宜しくお願い致します。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
> 割るという行為は 1あたりの平均を出す と理解していますが・・・・ 計算は、「意味」で考えちゃ駄目です。 恣意的な解釈は、誤解や混乱のもとにしかなりません。 定義を確認して、淡々と計算しましょう。 正規分布 N(μ,σ^2) の定義は、確率密度関数が ( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) ) であることです。確率変数 X が、この確率密度を持つとき、 計算してみると、X の平均は μ、標準偏差は σ になります。 そのような X に対して、Z = (X-μ)/σ と置くと、 Z は確率密度関数 ( 1/√(2π) )・e^( -x^2 / 2 ) を持つ確率変数になります。 つまり、Z は正規分布 N(0,1) に従う訳です。 N(0,1) のことを「標準正規分布」と呼ぶのでした。 単純な変数変換の話です。 解釈論や哲学論の出番はありません。
その他の回答 (4)
#3,4さんの言うように、淡々とやるのが安全ですが、それを前提にするなら、#2さんへの補足をしても良いかなと思いました。 工学系では、標準化と正規化はけっこうごっちゃにして使われます。σで割るのは、(数学で厳密に定義されたものではない)正規化の考えの一種とも考えられます。 例えば全然別の物理機構による現象の測定値頻度が、けっこう似てると感じるなんて事があります。そういう場合、生の度数分布を使用してると比較しにくいですが、平均シフトした測定値をσで割って「無次元化する」というのは、一つの手です。 その結果、度数分布が本当に似ていたら、物理機構に関わらない数学的理屈が成り立ってるのではないか?、などと疑います。要は無次元化すると、見やすく(比較しやすく)なる、という事です。 一番身近な例は、相対誤差です。なぜ相対誤差で語るかを考えれば、正規化の意味はわかるはずです。 上記は単純な考えだけに、適用範囲は広いです。 無次元化ではないですが、「単位当たりの」で定義される、ヤング率や電気低効率などはみな、上記の発想で考えられた物質定数です。
- alice_44
- ベストアンサー率44% (2109/4759)
確率密度関数の変換も、書いときましょうか。 Z = (X-μ)/σ (ただしσ>0) と置くと、 X ≦ t は Z ≦ (t-μ)/σ と同値ですから、その確率について Prob(X ≦ t) = Prob(Z ≦ (t-μ)/σ) が成り立ちます。 X が正規分布 N(μ,σ^2) に従うなら、 Prob(X ≦ t) = ∫[-∞,t]( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) )dx. Z の確率密度関数を f(z) と置くと、 Prob(Z ≦ (t-μ)/σ) = ∫[-∞,(t-μ)/σ]f(z)dz. ∫[-∞,(t-μ)/σ]f(z)dz = ∫[-∞,t]( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) )dx の両辺を t で微分すると、 f( (t-μ)/σ )/σ = ( 1/√(2πσ^2) )・e^( -(t-μ)^2 / (2σ^2) ). 両辺を σ 倍して、変数を w = (t-μ)/σ で書き換えると、 f( w ) = ( 1/√(2π) )・e^( -w^2 / 2 ). この式は、f が標準正規分布 N(0,1) の確率密度関数 であることを示しています。
- 中村 拓男(@tknakamuri)
- ベストアンサー率35% (674/1896)
>例えば平均170センチであれば >185-170、それをσで割る公式があります。 個々のデータに対してこの処置を行い、平均と 標準偏差を求めたらどうなるのかを考えてみる べきでしょう。
- info22_
- ベストアンサー率67% (2650/3922)
>しかしそこから導いた値15をσで割るということがどうしても理解できません。 >割るという行為は 1あたりの平均を出す と理解していますが・・・・ >σで割るということがしっくりきません。 標準偏差1の分布に換算する為です。 平均を出すためではありません。 標準偏差を1にして、平均をゼロの分布に変換すれば、標準正規分布表が利用できます。
お礼
ご回答ありがとうございます。すいません結局よくわかりませんでした。 もう一度改めて質問させていただきます。失礼いたしました。