※ ChatGPTを利用し、要約された質問です(原文:数値データの正規化)
数値データの正規化とは?正規化された数値と偏差値の関係について
このQ&Aのポイント
数値データを統計的に処理する際には、まず標準偏差を求めます。そして、更なる解析をするためには、数値を正規化し比較する必要があります。
正規化された数値は、平均値が0で、標準偏差・分散が1に設定され、-1から+1の範囲に収まります。
しかし、正規化された数値が-1から+1の範囲の値しか取らない場合、偏差値も40から60の値しか示さないため、偏差値だけでは東大合格などの目標を達成することは難しいです。
ほぼ素人なのですが若い社員に教える必要があるので四苦八苦してます。どうぞ判りやすくお教えください。数値データを統計的に処理する場合標準偏差を求めますね。そして場合によっては、更に深く解析を進めるためにはそれを正規化し比較する作業がありますね。例えばこの正規化された数値は偏差値の計算にも使われます。偏差値=10u+50(uは正規化された数値) ここまでは間違ってないですね!
ここからが未だスッキリしない疑問です。正規化された数値はは平均値が0で、標準偏差・分散が1にあり-1~+1の範囲にある。と理解してましたが、どうも違う気がしてきてます。というのは正規化された数値が-1~+1の範囲の値しか取らないのであれば偏差値も40~60の値しか示さないことになります。「東大合格へは偏差値70あれば良い!」が説明できなくなります。多分、どこかで見た、あるいは教えていただいた「正規化された数値は-1~+1の範囲にある」が抜けきらないからスッキリしないと思うのですが、私は何処でどのように誤った理解をしたのかが気になって仕方ありません。「-1~+1の範囲」は誤りなので、割り切って頭の中を切り替えれば済むようですが・・・・・何方か私が誤った理解をするに至った経緯を推論していただけないでしょうか?気分をスッキリさせるだけの我が儘な質問ですがご親切な方、よろしくお願いします。
お礼
正規化の方法は「平均値を引いて標準偏差で割る」と思ってましたが、他の方法もあるんですね!おかげさまで知識の幅が拡がりました。正規化の範囲についてはスッキリしない部分が残りはしますが、ここは割り切って頭を切り換えることにします。ありがとうございました。