基準化したデータより得られた回帰式に新たな説明変数を代入する際の取り扱いについて
基準化したデータより得られた回帰式に新たな説明変数の数値を代入し、従属変数の数値を計算(予測)する際、その代入される説明変数も基準化されている必要があると思いますが、その基準化の方法はどのように行えばよいのでしょうか?
例えば、サンプル数10、従属変数1、説明変数4というデータセットがあり、全変数を基準化し回帰係数を求めたとします。
得られた回帰式を用い新しいデータの説明変数の数値を代入することにより説明変数の値を予測したいと思います。
この際、この新たなデータも基準化される必要があると思うのですが、基準化する際には回帰係数を求めるために用いた10個のサンプルより計算された各説明変数の平均及び標準偏差を用いて、基準化を行うのでしょうか?
具体的には10個のサンプルから計算された説明変数a,b,c,dの平均がそれぞれ2,4,6,8、及び標準偏差が10,20,30,40であったとします。
新たなデータの説明変数a,b,c,dの値が3,6,9,12であった場合は、それぞれ(3-2)/10, (6-4)/20, (9-6)/30, (12-8)/40の値を計算し、その数値を回帰式に代入するのでしょうか?
長くなってしまい申し訳ありませんが、どなたか詳しい方がいましたら是非教えていただきたくお願いします。
お礼
ようやく得心ががいきました。これがジェネリックプログラミングというものでしょうか。 なんだかc#は奥が深そうです。 匿名関数、LINQ、ラムダ式、・・・ また質問させてください。とても勉強になりました。ありがとうございます。