※ ChatGPTを利用し、要約された質問です(原文:3変量のデータから,2変量の線形関係を抽出する方法について)
3変量のデータから2変量の線形関係を抽出する方法とは?
このQ&Aのポイント
私は工学系の大学院生で、統計を活用したい場面に出会いました。
変量a, b, cに関するデータが手元にあり、aが一定の場合、bとcには線形関係があり、その傾きαがaに依存せず一定あることが分かっています。
しかし、データは現実のものなので誤差を含み、aが全く等しい2つの要素は存在しません。このような問題に統計的手法を適用してαを推定する方法はありますか?
3変量のデータから,2変量の線形関係を抽出する方法について
私は工学系の大学院生で,研究上,統計を活用したい場面に出会いました。しかし,私の知識では有効な方法が見つからないので,問題を一般化して質問させて頂きたいと思います。よろしくお願い致します。
まず,変量a, b, cに関する,ある数のデータが手元にあります。イメージとしては,次のような感じです。
a, b, c
145, 77, 36
98, 86, 23
121, 64, 52
…, …, …
理論的には,aが一定の場合,bとcには線形関係があり,その傾きαがaに依存せず一定あることが分かっています。目標は,手元にあるデータからこのαを推定することです。ただし,データは現実のものなので誤差を含み,aが全く等しい2つの要素は存在しません。
このような問題に適用できる,統計的手法はありますでしょうか?
確認のため,上記の変数間の関係を式で書くと,実数a,b,c,αおよび実関数β(a)について,
c = α×b + β(a)
となります。
これまでに試みた方法は,aがほぼ等しい要素を集めてきて,bとcの単回帰分析を行うというものです。実際にaがほぼ等しい要素を集めれば,bとcの間に一見良さそうな相関が得られました。しかし,「ほぼ等しい」の判断は感覚的なもので,数学的な裏づけがありません。従ってこの方法は客観的とは言えないと思います。
以上,よろしくお願い申し上げます。
お礼
先日はご回答を頂きありがとうございました。 質問者の私が書いた上記の「補足」についてですが,その後考えた結果,重回帰分析でαを求めるのは難しいのではないかという結論に至りました。 重回帰分析は平面のあてはめで,上記の場合ですとβ(a)に関する情報がないので,c = α×b + β(a)という関係が成り立ったとしても,データ次第であらゆる平面のあてはめ(重回帰分析)が可能となってしまいます。αもあらゆる値を取る可能性があります。 「補足」に記した実験で正しいαの推定値が得られたのは,βに連続関数を用いていたためかと思います。私の場合にも,βは完全に不連続というわけではないので,連続性を仮定した場合にどのような手法が可能になるか,考えてみたいと思います(仕切りなおして質問させて頂く予定です)。 いずれにせよ,今回頂いた回答は大変示唆に富み,私の考察を前進させてkるえました。どうもありがとうございました。
補足
早速ご回答を頂きありがとうございます。 大変参考になっております。 > β(a)という関数の理論式or予想される関係などはありますか? 残念ながら,β(a)に関してはaの非線形関数で,b,cに依存しないという性質以外未知です。 > もし、本当に > c = α×b + β(a) > の関係があるなら、上の回帰式ででてくる係数αは、下の関係式のαと> 等しくなるはずです。 これが使えれば,とても嬉しく思います。 確認のため,架空のαの値およびβの関数形を設定し,a, bの分布を乱数で与え,cを計算して,cをa,bで説明する重回帰分析をしてみました。30ケースくらい実験した結果,多くのケースで,確かに設定した値に近いαの値が得られました(βの関数形が悪く,a,b,cの値のオーダーが等しくなくなってしまったケースでは誤差の大きい値が得られましたが,これは当然のことと思います)。 この実験でβ(a)は,たとえばCos(a+99)*Log(a)などの,振動が大きく非線形性の強い関数形を与えています。またa, bの分布も,一様乱数ばかりでなく,偏った分布も用いてみました。 それにも関わらず,αに関して正しい推定値が得られることに,とても驚き,また喜んでおります。 恐縮なのですが,どうして多重回帰でαの推定値が得られるのか,もしよろしければ,ご教授頂ければ幸いです。