- ベストアンサー
自然対数に変換する意味がわかりません
ある化学分析の本に、2組の時系列データについて、変動パターンの相関係数を求めるのに、移動平均との比(×100)を自然対数に変換して相関係数を求める、との説明がありました。こういう場合、自然対数に変換するのにどういう意味があるのでしょうか?
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
以下の記述は、厳密ではありません。大体の雰囲気という程度で読んでください。 時系列データを分析するときは、クロスセクションデータとは違った世界で考えることが多いのです。一番大きな違いは、次のことだと思います。 [1] クロスセクションデータでは、すべてのデータが同一の分布に従う確率変数からの実現値(見本)とみなされることが多い。 [2] 時系列データでは、各時点のデータは、それぞれ別の分布に従う確率変数からの実現値とみなされることが多い。 ただ、[2]の想定だけではあまりに漠然としすぎて分析になじまないので、普通、次の仮定を置きます。 [3] 時系列データでは、各時点のデータは、弱定常過程(単に「定常過程」と言うこともある)に従う確率過程からの実現値(見本過程)とみなされることが多い。 弱定常過程の意味は、他の参考書をみていただくとして、その重要な特性に次のことがあります。 [4] 各時点の分散は、時点に依存しない一定値である。 ここからが、本題です。もし、扱っているデータが次の性質を持っているように見えたとします。 [5] データの誤差あるいは分散が、データの値に比例する(例えば、10の値を持つデータの分散が1だったとすると、100の値を持つデータの分散は10になる)。 この[5]のような性質を持つデータは、現実によく見かけるタイプです。さらに、このデータが時間とともに傾向的に増加や減少しているときは、[4]の仮定と矛盾することになります。すると、このままでは弱定常過程にならないので、通常の時系列データの分析手法(相関分析を含む)がほとんど使えないことになってしまいます。 で、このような場合、よく使われるテクニックが、対数変換です。[5]のようなデータも、対数変換すれば、[4]と矛盾しなくなるからです。 よって、結論は、次のようになります。 [6] 時系列データを対数変換したほうが良いかどうかは、単に変動のレンジが大きいかどうかではなく、誤差or分散がデータの値に比例しているかどうかで判断する。
その他の回答 (4)
- alice_44
- ベストアンサー率44% (2109/4759)
相関係数というのは、 回帰直線のアテハマリ具合を測るモノサシです。 データのまま相関係数を求めれば、 Y = aX+b という近似を想定したことになります。 対数をとってから相関係数を求めれば、 log Y = a(log X)+b すなわち Y = cX^a という近似を想定して、 そのアテハマリ具合を評価したことになります。 どちらの近似曲線が適切かは、数学ではなく、 それぞれの応用分野(貴方の場合、化学)の問題です。
>時系列データ y(t)が dy(t)/dt = -a * y(t) aは定数 に従うときは その一般解は y(t)=y0 exp(-a * t) となる。 これを自然対数になおせば… 時定数 とか 反応速度 といった言葉を調べてみるといい。
お礼
ありがとうございます。 具体的には、#1さんへのお礼に書いたような場合のことです。そもそも、対数変換する必要があるのでしょうか。
- kamiyasiro
- ベストアンサー率54% (222/411)
ご質問者の意図は、「なぜ常用対数ではなくて自然対数なんですか」ということでは? 対数変換の意味は#1さんのとおりで、これは常識。 自然対数を求めるのは、元のピーク(液クロとかの)が 誤差関数にフィットでき、それがexpの式になっているから。 あとは、さまざまな公式が自然対数の形であらわされているから。 かと思いますが、別に常用対数でやっても、 簡単に変換できるのだから、どっちでも良いと思います。
お礼
ありがとうございます。 具体的には、#1さんへのお礼に書いたような場合のことです。そもそも、対数変換する必要があるのでしょうか。
- umamimi
- ベストアンサー率39% (144/362)
>自然対数に変換するのにどういう意味 ここだけ。 ダイナミックレンジが広いデータは等間隔に並べると全体が大きくなりすぎます。 等間隔なデータは大きな全体から比べると無駄に分解能が高すぎです。 それで、 100倍を2倍、1000倍を3倍で、というように対数で表すと上記の欠点が解消します。
お礼
早々とありがとうございます。ただ、データのレンジが広いわけではないのです。具体的には次のような場合です。 ある環境下で結晶の成長を観察したところ、単位時間当たり、0.5~1.7μの変動幅で直径の増加が見られたとします(成長は次第に鈍化)。そのデータと別環境下で観察したデータとの相関係数を求める時、移動平均との比(×100)をとるのはわかるのですが、その値は100から大きく離れることはありません。なので、なぜ対数をとるのか、その意味がわかりません。
お礼
大変遅くなりましたが、ご教示ありがとうございます。 残念ながら、当方の知識不足のため、ご教示の意味をよく理解できませんでした。 もう少し勉強したいと思います。