• ベストアンサー

log同士の比(logA/logB)に意味はありますか?

こんばんは。 数学や統計学にちょっと疎い学生ですがよろしくお願いします。 今度ある学会で研究発表をすることになったのですが、データの扱いで困っています。 2群に分けた計n個のデータについて、 血液中のある物質AとBの量(濃度)を測定し、 データごとにその比を計算して、 「これらの物質の濃度バランスが群により異なる」ことを言いたいのですが、 log同士の比を使ったところ疑問の声をいただいてしまいました。 ちなみにAは大体0~100、多いものでは数百になりますが、 0が大変多く、平均も2~3くらいです。 Bは大体1000~15000で、平均は2000強です。 A(またはB)のみの比較では常用対数にしてからt検定をしたのですが、 常用対数同士の割り算をするのは妥当でしょうか? 単純に濃度そのものの比を出したとしても、 だいぶ大きな数になってしまうし、0が多いのも気になります。 log(A/B)=logA-logBだから引き算でしょうか? 同じようなことをやっている論文も探したのですが見つからず…。 統計の観点からおわかりになる方がいらっしゃいましたらよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • oyaoya65
  • ベストアンサー率48% (846/1728)
回答No.1

>log(A/B)=logA-logBだから引き算でしょうか? A=3,B=2000として log(A/B)=log(1.5/1000)=log {1.5×10^(-3)} =-3+log1.5≒-3+0.176091(=-2.823909) で差が小さく圧縮されています。 しかし、A/Bの比の有効桁数は0.176091で確保されています。 log(A/B)は比の対数表示で引き算ではありません。 一般的な使い方でこの形式でデータを取り扱われればいいかと思います。 (logA/logB)のようなデータの扱いは余り目にしたことは無いですね。

Lisa_S
質問者

お礼

早速のお返事ありがとうございます。 引き算…ではなく比をとってから対数にすればいいのですね。 確かにこれなら比を計算した上で圧縮できていて,見た目にも納得です! どうもありがとうございました。 (先ほど論文でlogarithm of odds ratioという言葉を見つけたのですが,これがlog(A/B)のことですね) ところで,このように数値や比を対数で表して比較するのは学術界では一般的なことなのですか? 結論は変わらないから対数表示するのですよね。 そのままの数値を使うのと,対数表示で比較するのとはどのように使い分ける(結果を読み分ける?)のでしょうか。 統計処理がわかっておらずお恥ずかしい質問かと思いますが,もしよろしければお願いします。

Lisa_S
質問者

補足

度々すみません。 教えていただいた方法を実践してみたのですが, Aのほうに数値0が多く,対数表示できなくて行き詰ってしまいました(>_<) 単純にA/Bならそのまま計算できるのですが, 対数表示で比較検定するのと同じ意味で使えるのでしょうか。。。 よろしくお願いします。

その他の回答 (4)

  • solla
  • ベストアンサー率59% (45/76)
回答No.5

> log同士の比(logA/logB)に意味はありますか? Aに0をとるものがあるのなら、log(A/B)はもとよりlogAだって計算できないと思いますが、何をされたのですか? それに、 > 「これらの物質の濃度バランスが群により異なる」ことを言いたい とのことですが、logA/logBというのは「濃度バランス」を表しているのですか? 例えばX(ml)中の血液に含まれる物質Aと物質Bの量をA(mg),B(mg)とすれば 物質Aの濃度= A/X(mg/ml) 物質Bの濃度= B/X(mg/ml) で、物質Aと物質Bの濃度の比(A/X)/(B/X)=A/Bが「濃度バランス」というのは解りますが…。まぁこれは当該分野の中での意味付けにかかわる事なので的外れだったらすみません。logA/logBが「濃度バランス」だと定義するということであればそれで良いのでしょうが、A=0の場合をどうするかというのは依然として解決しませんね。そもそもA=0がそれだけあるのにlogA/logBを「濃度バランス」として定義するのであれば、その定義自体が問題ということにも思えますが…。 ご質問の内容を見る限りは、A/Bをノンパラメトリック検定で比較するのが良いように思います。0が同順位で多くあるのは少々問題ですが…。

Lisa_S
質問者

お礼

お礼が遅くなって申し訳ありませんでした。 ご回答ありがとうございます。 A=0の場合ですが,最初は0.1として計算していました。 0.1は検査キットの感度として設定されました。 下のお礼にも書きましたが,何も考えずデータ処理をしてしまった結果, 今からその方法の妥当性を探るという事態になっています。 なので,そもそも0を0.1とする所から正しいのか考えなければなりません。 というより,ご指摘の通りそれだけ0が多いデータで 比をとる意味があるのかどうかも…という所ですよね。 話が前後してしまいすみません。 計算方法としてはA/Bとしてさらにlogをとるのが正しいようですので,これで処理し直しました。 幸いそれらしい結果も出たのでとりあえずほっとしています。 どうもありがとうございました。

回答No.4

そもそも方法論的に根本的な疑問があるのですが。 >「これらの物質の濃度バランスが群により異なる」ことを言いたいのですが、 その言いたいことにはきちんとした根拠があるのですよね。でしたら、その根拠をきちんと処理すればよいと思います。根拠はきちんとしているけど処理方法がわからないと言うことなら、その根拠を補足してください。 >log同士の比を使ったところ疑問の声をいただいてしまいました。 log同士の比を使ったのはあなたですよね。 でしたら、使うべき根拠があって使ったのではないのですか。疑問の声には根拠を説明しましょう。

Lisa_S
質問者

お礼

こんばんは。ご回答ありがとうございますm(_ _)m 言い訳のようになってしまいますが,log同士の比は私が指導教官に言われて処理したことなのです。 学生が個別に基礎研究を教わる必修カリキュラム(卒研ではありません)があるのですが, 私の場合は指導教官が以前から行っている研究の一部をやらせてもらうことになり, 今回の手法やデータの大半はその先生からお借りして,手取り足取り教わっている感じです。 今回このように濃度バランスを検討しようというのも先生のお考えで, 簡単に言えば「log/logを調べてみろ」と言われて「ハイそうします」という流れです(私もいけないのですよね…)。 そのときはたまたま?有意差が出て,そのまま内輪で発表したんですが,質問文のように疑問の声があり, log/logの妥当性を証明するという新たな課題に取り組んでいる次第です。 質問文だけだと確かに意味不明ですよね…説明不足すみませんでした。 log/logの根拠はありませんが,先生としては何とか濃度比のアンバランスを証明したいところなのです。

  • oyaoya65
  • ベストアンサー率48% (846/1728)
回答No.3

Aにゼロのデータがあり(logA)が取れませんね。 気がつきませんでした。 Aにゼロが沢山含まれるということですのでA/Bもゼロが多いということですね。 AとBのオーダーの差はあっても 1群の比(A/B)と2群の比(A/B) の間の比のオーダーの差はないですね。 この対数を取らない比(A/B)でt検定してください。 そうするしかないですね。 参考までに参考URLにt検定の例がありますので参考にしてください。

参考URL:
http://genome.ag.saga-u.ac.jp/textbook/textbook3-5.html
Lisa_S
質問者

お礼

再々度ありがとうございます! やはり統計的な観点で発表したいので,logで説明すべきのようです。 ただ試しにlog(A/B)でがんばって(A=0のものをA=1としました)やってみたものの, logA/logB時にあった有意差が消滅してしまい,愕然でした。。。 申し訳ありませんがoyaoya65さんの 「AとBのオーダーの差はあっても1群の比(A/B)と2群の比(A/B)の間の比のオーダーの差はないですね。」 の所がよく理解できなかったのですが 補足説明をお願いできますでしょうか(>_<)

  • oyaoya65
  • ベストアンサー率48% (846/1728)
回答No.2

#1です。 補足の回答です。 >ところで,このように数値や比を対数で表して比較するのは学術界では一般的なことなのですか? >結論は変わらないから対数表示するのですよね。 >そのままの数値を使うのと,対数表示で比較するのとはどのように使い分ける(結果を読み分ける?)のでしょうか。 何を学会で発表したいのかの目的に対して、生のデータを発表することに意味があるのか、統計的な傾向や特徴を分かり安く発表することに意味があるのか考えてみてください。おそらく後者ではないでしょうか。 (これが使い分けの判断の基準です。生のデータが重要なときは生のデータを使うべきで、統計処理が研究の目的なら統計処理結果が分かりやすくより的確に表現できるlog(A/B)の処理を行右方がベターですね。) そうなら、統計データの結果を注目点(傾向や特徴)を分かりやすく、かつ際立たせて表現できる方法(グラフ化(可視化)して分かりやすい図で表現する)を取るべきですね。lob(A/B)を使用する方法は、生のデータより分かり安いグラフを作るのに有用なデータ処理方法かと思います。