- ベストアンサー
次のようなデータ解析の際に対数をとるべきか
右利きの人と左利きの人が同じ人数いるとします。 彼らの左右の握力を測り、右手の握力を左手の握力で割った値を比率Rとします。 このRは1ならば両利き、1より大きければ右利き、小さければ左利きと仮定できます。 しかしこのままではグラフ化したり平均値を求めるのが難しいです。 そこでRの対数をとれば、利き腕がどちらでも比率が同じならば絶対値も同じになるので 平均を取ったり比較をしたりしやすくなると考えました。 そこで質問なのですが、 1、この考えは正しいですか? 2、正しい場合、10の対数で大丈夫ですか? よろしくお願いします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
No. 3です。 左右の握力の違いから利き手を判別できるかどうか、ということですね。最初に左右別々に log(R) の分布を調べるアプローチで良いと思います。 もし、その分布が互いにほとんど重ならない場合は、log(R) は判別法として優れていることになります。逆に、分布がほとんど重なってしまうようだと、log(R) では判別できないことが分かりますね。おそらく、現実はその中間にあるでしょうが・・・。 (FR - FL) / (FR + FL) は、握力の差を平均値で割ったことに相当します。平均値は (FR + FL) / 2 ですが、全員を同じように扱うのですから2で割っても割らなくても同じことですね。ですから、2で割るのを省いて (FR - FL) / (FR + FL) となります。 (FR - FL) という差を考えるだけでは、握力の絶対値が大きい人が大きな値を出すことになります。今は、「偏り」を調べたいわけですから、握力の絶対値で規格化することが必要になります。それが平均値で割る、ということの意味です。(このような考え方(及び数値化)は比較的よく使われます。) (FR - FL) / (FR + FL) が log(R) と同じような数値化指標として働くことは実際に数字を入れてみるとわかります。例えば、FR = 2, FL = 1 の人と FR = 4, FL = 2 の人がいるとします。2人の log(R) は同じ値ですし、(FR - FL) / (FR + FL) もまた同じ値ですね。 今回の目的の場合には、log(R) と (FR - FL) / (FR + FL) のどちらを使っても同じ結果が得られます。どちらを選ぶかは好みの問題でしょう。 例えば、左右の握力が2倍(1/2倍)以上差があるということをわかりやすく表示したいと思ったら、底が2の log(R) を使うのが良いでしょう。目的に沿った数値化を前面に出すなら、規格化された握力差である (FR - FL) / (FR + FL) が良いと思います。
その他の回答 (3)
何を数値化しようとしているのか、を明確にするとよいと思います。 想像するに、左右どちらが力が強いか(R > 1 or R < 1)だけでなく、一方が他方に比べてどれだけ強いかという「偏り」も数値化したいのではありませんか?例えば、R = 0.5 と 2 は同程度の「偏り」(「偏り」の「絶対値」が同じで「極性」が逆)と見なしたいわけですよね? 確かに、R のままでは、仮に左右均等な人数分布だとしても、グラフは R = 1 に関して対称にはなりませんし、平均値も1にはなりませんね。 解決法の一つは、ご質問にある通り対数をとることです。すると、上の例は log_2(R) = -1, 1 となるのでうまくいきます。対数の底は自由です。例では R = 0.5, 2 を用いたので底は 2 にしましたが、R = 0.1, 10 なら底は 10 が良さそうです。実際のデータはこんな切りのいい数字にはならないでしょうから、底は自由に選んで構いません。しかし、実用上は 2 や 10 などの意味が考えやすい数字が良いでしょうね。 他には、(FR - FL) / (FR + FL) なども使えます。(FR : 右手の握力、FL : 左手の握力) No. 2 の方が指摘されていることと関係しますが、log(R) や (FR - FL) / (FR + FL) は左右の握力の違いを数値化しているだけで、被験者が右利きであるか左利きであるかは全く関係ありません。使ったデータは左右の握力だけであり、それが利き手であるか否かの情報は含まれていないですね。 つまり、もし、利き手の握力がもう一方の手の握力より大きいかどうかを調べようとするのなら、もう一工夫必要です。工夫といっても大したことではなく、R の定義を「利き手の握力」を「もう片方の手の握力」で割ったものにする、あるいは、FRを「利き手の握力」、FLを「もう片方の手の握力」とするだけです。 (R, FR, FL の定義を変えないなら、利き手が右なら1、左なら-1であるような p という数値を定義し、p×log(R) や p(FR - FL) / (FR + FL) を計算しても等価な結果が得られます。)
補足
>想像するに、左右どちらが力が強いか(R > 1 or R < 1)だけでなく、一方が他方に比べてどれだけ強いかという「偏り」も数値化したいのではありませんか?例えば、R = 0.5 と 2 は同程度の「偏り」(「偏り」の「絶対値」が同じで「極性」が逆)と見なしたいわけですよね? その通りです。 (FR - FL) / (FR + FL) というのは思いつきもしませんでした。 少しこの意味を考えてみます。 後半部分は他の方の補足にも書きましたが、どちらが利き手かという情報がない状態を考えています。 もし左右の握力だけわかっているときに、利き手がどちらかを当てる場合に、どのくらい右利きであるか、どのくらい左利きであるか、という指標になるのではないかと考えてRの値を使おうと考えたのが始まりです。 これを応用して、右利きのみのグループに対してlog(R)を求めてその平均を取り、同じく両利きグループ、左利きグループの平均を取れば、 その統計情報を利用して新たな未知の利き手を持つ被験者の握力がわかっているとき、どのくらいの確率で右利きであるか、両利きであるか、左利きであるかを求められるのではないかと思っています。 もっと良い方法があれば是非提案していただきたいです。
- kuro804
- ベストアンサー率29% (523/1762)
こんばんは 算数しか分かりませんが、面白そうなので回答と言うよりは私はこんな風に考えましたという事で、言わして下さい。 命題から明らかに利き手の右、左は同等な扱いをしなければおかしいと考えます。 ”右手と左手と捉える”のではなく、”利き手とそうでない側”での比率をとるのが正しいのではないでしょうか。 右利き÷左手=右利き率、左利き÷右手=左利き率 でいかがでしょうか(^_^;
補足
本当はそうしたいのですが、もし被験者がどちらが利き手なのかわからなければ・・・? 今回はこの場合を想定しています。 両手の握力がわかっている場合に、利き手を当てるゲームだと思っていただければわかりやすいかもしれません。
- アロン 中尉(@Aaron_Rashid)
- ベストアンサー率12% (23/180)
>そこでRの対数をとれば、利き腕がどちらでも比率が同じならば絶対値も同じになるので平均を取ったり比較をしたりしやすくなると考えました。 この意味が理解できません。 何をグラフ化したり平均値を求めたいのでしょうか?
補足
Rはいくらでも大きな値をとりますが、0以下にはならないですよね。 例えば右が10で左が1ならRは10ですが、右が1で左が10ならRは0.1です。 この2つの平均をとれば5.05になりますがこの値は全くの無意味です。 しかし10の対数を取れば前者は1で後者は-1となり、平均は0になります。 この平均値にはとても意味があると私は考えました。 グラフ化という言葉が出たのは対数をとらずにRをプロットすると、 1が基準であって欲しいのにそれよりも大きい値にばかりしか視覚的には伝わらず 1以下の多くの情報が失われてしまうと考えたからです。
お礼
とてもわかりやすい解説をありがとうございます。 左右の握力の差を平均でノーマライズしているということだったんですね。 今回の私の用途では何倍の差があるかということを視覚化する必要はないので 提案していただいた (FR - FL) / (FR + FL) を用いることにします。