類似度 ユークリッド距離とコサイン尺度の統合
類似楽曲検索を作ろうと考えています。
ある楽曲の音響信号の特徴量と似た楽曲を検索するシステムです。
検索するにあたって、ある3つの特徴量(A,B,C)を使うとします。
AとBの特徴量はコサイン尺度を用いて類似度を計算、
Cはユークリッド距離で計算し、最終的に一つの類似度を計算したいと考えているのですが
どのような方法がありますか?
例えばすべてをコサイン尺度で計算すれば、
類似度=cos(Ai,Aj)+cos(Bi,Bj)+cos(Ci,Cj)
(cos(Ai,Aj)は楽曲iとjの特徴量Aにおけるコサイン尺度)
のように和を類似度として使えると思うのですが、
コサイン尺度(-1から1までの値をとる)とユークリッド距離は(0以上の値をとる)を使う場合、単純に加算しただけではうまくいきません。
正規化、無次元化?をすればいいのでしょうが、具体的な方法がわかりません。
どなたかアドバイスお願いします。
お礼
ありがとうございます! 大変参考になりました!! ゼミ発表の文献でこの名前だけは出て来たものの どうしていいのかわからなかったので 大変助かりました。 まさか類似性の話しだったとは・・・。 ありがとうございます。 お礼が遅くなってしまってすみません。