- 締切済み
音声にガンマ補正をかけたいです
画像などでよくあるガンマ補正は音声に応用できないんですか? コンプレッサーの反対のエクスパンダーのような効果を期待しているんです。 しかしエクスパンダーでは私のいうガンマ補正と異なった効果しか得られないんです。 何故無いんでしょうか。教えてください。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- shintaro-2
- ベストアンサー率36% (2266/6245)
>画像などでよくあるガンマ補正は音声に応用できないんですか? γ補正の本質は、非線形特性を持たせて表示デバイスの苦手なところを何とかするということです。 昔からありますよ 例えば、カセットテープ時代の各種ノイズリダクションシステム ドルビーA,B,C,HX ANRS dbX adresが有名なところです http://ja.wikipedia.org/wiki/%E3%83%8E%E3%82%A4%E3%82%BA%E3%83%AA%E3%83%80%E3%82%AF%E3%82%B7%E3%83%A7%E3%83%B3#.E6.A7.98.E3.80.85.E3.81.AA.E3.83.8E.E3.82.A4.E3.82.BA.E3.83.AA.E3.83.80.E3.82.AF.E3.82.B7.E3.83.A7.E3.83.B3.E3.82.B7.E3.82.B9.E3.83.86.E3.83.A0 dbxの場合は音声信号の周波数を無視して、単純にあるレベル以上の音は圧縮、以下は増幅して録音、再生時には逆の動作というパターンです(まさにコンプレッサ+エキスパンダ)。他のシステムは大体周波数を考慮して動作します。 録音時に周波数によって音量を変えアンプのフォノ端子で逆特性で増幅する レコードのRIAAカーブも同じ発想です。 http://ja.wikipedia.org/wiki/%E3%83%AC%E3%82%B3%E3%83%BC%E3%83%89%E3%83%97%E3%83%AC%E3%83%BC%E3%83%A4%E3%83%BC#.E3.82.A4.E3.82.B3.E3.83.A9.E3.82.A4.E3.82.B6.E3.83.BC.E3.82.A2.E3.83.B3.E3.83.97
- John_Papa
- ベストアンサー率61% (1186/1936)
こんにちは。 映像と音声に根本的な違いがあります。 映像は、画像という2次元を時間軸に並べた3次元ですが、 音声は、線(1次元)を時間軸に並べた2次元データです。 また、映像では明暗の補正を人間の目にある虹彩という絞りで調整してくれますが、耳にはこの働きをする器官が有りません。では聴力の最下限から最上限まで同時に聞けるかと言えばそうではなく、同時にはせいぜいその6分の1程度の聞き分けしかできません。ビット数で言えば約3bitです。脳神経系のどこでそのような篩掛けを行っているのかは判りません。映像・画像では8bitですね。DAWでは12bitですけど。音声の16bitリニア(CDなど)というのは同時に聴ける訳ではありませんので音声のDAWデータと言っても良いでしょう。同時に3bit程度しか聞き分けられないことを大いに利用した音声デジタル圧縮方法がMP3などの非可逆圧縮なのです。一瞬一瞬は3bitでもサンプリング毎にシフトさせていけばリニア16bitを聞いているのと遜色無い音を再現できるというのが基本原理なのです。 コンプレッサー/エクスパンダーは、画像では直線的なコントラストに当たります。もちろんγ補正のように重み付けを行う事も可能です。ただ、フィルムやCRT等に比べ、音のデバイスは特性が1:1の直線的だった為にγ補正は必要とされず機材の直線性を良くする方向に技術が発展しました。 もちろん、このような意味での質問で無い事は承知ですが、 このような圧縮データを元にγ補正やコントラスト(エクスパンダ/コンプレッサ)処理をする事は、データ密度が似たようなGIF画像にそのような処置をするような行為であることは、言うまでも無いでしょう。 また、16bitリニアデータでは、コントラストを下げる(コンプレッサ)方向であれば(画像では『眠たい絵』とかいう表現で嫌われる傾向ですね)今まで聞こえなかった(音の世界ではマスキングという現象です)音が聞こえるようになったりします。 画像では鮮やかさを増す表現であるコントラストを強めるエクスパンダを掛けると、今まで聞こえていた音が聞こえなくなる現象が起きます。 製作現場ではノイズなど不要な弱音を悟られずに消す場合にエクスパンダが使われます。もちろんコンプレッサの使用は言うまでもありません。 あなたの考えられているγ補正がどのようなものであるか、推測もできませんが、音は一次元処理であることと、同時知覚レンジが3bit程と極端に狭いものであることが画像との大きな違いですので、これらの影響であろうと思います。
お礼
画像のようには行かないのですね。 GIF画像の例えがとても良く理解出来ました。 ありがとうございました。
- noct_nik
- ベストアンサー率50% (604/1206)
コンプレッサーは簡単です。小さな音は大きく、大きな音は小さくして平均化すればいいだけですから。 しかし、その逆は難しいですね。 平均的な音を、何を持って大きな音と小さな音に分けるのか、基準がわからないですから、拡張しようがないのです。 例えば、-12dB以上の音量の場合は増幅、それ以下を減衰させたとしたら、それは極めて不自然な音になるでしょう。
お礼
やはり難しいんですね。 ありがとうございました。
お礼
確かにノイズリダクションにも少し似ていますね。 dbxが一番近い技術なのかなと思いました。 ありがとうございました。