- ベストアンサー
CD→WAVE時のアップサンプリングについて
- CDの音源をソフトウェアを用いてWAVEファイルに変換する際に、アップサンプリングの影響が気になります。
- CDの音源はサンプリング周波数44.1kHz 量子化ビット数16bitで、この音源をWAVEファイルに変換する際に、サンプリング周波数88.2kHz 量子化ビット数24bitにアップサンプリングすると音質的に良くなるのでしょうか?
- また、量子化ビット数を上げるだけでなく、サンプリング周波数を上げて変換するメリットはあるのでしょうか?再生時のオーディオカードの設定では96kHz 26bitで再生しているため、どのサンプリング周波数で変換するのが良いか悩んでいます。
- みんなの回答 (8)
- 専門家の回答
質問者が選んだベストアンサー
No.5の回答者です。私は、音響の専門家ではなく「下手の横好き」です(専門は法律です)。正しい理論を理解したいのであれば、大学で、情報工学、音響工学、音響心理学などを先攻されることをお勧めします。 その上で... >> アップサンプリングの際に変換されるデータは元データの離散値データ // そもそも「サンプリング」と言っている時点で、離散値以外にはあり得ません。「連続値を離散値で表すこと」が標本化の定義です。 >> CDには離散値でのデータかそれともアナログ波形に復号化されたデータのどちらのデータが記録されているのでしょうか。 // CDの記録方式はデジタル、すなわち離散値です。記録されている情報自体も、デジタルです。情報自体がデジタルなので記録方式もデジタル化できた、とも言えます。 なお、記録方式と符号化方式とは別の話です。CDにおける音声の符号化方式はリニアPCMですが、記録方式はEFM変調によって形成されたピットとランドの連続です。 http://home.impress.co.jp/magazine/dosvpr/q-a/0006/qa0006_3.htm >> リッピングの際リッピングされるデータというのは、離散値データなのかアナログデータなのか(後略) // もちろん、デジタルです。「リッピング」という言葉の定義からしても、デジタルでなければ矛盾します。 >> (前略)によってサンプリングレートを変更する意味は違ってくる // もちろん、違います。アナログ波形をデジタル化する、すなわち標本化する場合には、少しでも精度を上げるために、サンプリングレート/ビット深度を大きくしたほうが良いと言えます。これに対して、もともと標本化されている場合には、「何も変化がないこと」が「高精度」です。従って、この場合にサンプリングレートを変換することは、精度を下げることにほかなりません。 (たとえば、世論調査も標本化の一種です。対象人数が1000人よりは1万人のほうが、日本の世論をより正確に反映していると言えます。「標本化するときは」標本数が多いほうが良いのです。しかし、「いったん得られた回答は」正確に伝達される必要があります。伝達する途中で300人分の回答を紛失しても、200人分を勝手に追加しても、正しい調査結果とは言えません。) 従って、アップサンプリングをするかどうかは、そういう「不正確になること」を差し引いてでも聴感上のメリットがあるかどうか、という点にかかっています。それを、エイリアスや補間との関係で理論上説明することも、ある程度は可能です。たとえば、エイリアス歪みが減るとか、補間によって滑らかに聞こえるとか、です。 しかし、それは「どういうアルゴリズムでアップサンプリングしたか」によります。その点を捨象して「アップサンプリングは高音質化に資するか」という問いを立てるのは、一般論に過ぎるでしょう。 また、「聴感上のメリット」の問題ですから、最終的な判断は「聞く人の聴覚」に委ねられます。従って、「結果的に好ましくなったか」という問いに対する答えは、水掛け論です。
その他の回答 (7)
- ittei
- ベストアンサー率27% (19/70)
No.6です、お返事ありがとうございました。 ご希望の回答ではないことをお詫び致します。 質問者様が音声を研究中であるならば、私、さらにはこの場所で 理解を得ようとすることは、いささか短慮であると思います。 専門書等で理論的知識を身につけることをお勧め致します。
お礼
ご回答ありがとうございました。 なかなか回答が見つからず焦っておりました。 もう一度学習しなおしたいと思います。 ありがとうございました。
- ittei
- ベストアンサー率27% (19/70)
No.3です、お返事ありがとうございました。 一番肝心なことは、何を重視するか?何で満足を得るか?です。 44.1kHz/16bit音源をアップサンプリングしても無いデータは無い。 なので、やっても無駄!と言う意見は正しい。 元のデータには無いけれど、液晶テレビの倍速のように、補間データが 効果を発揮することもある(スクロール字幕やスポーツなど)。 なので、無いデータを加えて良くなる、と思えばそれも良し。 要は、聞いてみて自分がどう感じるかが大事だと思います。 アップサンプリングなど、技術的なことで満足を得たいのであれば、 逆に音源(44.1kHz/16bit)をそのまま使用するのが最も満足できます。
お礼
ご回答ありがとうございます。 人間の聴力はとても曖昧で、同じ音が流れたとしても同じように意識して聞こえてはいないらしいので自分がどう感じるかということが最も重要であると思います。 アップサンプリングに意味がないのならどうして行う人がいて音質がよくなったと言うのかとても疑問です。 人間の耳なので単なる気のせい、プラシーボ効果だと言ってしまえばそれまでですが、もしかしたら本当によくなっている可能性もあります。 そのように思うのは、私がその根本であるアップサンプリングという物事を深く理解していないためであると考えます。 現在、私は音声の研究をしております。 このアップサンプリングによる音質が良くなったということの意味は、元のアナログデータに近くなったということなのか、聞いてみてそんな気がするということなのかを知ることは、自身にとってとても必要なことであるので非常に興味があります。 CDと同じレートでリッピングすることがどうして元データであるCDの音に最も近づくのかを例えでなく、理論的にご教授いただけると非常にありがたいです。 正確な理解なく同じレートでリッピングすれば元データに一番近づくと納得しようとしても自分の中で釈然としないのです。 大変お手数ですが、もしも余裕がありましたらご回答をよろしくお願いいたします。
- Yorkminster
- ベストアンサー率65% (1926/2935)
>> 44.1kHzの2倍は88.2kHzですが再生の際のサンプリング周波数が96kHzであるため、整数倍にはどうしてもならず、このCDの音源をWAVEファイルに変換する時にどのサンプリング周波数で変換すると最も良いか // そもそも、サウンドカードの規定値を44.1kHzに設定すれば万事解決する訳で、44.1kHzサンプリングのデータ(CD)を再生するのに96kHzに設定している、という部分こそが根本的な問題でしょう。 まず、「原音」の定義ですが、われわれ消費者の手元に届く以前のことは関知できないので、とりあえずは「音源となる媒体に記録された情報」と定義すべきでしょう。したがって、ここでは「CDに固定されたデータ」となります。 これは、44.1kHz/16bitの枠内に収まっています。従って、リッピングの際には44.1kHz/16bitで行うべきです。その上で、パソコンのソフトウェア上、ハードウェア上いずれでも変換が行われなければ(従ってサウンドカードは44.1kHzで動作するべき)、デジタル領域ではCDと全く同等、すなわち「原音に忠実」です。俗には、「ビットパーフェクト」と呼ばれています。 もしどこかでサンプリングレートの変換が入れば、それはビットパーフェクトではありません。従って、もはや「原音」とは異なる音を聞くことになります。 では、「原音」を、「デジタル化される以前の生の音」だと定義するとどうなるか。これは、空想の世界です。われわれ消費者は、レコーディングエンジニアが、スタジオやホールで聞いていた音を知る術がありません。従って、この意味での「原音に忠実かどうか」は、議論することができません(検証可能性がないので、水掛け論)。 「データ量の増加」が「音質の向上」とイコールという訳でもありません。補間の精度が悪ければ、ノイズが増えるだけだからです。「不正確な大量のデータ」より、「正確な少量のデータ」の方が有益な訳です。 よって、 ・オーディオデバイス(サウンドカード)を44.1kHzで動作させる。 ・オーディオデバイスを排他モードで使用する。 ・以上を前提に、リッピングの際は44.1kHz/16bitで行う。 というのが、最も「原音」に忠実であり、理論上、最も音質の変化が少ないと言えます。 アップサンプリングするのであれば、コンバータの性能(アルゴリズム)が効いてくるでしょう。補間の精度が問題になるからです。果たして、リッピングする際に96kHzに変換するのが良いのか、再生時にDAC(サウンドカード)で変換するのが良いかは、ケースバイケースということです(当然、ここでいう「良い」とは、「聴感上、自分にとって好ましい」という意味です)。 精度の問題がクリアできるとすれば、アップサンプリングによってエイリアス歪みを可聴帯域外に飛ばせるので、急峻なフィルタで高域をカットする必要がなくなります。もっとも、録音時には大きなメリットですが、再生時にどの程度の恩恵があるのかは、あまり定量的ではないと思います。 アップサンプリングする場合に、16bitのままでなく24bit化することには、意味があります。補間によって得られたデータを適切に配置するためには、16bitのままより24bitの方が良いからです。
お礼
ご回答ありがとうございます。 ビットパーフェクト覚えておきたいと思います。 元データにないデータは補間データとして前後のデータから推定されると思うのですが、アップサンプリングの際に変換されるデータは元データの離散値データということでよろしいのでしょうか。 毎秒44.1kHzの元データはある連続(アナログ)データを毎秒44.1k個の周波数データを取り込み、そして量子化されディジタルの離散値データ(毎秒44.1k個のデータ)に直され復号化により元のアナログ波形に戻され出力されると習いました。 CDにデータを記録する。これはこのCDには離散値でのデータかそれともアナログ波形に復号化されたデータのどちらのデータが記録されているのでしょうか。 そしてリッピングの際リッピングされるデータというのは、離散値データなのかアナログデータなのかによってサンプリングレートを変更する意味は違ってくると思うのです。 ですがこの考えが正解か否かさえわかりませんでした。 正確な理論なんてなくても元データのサンプリングレート、量子化ビット数で変換するのが最も元データに近いという納得の仕方もありますが気になっております。 エイリアス信号や補間データについては学習しておりますのである程度理解はしているつもりです。 オーディオカードの設定を変えると良いのですが、理解が未だ曖昧であるためその意味がわかっておらず、理解して適切に変更していきたいと思っております。 いまいち理解できないことはリッピングはCDと同じサンプリングレート、量子化ビット数で行うと元のCDのデータに一番近くなる。という点です。 そこで、上記を考えるにあたってリッピングは元データの離散値データか、アナログ波形に戻されたデータのどちらを用いて行われるのかを知ることが重要であると思うのです。 そして、この考え自体も間違っているかもしれないです。 もし、余裕がありましたら上記にご回答をよろしくお願いいたします。
- JIMIY
- ベストアンサー率47% (16/34)
個人的には、CDからリッピングするときは元データのままで保存するのがいいと思います。 アップサンプリングなんてDACやDDCで簡単に出来ますから。 ハードウェア上で変換するほうが、CPUへの負担も少ないのでノイズ対策にもなります。
お礼
ご回答ありがとうございます。 ノイズ対策になることは知りませんでした。 元データにできるだけ近く保存したいのですが、リッピングの際にCDと同じサンプリングレートと量子化ビットを指定するとそれが一番元データに近くなる変換ということなのでしょうか。 その理由さえわかれば良いのですがそこがいまいちよくわからなくて・・・ ありがとうございました。
- ittei
- ベストアンサー率27% (19/70)
こんにちは。 音が変わらなくてもいいじゃないですか、悪くならないなら。 マシンパワーを最大限に発揮できる96kHz/24bitに変換しましょう。 いちいち変換するのも面倒な気もしますが、そこは気合いです。 要は気持ちの問題なので、音が良くなった気がすればラッキーです。 それでも面倒になったらアップサンプリングできるDACが楽ですね。
お礼
ご回答ありがとうございます。 調べてみると意味がないと言う方もいれば意味があるという人もいまして、どちらの理論が正しいのかわかりかねております。 元データのサンプリングレートの整数倍でサンプリングしなければ、元データにない音が入り劣化するという話もありました。 容量も相当違ってきますのでそれだけ何のデータが増えているのか疑問です。 増えたデータが元のCDにあるデータならばCDの音により忠実と言えると思います。 そこでWAVE変換の際に、離散値データを変換するのか連続値になおされた波形を変換するのか。これの答えが重要であるように個人的には思いますが調べてもわかりませんでした。 前者の場合ですと、離散値データ、つまり毎秒44.1k個のデータが元データに記憶されているためここから値を変動させ変換すると、存在しないデータ(音となるのかは不明)が変換後のデータにあらわれることになります。 ですが、後者の場合連続値に直された波形を変換するのだとしたら、サンプリング周波数をあげればあげるほど変換前のデータに近づくということになる。と私は考えております。 そもそもこの考え自体があっているのかも不明ですが・・・ もしよろしければこちらの方のご回答もお待ちしております。 よろしくお願いします。
- yamadaataro
- ベストアンサー率27% (3/11)
残念ながらデーターをアップサンプリングして保存する意味はまったくありません。 A/D変換の際に失われた情報は絶対に戻ることはないですから。 しかしながらオーバーサンプリングはD/A変換の際のアンチエイリアシング処理にともなうひずみ、ノイズの軽減の点では十分意味があります。性能のいいアンプ、DACを使いましょうということですね。 まあすでに他の方の指摘のとおり電気-音変換時の音質劣化にくらべれば微々たるものですよね。
お礼
ご回答ありがとうございます。 アップサンプリングにより元のデータが復元されることはないのは知っているのですが、元のデータにより近づけるにはサンプリングレートと量子化ビットをあげて変換すればよいのでしょうか?それともいくらそれらをあげて変換したところで44.1kHz16bit変換時と何も変化はないのでしょうか? アップサンプリングして変換することでノイズ軽減できるとしたならそれも十分な効果に思います。 よろしければご回答よろしくお願いいたします。
- WillDesignWorks
- ベストアンサー率36% (1407/3901)
デジタルデータなので元データに含まれていない情報はすでに失われている。CDと同じレートや周波数でWAVE化するのが、最も自然。 失われた情報をあとから付け足すことは不可能。レートや周波数上げてもデータが増えるだけで特にメリットはない。 音質的には再生周波数レンジやダイナミックレンジの方が物を言うが、これらはCD用に音源が製作された段階で決まっていて、あとで(小さくは出来ても)大きくすることはできない。 オーディオの場合、CDのデータ云々より、アナログ段の再生環境による音質の違いの方が大きい。データが「96khzか88.2khzか」という話をしても、再生環境がパソコンにおまけで付いてきたスピーカーだとか、980円のインナーホンだったり、最終的にMP3に圧縮して通勤時にアウトドアで聴く、というのでは変化を聴き取ることは出来ない。 ピュアオーディオは、時にはスピーカーを置く台の材質やスピーカーケーブル一本で音が変わる世界だから、(CDに入っている情報を極限まで活用するという意味で)そっちにこだわった方が現実的。
お礼
ご回答ありがとうございます。 音の違いを聞き取れる環境にあると仮定した場合、変換する際のレートが高いほどCDの音に近づくのか否か気になっております。 変換する際の音声データが離散値のものであるのか、連続値に直された状態のものを変換するのでしょうか? もしよければよろしくお願いします。
お礼
ご回答ありがとうございます。 ようやくどのようにすべきかわかりました。 符号化方式や用いるアルゴリズムについても学習を進めていきたいと思います。 長々とお付き合いいただきありがとうございました。