- ベストアンサー
1ビットオーディオの原理と利点は?
ちょっと前から1ビットオーディオが流行っているようですが、いまいち原理が理解できません。 ・これは、CDのPCMが16bit44.1kHzであるように1bit11.2MHzのPCMだと考えてよいのでしょうか? 言い方を変えれば、300dpi256色のグラデーションと4800dpiの白黒ディザリングの違いのように理解していますがそれで正しいのでしょうか? ・増幅時にDA変換を通さないので音が良いと聞きますが、1bitなのにどうやって増幅するのでしょうか?highとlowの値自体を変化させるのでしょうか? また、従来でも16ビットまたはそれ以上のデジタル増幅はあったと思うのですがそれと比べてなぜ音が良いのでしょうか? ・「ΔΣ変調」というものがあって、原理図を見るとFM変調を矩形波でやっているように見えますがそれであっていますか? ・ローパスフィルタでΔΣ変調されたデータが元波形になる理屈を教えてください。 また、そのときに音質が劣化するのではないでしょうか? ・素直にPCMの量子化ビット数を上げていればいいのではないですか?何か1bitならではの利点があるのですか?
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
1. >> ΔΣ変調の原理は周波数変調を矩形波でやっているように見えますがそれであっていますか? << いい眼力です! そう見抜けた人には「ΔΣ方式の何が優れてるのか」が丸見えなのです。 FM と同じようにノイズ(変換誤差)の周波数特性が三角形だからです。 「増幅時にDA変換を通さないので音が良いと聞きますが」と言いますが実際は1bitのDA変換です。1bitなわけは、ΔΣ方式が(オーディオ帯では)1bitで十分だからです。でも1bitであることとΔΣ方式が優れてることとは関係ありませんので。 ↓基本の PCM 波形です。 http://www.beis.de/Elektronik/DeltaSigma/ADCSinus.GIF 黒…原波形 赤…PCMの復号波 青…いわゆる量子化ノイズです。 これを手掛かりに、ディジタル変調をこんなふうに捉えてください; 原波形に 方式固有のノイズ を加えたものが復調波形である。と。 PCMの方式ノイズは広く知られてる「電圧コンパレータの階段のギザギザ」ってやつです。これには周波数特性などありませんから 量子化ノイズの振幅も周波数特性はありません、下図で横一直線です。 量子化ノイズの振幅 | | | |_____横一直線 | |  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄周波数 2. FM はAMと同じ純アナログなので変調誤差的ノイズは存在しません。伝送途中で加わる外来ノイズを考えます。復調の方は周波数を振幅に変える回路を使います。昔はフィルタの傾斜部分、現在はPLLですね。 FM波 ──C─┬─ 復調波出力 | R (実際は LC 同調回路の | 同調付近の急勾配を使う) ┷ PLLの場合 ここに 復調波が出る | FM波 ─減算───ローパス─┴─可変──┐ (位相比較) フィルタ 発振器 | └──────────────┘ 復調出力の振幅 | ____ | / | /上図のどちらも | / ハイパスフィルタの | / 傾斜部分を利用しています |  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄周波数 伝送途中で加わるノイズもハイパスフィルタを通ります。普通のノイズは周波数分布が一様なので、ハイパスフィルタを通った後は 右上がりの三角形になります。 ↓ナマのFM放送電波では搬送波を中心に左右対称になってます。 http://www.vk1od.net/FM/fmtri.gif これを復調すると 左半分が右に折り重なります。 3. PCMとFMのノイズの周波数特性; ノイズの振幅 | | FMのノイズ | / (三角状) | _/ | ̄/ ̄ ̄ ̄普通のPCMのノイズ |/ (一様)  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄周波数 。 もしΔΣ変調のノイズも三角形ならば、図の原点に近い所ほどPCMより勝ってますね。 たったこれだけです、この範囲で動作するようにすれば、ΔΣ方式は PCM 方式よりも SN比を良くできる、ということです。 なお、解説記事でよくある「1bitだから階段状電圧ステップの不揃いが関係しない…」という話は1bit構成にした場合だけの話で、上記の長所には bit数は無関係です。 ( 多bit構成も行われてますし、振幅が量子力学的に量子化される超伝導回路での開発が盛んです。) 4. ↓ΔΣ変調回路 http://www.beis.de/Elektronik/DeltaSigma/DeltaSigma1BlockDiagram.GIF この変換誤差(方式ノイズ)が三角ノイズになる仕組みを説明します。 まず↓量子化ノイズの波形(青色)。 http://www.beis.de/Elektronik/DeltaSigma/ADCSinus.GIF 事前に何か適当な回路で、これそっくりな波形を作ったと仮定します。 その波形を使って『原波形に方式固有ノイズを加えたものが復調波形である。』 を、 ↓この定番モデルで説明します。 http://www.beis.de/Elektronik/DeltaSigma/DeltaSigmaNoiseBlockDiagram.GIF ↑オペアンプで作った普通のアナログ回路だと考えてください、 こんな。↓ 量子化ノイズと ┌─ C ─┐| 同じ波形を | || 外部から加える 原信号─R┬┴|-\ |└R┐ ┌R┘ |-A >-┴─R┼─ ΔΣ変調パルス | ┌|+/ | | ┷ | └────←適当に─┘ バッファアンプが あると思ってください 量子化ノイズのそっくりさんを足されたあとの波形は、コンパレータの出力パルスとそっくりな形になることを理解してください。←ここが肝です。 図はめんどいので文字化します。↓ 量子化ノイズと そっくりな波形─┐ | 原信号 ─減算──積分回路 ─ 加算─┬─ ΔΣ変調パルス | | └───────────┘ 量子化ノイズ波形のみの周波数特性が見えやすくするため、原信号入力=ゼロとすると、 量子化ノイズと そっくりな波形─┐ | ┌─反転入力──積分回路 ─ 加算─┬─ ΔΣ変調パルス | | └────────────────┘ ↓回路変えずに場所だけ移動します。 量子化ノイズと そっくりな波形 ┌ ΔΣ変調パルス | | └─加算─┴─反転入力積分回路─┐ | | └────────────┘ 前記のPLLとそっくりな構成になりましたね、オペアンプで書けば、 量子化ノイズと ΔΣ変調パルス出力 そっくりな波形 ↑ ↓ | ┌─ C ─┐ | | | | └─R┬─バッファ ─┴─R ┴|-\ | ┌─R┘ アンプ | -A >─┤ | ┌|+/ | | ┷ | └────────────────┘ 図の右半分は ただの積分回路ですから 出力を式で書くと (出力) = (量子化ノイズ入力)-(出力を積分した波形) ですね、 引き算になるわけは積分回路で正負反転するからです。 周波数で書くと積分は 1/jω を掛けることだから、 (出力) = (量子化ノイズ入力)-(出力)/jω jω(出力) = jω(量子化ノイズ入力)-(出力) (出力)(1+jω) = jω(量子化ノイズ入力) ∴ (出力)/(入力) = jω/(1+jω) = ハイパスフィルタそのもの です。 すなわち、FMと同じく量子化ノイズは 右上がりの三角形になるのでした。よって、3項の図の原点付近で動作するようにすれば、PCMよりも方式ノイズを減らせる、ということです。 これが一応、原理の基本部分です。 まとめると; http://www.beis.de/Elektronik/DeltaSigma/DeltaSigma1BlockDiagram.GIF ↑出力の瞬時値は「普通のPCMの量子化ノイズ」と同じ振幅です。しかし積分器の出力ではその周波数成分が低域ほど落ちてます。その事を上記で延々と説明しました。 で、復号する側は この積分器とそっくりな回路ですから その出力も(量子化ノイズ成分に関して)まったく同じ周波数特性なわけです。 5. さらなる工夫。 http://www.apec.aichi-c.ed.jp/shoko/kyouka/math/onepoint/ex40/image3.jpg ↑原点付近では、紫の直線 y=x よりも y=x^2 の方が下に居ます。さらに y=x^3, y=x^4 ならもっと下になりますね、つまり積分を何重にもすればするほど量子化ノイズを小さくできるわけです。これがPCMをしのいでΔΣぶっちぎりになった肝です。 ↓二重積分の構成 http://www.beis.de/Elektronik/DeltaSigma/DeltaSigma2BlockDiagram.GIF さらに、 普通 PCM は、サンプリング周波数の半分の帯域に 入力を制限しないと エリアシングが発生します。これはアナログ段階でやらないといけないですが、スパッと垂直に切れるアナログフィルタは難しく、妥協して作らざるを得ず、信号が少し削られたり形がいびつになったりします。そこで、オーバーサンプリングと称して、サンプリング周波数を必要以上に思い切り高くして信号帯域との間を広くとって、フィルタを作りやすくします。 ↓普通のADコンバータとΔΣコンバータの比較。 http://www.beis.de/Elektronik/DeltaSigma/DeltaSigmaAliasFilter.GIF 黄色いゾーンが距離かせぎです。 1bit構成が好まれる理由は回路的に単純で高速にできるからです。この辺は古典的電子回路と量子力学的電子回路で話が分かれますが省略します。 得られた1bitのデータ列は まさにFMそのものです。PNMとかPDMとも称します。これ以降はディジタルフィルタの話になります。 SN比改善の具体的なことは 積分の次数と オーバーサンプリングの倍数で決まりますが、ディジタルフィルタの説明までは書き切れませんので省略させてください。 ΔΣ方式の肝は 積分で量子化ノイズが三角形になる所です。 6. >> ・ローパスフィルタでΔΣ変調されたデータが元波形になる理屈を教えてください。 << 4項の最後に書いた「まとめ」そのままです; http://www.beis.de/Elektronik/DeltaSigma/DeltaSigma1BlockDiagram.GIF ↑出力の瞬時値は「普通のPCMの量子化ノイズ」と同じ振幅です。しかし積分器の出力ではその周波数成分が低域ほど落ちてます。その事を4項で延々と説明しました。 で、復号する側は この積分器とそっくりな回路があるだけですから その出力も(量子化ノイズ成分に関して)まったく同じ周波数特性なわけです。 このことはDAのbit数には関係ありません、1bitDAでも多bitDAでも同じです。 あなたが「周波数変調を矩形波でやっているように見えます」とお書になった矩形波をローパスフィルタに入れて、矩形波成分を阻止して信号成分だけを通過させてるだけです。普通のローパスの機能そのままです。 7. >> いまいち原理が理解できません。 << こんなに広まってるのに「発明者に聞く」みたいな記事に出会ったことがありますか? 実は ΔΣ変換は 日本で生まれたんですが御存知でした? http://www.soumu.go.jp/iicp/chousakenkyu/data/research/monthly/2001/155-h13_08/155-foreword.html 地味な前世紀中葉の日本昔話は化石なのでしょうか、国外の文献では発明者の名前を散見しますが日本では知名度ゼロでしょう。 これも八木アンテナのように伝説の殿堂入りですね。 上記サイトを紹介しようと書き始めたら長くなってしまいした、この辺で。( 分かり易くするために不正確なところもあります、かなり昔のやつのツギハギなので変なところは御容赦を。)
その他の回答 (3)
- rabbit_cat
- ベストアンサー率40% (829/2062)
実は、1bitにするのに、必ずしもΔΣ変調が最良(誤差が最も少ない)というわけではありません。 原理的には、元信号全体を考慮に入れて、巨大な連立方程式を解くと、ΔΣ変調よりもさらに、誤差を減らせます。実際に、回路として実現できるとはとても思えませんが。
お礼
解答ありがとうございます。 確かに信号全体を連立すれば誤差を最小限にできそうですね。ΔΣは回路を組みやすいということでしょうか。
- rabbit_cat
- ベストアンサー率40% (829/2062)
>これは、CDのPCMが16bit44.1kHzであるように >1bit11.2MHzのPCMだと考えてよいのでしょうか? PCM(Pulse code modulation)ではないですね。 >言い方を変えれば、300dpi256色のグラデーションと>4800dpiの白黒ディザリングの違いのように理解して >いますがそれで正しいのでしょうか? こっちは正しいと思う。 >「ΔΣ変調」というものがあって、原理図を見るとFM変調を >矩形波でやっているように見えますがそれであっていますか? いまいち、意味がよくわかりません。FM変調と似てますか?? >ローパスフィルタでΔΣ変調されたデータが元波形になる理屈を教えてください。 #1の方の通りです。元信号の帯域がLPFのカットオフ周波数以下であれば、当然、原理的には、LPFによって音質が劣化することはないです。 >素直にPCMの量子化ビット数を上げていればいいのではないですか? >何か1bitならではの利点があるのですか? まず、#1の方のあげた、ADのステップが等しいかという問題があります。 それから、もう一つ、ΔΣ変調だとノイズシェーピングという特徴があるので、多ビットPCMより、元信号の帯域内では、量子化ノイズを少なくできます。
お礼
回答ありがとうございます。 PCMは違いましたか。ディザリングと同じことを言おうとしたつもりだったのですが。 FMも言い方が分かりにくかったようですみません。 ノイズシェービングは知りませんでした。色々利点があるのですね。
- foobar
- ベストアンサー率44% (1423/3185)
1ビット式の一番の利点は 必要な電圧の大きさが2通りで充分 ということかと。 たとえば8ビット分解能で、普通のDA変換やるときには、 0→1の変化したときと 1→2への変化したときで 変化の幅が同じか という問題が付いて回ります。 (同様に、2→3・・254→255と255とおりこの問題が付いて回ります。) 多ビットのデジタル信号を使って、高分解能になればなるほど、この問題はシビアになってきます。 で、1ビットDAなら、この電圧の問題が無い(時間の正確な制御は電圧に比べると容易)という利点があったかと。 LPFで信号が取り出せる理由 1ビットパルス列をフーリエ変換すると、オリジナルの信号+高調波で表されています。ここで、高調波をLPFで除去すれば、元の信号を取り出せます。 このとき、LPFでひずみが発生すると、意味がなくなってしまうので、 LPFにはひずみ発生の少ない回路を使う必要はありますが。
お礼
なるほど、幅をそろえる必要がない分精度が出るのですね。LPFについてもよく分かりました、ありがとうございます。
お礼
長大な回答をどうもありがとうございます。 正直ちょっと自分の理解を超える部分もありましたが、ノイズが減らせる仕組みはおぼろげながら分かった気がします。後でまた見返して見ます。