- ベストアンサー
声に含まれるノイズの構成サイン波数とは?
- 声に含まれるノイズは無数のサイン波の和で表されます。
- 最新のパソコンのCPUやGPUでもノイズは分解や再現が難しいです。
- 一般的には15個以上のサイン波で声の再現が可能ですが、ノイズの再現に関しては苦労することがあります。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
ノイズ(ホワイトノイズ・ピンクノイズ・ブラウンノイズ)は最低でも20~20kHzで1000個のサイン波で構成されているのではなくて20.1Hzとか端数周波数があると考えると無限大の周波数があるのでは?と思います。 最新のパソコンでも厳密には分解・再現することができないのでは? サイン波による歌声の分析合成の動画は15個以上の倍音列サイン波の音圧をフォルマントごとに編集して母音を合成しているのかな?と思います。 1音だけの倍音をきっちり2倍3倍・・と機械的設定するのは出来ると思いますが、破裂音などのノイズ成分も入れないと人間の声を再現するのは困難です。 昔にYAMAHAのSGと言うフォルマントソフトを使ってDTMしていましたが、どうしても動画のような発音も機械的声になって苦労しました。 音声を探究してもらえると技術の進歩に貢献できると思いますのでお願いしたいです。 添付図は動画をAudacityで録音して一部のスペクトラムを見たものです、20kHzは1秒間に2万回も振幅しているように音の波形は複雑怪奇であって、研究すべきことが山ほどあります。 聴くだけでは分かりにくいのでパソコンで測定することをお勧めします。
その他の回答 (2)
- cwdecoder
- ベストアンサー率20% (200/997)
瞬間的に立ち上がる(または立ち下がる)波形では無限のサイン波が含まれます。 例えば理論上は、懐中電灯のスイッチを入れるだけで無限のサイン波によって構成されるノイズが発生します。(実際には立ち上がりに僅かな時間がかかるので無限とは言えませんが)
- tetsumyi
- ベストアンサー率25% (1960/7602)
何個のサイン波と聞かれても人によってまた語によって大きく違いますから難しい。 また同じ音が続くわけではなく短時間でどんどん変化しますから何百のサイン波を時間と共に変えながら加算すればできないことはないでしょう。 しかしながら膨大な分析とデータが必要ですから、現在では人の声をコンピューターで作ることはやめて、実際の人の美声を使って繋いで音声を流すようになりました。 この方が遥かに安上がりで綺麗な聞き易い言葉となります。 とてもじゃないけど個人でどうこうしてまともな人の声を出すなんてことは無理のようです。 色んな楽器の音を出す高額コンピューター演奏楽器があり、1度演奏会を聞きに行った事がありますが生楽器の音と似ているとは言え相当違いがっかりしました。 それに楽器は演奏家が高度な技術によって音色を自由に変えて演奏しますから同じ音色を出すコンピューターでは高い音楽性表現ができません。 同じように人の声もコンピューターでは感情表現ができないでしょう。