- ベストアンサー
周波数スペクトルについて
はじめまして。まったく素養がないので、幼稚な質問かも知れませんが、、。 私が(例えば)10秒間、本を読んだ音声を、周波数スペクトルとして保存する事は、理論的には可能である、というような話をある人から聞きました。たとえば音声波形などの図は時間軸がとってあり、なにかの量の変化と時間との関係なのだな、とわかります。しかし、周波数スペクトルには時間軸がありません。10秒、という時間はどこに含まれてしまうんでしょうか? 変な質問で恐縮ですが、できれば中学生にもわかるくらいの御説明をいただけると助かります。数式、専門用語わかりませんので、概念、イメージ的な話で結構です。。宜しくお願いいたしますm(_ _)m
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
少し整理しましょう。厳密ではありませんので,その点ご承知おきください。 まず,音声を 10 秒なら 10 秒,「音声波形として残せる」ことは異存ないと思います。周波数スペクトルは,これを「変換」して得られます(フーリエ変換といいます)。このスペクトルは,その音声波形【10 秒全体】を見て,ある周波数がどれくらい含まれているかを調べたものですから,時間軸は消滅します。 これは,どんな長さの波形を変換しても,時間軸は消滅します。では,その時間の長さがどこに影響するかというと,「周波数軸の細かさ=分解能」です。イメージとしては,大きなデータを入力すれば,それだけ大きな出力が得られることと照応します。 一方で,周波数スペクトルが,時間で変化するものもご覧になったことがあるかと思います。これは,「スペクトログラム」というものです。「声紋」もこの一種です。 これは,端的には,時間波形を一定時間ごとに区切ってスペクトルを算出しています。上記から言えることは, - 時間を短く区切ると変化はよくわかるが,周波数スペクトルはぼんやりしてしまう - 時間を長く区切れば,どんな周波数を含んでいるかはっきりわかるが,時間変化がよくわからなくなる ということです。 イメージとしては,「時間と周波数は表と裏の世界」のように捉えるとよいでしょう。そして,それを同時に,正確に知ることはできない,ということもお留め置きください。
その他の回答 (4)
- SCNK
- ベストアンサー率18% (514/2762)
たとえば時間軸上で時間が0のパルス(インパルスと言います。)は周波数スペクトルの幅が∞です。 時間方向にエネルギーを詰め込む幅がないので、周波数方向は無限の幅が必要になるわけです。 逆に周波数スペクトル上の帯域幅が0だと時間方向に無限に長いパルスが必要になります。 すべての信号はその間にあると思ってください。面積一定の長方形の縦と横の辺の長さの関係と同じことです。 ただ中に入っているのが波のエネルギーなので重ね合わせると0になってしまうこともあります。逆に2倍になることもあるでしょう。そういうわけで時間方向にも周波数方向にも複雑な波形ができるのです。
お礼
ありがとうございました。時間と周波数スペクトルの関係、「面積一定の長方形の縦と横の辺の長さの関係」なんだか面白いですね。帯域幅というのが狭く、時間方向にとても長いパルス、とか、時間がとても短く周波数スペクトルの幅が広い、などの音があるとしたら、どんな音になるのか、想像しようとしてますが、なかなかイメージわきません、、、
補足
みなさんありがとうございました。結局、急がば回れ、フーリエ変換について勉強する必要がありそうですね。御協力ありがとうございました。
- Teleskope
- ベストアンサー率61% (302/489)
たとえば、検索で「ウエーブレット変換」で追ってください。 簡単に言うと、フーリエ変換は実時間処理が不得意なのです。どこからどこまで?とか定義が困ることが色々あって。それを解決するために急成長してきた、フーリエ変換の「子孫」です。子孫だから親世代の常識だけでは理解できない面があります。ここで初等的説明は無理なので、まずは検索で頭痛めてください。 実時間でない分野でも重宝がられて進出してます、やがて元祖フーリエ変換は原理説明だけに登場することになるかもです。
お礼
ありがとうございました。ウエーブレット変換、現在あちこちで使われている先端的な技術の様でフーリエ変換の不備を補うような実用的な方法らしく、、、頭しびれてきましたので、ひと休みします。謝謝
- keyguy
- ベストアンサー率28% (135/469)
連続T秒の波形は 周波数0,±1/T,±2/T,±3/T,・・・の(無限個の)輝線スペクトルで表されます
お礼
ありがとうございます。輝線スペクトル、、
- 12m24
- ベストアンサー率23% (193/817)
このことを「周波数、強さ」の二次元で考えると、時間が足りなくなってしまいます。ここに時間を加えるには、 一例として、x軸に時間、y軸に周波数、z軸に強さとすれば、音を表すことができます。これは声紋の測定方法と同じです。 ただし、理論的に保存することはできても、これを復号するときに非常に多くの計算をしなくてはならないので、リアルタイムでの再生には難があるのではないかと思います。
お礼
ありがとうございます。軸を3つとれば、のお話、なんとかわかります。問題は、「たたみこみ」というヤツですね。どーにも感覚的に理解できなくて、、。
お礼
わかりやすい説明をありがとうございました。サル頭にはとても助かります。時間と周波数の関係、すこし理解できました。フーリエ変換、中身はまったく知りませんでしたが、名前だけはどこかで、、、。ある時間内の不規則で不均質な音の変化を、波長の異なる音の集合体、に変換してしまう、というような解釈でよろしいですか?