• ベストアンサー

音声って何なんでしょうか?

あいうえおかきくけこ…という音声は自然界に存在する『音』とは違いますよね。一体何がどう違うんでしょうか? また、どうやって発生するものなんでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • phobos
  • ベストアンサー率49% (515/1032)
回答No.3

> 音声は自然界に存在する『音』とは違いますよね 既に寄せられている回答の通り、「声」も「音」のひとつです。 人間の喉や口から出る音(空気の振動)に「声」と名付けているだけのことです。 それは例えば↓のような波形をしています。 http://tsubaki.ge.ariake-nct.ac.jp/~takeuchi/blog/archives/2007_2_21_673.html ただ、質問者さんの疑問のおおもとは、おなじ「空気の振動」のハズなのになぜ「声」は特別に違って聞こえるのかということではないでしょうか。 それは、人間は声で意思を伝え合うので、喉や口から出る音が耳に入ると、人の脳はそれに「音」だけではなく「意味」も重ねて聴き取ってしまうからだと思います。 > あいうえお…という音は自然に発生したりしませんが。 自然に発生することもありますよ。風が強いときに家の回りで渦を巻いて「おおおぉぉぉ~」と鳴っているのを私は聴いたことがあります(あまり気持ちの良い『声』ではありませんでしたが)。 これは風によって電線などが振動しておきた音(の波形)が、たまたま人間の喉から出る「お~」の声に似た波形になったからなのでしょう。 これを積極的に行うのが「音声合成」で、200年以上も前から、ノドや唇の模型に風を送って人間の声を合成する試みが行われてきたそうです。 http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90 人間がどのように「声」を「声」として認識するのかなどについては、下記のサイトなどが参考になるかと思います。 「音声認識について考える--音声の内部構造によるパターン認識の研究--」 http://www.geocities.jp/onsei2007/index.html#matching

その他の回答 (5)

  • DIooggooID
  • ベストアンサー率27% (1730/6405)
回答No.6

こちらは、音声合成の一例です。 http://www.intercom.co.jp/mytalk/voicefax/voice_synthesis.html

  • ojisan7
  • ベストアンサー率47% (489/1029)
回答No.5

人間の声と自然界に存在する音は誰でも容易に識別できます。これについては、人間の発する音声の特徴を知れば理解できます。人間の人間らしい音声の特徴は、子音よりも、母音に顕著に表れます。人間の発する、「あいうえお」の母音の音声をスペクトル解析するのです。音声の約500~1000Hzの帯域を第一フォルマントといい、約1500~3000Hzの帯域を第二フォルマントといいます。さらに高次のフォルマントもありますが、母音は主に、この2つ(第一と第二)のフォルマントの組み合わせによって構成されています。そして、これは男女差や個人差はあまりみられません。周波数が多少、上下することがあっても識別可能な範囲内に収まっています。 このことは、逆に言えば、第一フォルマントに相当する低周波数の音波と第二フォルマントに相当する中周波数の音波を人工的に作り出し、スピーカーから同時に発すれば、人間の発するのと同じ母音の音声が聞こえることになります。パソコンでも、DTM等のソフトがあれば、音声を簡単に作ることができると思います。実際に、ご自分で、やってみてください。 尚、子音は、破裂音や摩擦音などの雑音(多くの周波数が混じった音)ですが、これは自然界にありふれたおとですから、人工的に作り出すことが容易ですね。

参考URL:
http://research.nii.ac.jp/~sugimoto/lecture/multimedia/7th.pdf
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.4

はい。もちろん可能です。 しかし、 現代では、人間の声をマイクで拾って録音(サンプリング)したものを鳴らすほうが、技術的に簡単だと思います。 半導体も安くなりましたからね。 つまり、デジタルシンセサイザーです。 日本語の場合は、五十音をすべてサンプリングしているのではないかと思います。 家電製品などでも、そのような技術が用いられている場合が多いと思います。 人間が実際に喋っているのと、微妙にイントネーションや発音が違います。 私の家の場合だと、風呂の給湯が完了すると、女の人の声のような音声で 「おふろがわきました」 と‘しゃべり’ます。 ちなみに、 電子ピアノも、グランドピアノの音をサンプリングしたものが音源になっています。 これも、デジタルシンセサイザーです。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こんにぎは。 >>>あいうえおかきくけこ…という音声は自然界に存在する『音』とは違いますよね。 そのご質問は、 「人類は、動物とは違いますよね。」 という質問と似ていますね。(笑) しかし、おっしゃりたいことはわかりました。 あいうえおかきくけこ… の音声は、れっきとした「音」の一種です。 >>>一体何がどう違うんでしょうか? また、どうやって発生するものなんでしょうか? テレビなどでご覧になったことがあるかもしれませんが、 世界のどこかの民族楽器で、 口を「あ」「い」「う」「え」「お」の形にしながら、口の前でその楽器の弦をはじくと、 「あ」「い」「う」「え」「お」のような音になるというのを ご覧になったことはありませんか? その楽器がなくても、 口を「あ」「い」「う」「え」「お」の形にしながら、 ほっぺを‘しっぺ’するか、もしくは、強く叩くかいてみてください。 すると、「あ」「い」「う」「え」「お」のような音が鳴るはずです。 エレキギターのエフェクター(音に何かの効果を与える機器)の一つで、「ワウ」(ワウペダル)というのがあります。 これを使うと、ギターの音を「あ」「お」「う」のようにすることができます。 「あ」⇔「お」⇔「う」といった音に聞こえるのは、 「あ」の音の高周波成分をカットすると「お」になり、さらにカットすると「う」になる、ということだと思います。 このように推測している根拠は、私が昔、アナログシンセサイザーの音作りを経験していることです。 高周波成分をカットしていくことによって、「あ」~「う」のような音を出すことができます。 次に、「かきくけこ」ですが、 ご存じの通り、かきくけこをローマ字で書くと、 KA、KI、KU、KE、KO です。 ですから、 「K」の音の直後に「あ」を発音すれば「か」、 「K」の音の直後に「い」を発音すれば「き」、 ・・・・・ です。 このような子音(K,S,T,N,H,M,Y,R,W、G,Z,D,B,P)は、 何かの楽器で1つの音を鳴らしたとき、先頭に来るノイズに相当します。 たとえば、ギターで言えば、弦を弾いて1つの音を鳴らした際に最初に聞こえるノイズ、 トランペットやホルンで言えば、1つの音を鳴らした際に最初に聞こえる音の微妙なずれ、 などです。 以上、ご参考になりましたら。

adachihide
質問者

補足

ということは、人工的に音声を作り出すことは可能なんでしょうか?

  • DIooggooID
  • ベストアンサー率27% (1730/6405)
回答No.1

音声は自然界に存在する『音』と同じです。 ※音というのは空気の振動(波)です。  実際には媒体は、空気だけではなく水や金属も音を伝えるのですが、一般的には空気の振動を音という場合が大多数です。

adachihide
質問者

補足

いや、あいうえお…という音は自然に発生したりしませんが。 人間(九官鳥とかも)が声に出さないと発生しないと思いますが

関連するQ&A