• ベストアンサー

ノイズと音声の識別方法について教えてください

音声認識についての質問です。 趣味でロボットに音声認識をさせたいと思っています。オンマイクは用いず、ロボット自身にマイクをつけています。そこで、動作中のロボット自身が発するノイズが問題になっています。 命令を正しく認識させるため、人間の言葉が発せられていると感知すると動作をいったん止めて、その後命令を聞かせるようにしたいです。 1.ノイズの中で人間の言葉が発せられていることを、どのような方法で感知させられますか? 2.周波数分析等を行うと人間の言葉とノイズとの間にはどのような違いがあるのですか? 教えてください。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • pochi_won
  • ベストアンサー率38% (15/39)
回答No.2

>様々な特徴の違いを使ってノイズと声を聞き分ける >プログラムを作りたいと思っているのですが苦戦し >ています。 >何か手法などご存知でしたらアドバイスください。 専門ではないので、あまり参考にならないかもしれませんが、ぱっと思いつくレベルなら、 ご存知のように声は母音と子音に分かれて構成されています。そのうち、波形が連続している母音の方が取り出しやすいと思いますので、そちらから処理して、その切り替わり部分(先頭)を解析するような順番だと思います。 母音の抽出は、周波数ではなくパターン抽出ですね。 言葉の抽出の手法に「隠れマルコフモデル」ってのを使うと良いらしいですが、詳しいことは判りません。 http://www.ism.ac.jp/~shiro/papers/thesis/master.pdf あまり参考になりませんが・・・

cln23
質問者

お礼

ご回答ありがとうございました。 アドバイスいただいた方法で試してみようと思います。

その他の回答 (1)

  • pochi_won
  • ベストアンサー率38% (15/39)
回答No.1

声のメカニズムについては、下記のURLが参考になると思います。 http://www.oki.com/jp/RDG/JIS/oto/speech/ ノイズに関しては、BPF(バンドパスフィルター)で「声らしい」帯域を取り出す方法などがあります。 BPFは、マイクの信号に対して電気回路で組む方法もありますが、マイク入り口に薄いスポンジなどをつければ、簡単なLPFになります。 電気的に組む場合は下記のURLが参考になると思います。 http://www.hobby-elec.org/pyro1_3.htm また、マイクの周囲に吸音材などで壁を作って集音の指向性を持たせる方法なども有効です。 あと、機械とマイクを強固に固定すると、機械の振動を音として拾いやすくなります。 ノイズの問題は、なかなか思うようには行きませんので、電機と機械の両面から色々やってみるといいと思います。

cln23
質問者

お礼

ご返答ありがとうございます。 声のメカニズムについて調べていたので大変参考になりました。 今、ロボットの動作音と声の混じった音を録音し、WaveSurferでノイズのみの部分、声のみの部分、ノイズと声の混じった部分について解析しています。様々な特徴の違いを使ってノイズと声を聞き分けるプログラムを作りたいと思っているのですが苦戦しています。 何か手法などご存知でしたらアドバイスください。お願いいたします。

関連するQ&A