• 締切済み

音声認識はどのくらいの精度がありますか?

エシュロンでは電話がすべてコンピュータにより自動盗聴されているという噂です。 コンピューターが「爆弾」だとか「テロ」だとかを音声認識すると、その電話のぬしに目をつけて、報告するのだという噂ですが、 「音声認識」自体どうなんでしょうか? 日本人の全ての会話を文章におこせるほどの音声認識できる精度は現在の最高最新技術にはあるのでしょうか?

みんなの回答

回答No.1

「声のみでキャラクターを操作する」というゲームが発売されたのが2003年。 http://www.jp.playstation.com/scej/title/operatorsside/index.html >コンピューターが「爆弾」だとか「テロ」だとかを音声認識すると 上記で紹介したゲームも「特定の単語に反応」してゲームが進行します。 発売から6年も経ってますから「少なくとも、6年分は技術が進歩している筈」です。 >日本人の全ての会話を文章におこせるほどの音声認識できる精度は現在の最高最新技術にはあるのでしょうか? 日本語には「同音異義語」や「文節」があるので「完全な認識は論理的に不可能」です。 例えば「くるまではこをはこぶ」を「文節の区切り無しで一気に発声」すると「車で箱を運ぶ」「来るまで箱を運ぶ」「車では子を運ぶ」「来るまでは子を運ぶ」の区別が出来ません。

関連するQ&A