- 締切済み
音声認識ソフトの認識率をあげる方法について
「音声認識ソフトの認識率をあげる方法(会議で話し合われた内容)」について、コツをご存知の方がいらっしゃいましたら、アドバイスをお願いします。 先日、音声認識ソフト「アミボイス」を購入しました。 会議で話し合われた内容をICレコーダーに録音し、そのデータを「アミボイス」を使用して文字に起こし記録を残したいのですが、精度が良くなく困っています・・・。 今後も主に会議の内容を文字に起こして記録を残す目的で使用したいと思っていますので・・。 販売会社に問い合わせて設定変更(辞書の変更など)をして再度文字起こしをしましたが、残念ながらあまり結果は変わりません。 多少の文字の間違い等は仕方がないと思うのですが、現在はほとんど合っている単語が無いぐらいの状態です。 販売会社からは、「会議で話し合われた内容を聞きながら一人が全部読み上げ、それを文字に起こしては?」と言われましたが会議の度にそのような行為をするのは現実的ではありません。 「アミボイス」を使用(同様の音声認識ソフトでも)している方で、会議で話し合われた内容をある程度正確に認識される方法やコツをご存知の方がいらっしゃいましたら、アドバイスをお願いします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
まず最初に貴方自身でマイクに向かって音声認識ソフトで認識させてみてください いかに音声認識させることが難しい変わるでしょう 認識率を上げるためにしゃべり方を直す等しないと認識率は上がりません 不特定の音声認識ソフトで認識させることを意識しないで普通に話した言葉ではほとんど不可能です 録音した物を聞きながら手打ちする意外有りません ご質問への答えは 無い 無理 です
- air_supply
- ベストアンサー率65% (1211/1841)
アミボイスは、残念ながら使ったことがないのですが、他の音声認識はいじったことがあります。 結論から言うと、不特定な人間の音声を、精度良く認識させるのは、現状では難しいです。これが特定の人間なら、かなりの精度を持ちます。 要は学習させるかさせないかの違いですが、会議だと不特定多数の人がしゃべったりしますし、声の大きさも違ったりします。 メーカーの一人が会議の内容をしゃべれば、と言ったのはそう言う制限があるからでしょう。 複数の異なる音声認識は、技術的には可能だとは思いますが、普通のパソコンレベルの性能では、学習した一人の人間が精一杯ではないでしょうか。 スーパーコンピュータが必要かも知れません。そうなると、パッケージソフトウェアでは無理でしょう。
- 誠治(SEIZI・SAGE)(@romanda201)
- ベストアンサー率10% (293/2677)
>音声認識ソフト こう言うのが有る事自体が驚きだと思いますけど・・ 販売元にバージョンアップしてと言うしか無いでしょうね 音声分析と言ってもコンペアー(比較分析)作業でしょうから 似た声の人の場合は弱いでしょうね 人工知能型まで行って、初めて満足の行く物に成るんでしょうね 例えばGOOGLE翻訳と言うのが有るけどまだ今一歩のようにね・・ 時間が掛かると思います、そう思いますね