- ベストアンサー
日本語英語同時に認識できるOCRは
英語と日本語の文を同時に認識するOCRは ないでしょうか? e-typist 8.0と「読んでココ」の2年ほど前のversionを使っています。日本語に標準をあわせれば 英語も認識されヒット率もかなり高い(漢字も混ざるが)ですが、2者ともに単語が繋がってしまい分かち書きになりません。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
OCR製品って、人によって、また、目的によって、期待される認識率が全然異なっているため、評価がとても難しいですよね。A4一枚に間違いが何カ所かあっても、全体として意味がわかればよしとするケースもあれば、限りなく0に近くないといけないというケースもありますし.... 数年前に「読んde!!ココ」を使ったことがありましたが、最近、その新バージョンを入手して、何年ぶりかに使ってみました。 既定値のままだと大差なくても、認識モードや専門用語辞書などの機能をうまく設定すれば、認識率はずっと向上することを確認しました。 また、ご指摘の日英混在もわたしが用意した原稿では結構うまく認識し分けてくれました。ただ、「単語が繋がってしまい分かち書きになりません」ということは元原稿自体の単語間スペースが狭すぎるのでしょうか。 一度、最新版の試用版をダウンロードして、試してみてはいかがでしょうか。
その他の回答 (1)
原稿の質によってOCRの結果は大きく異なります。 ソフトに添付されているお試し原稿を見てください。 上質の紙に標準的なホントを使ったくっきりした文字ですよね。普段目にしないような。 企業や役所で使用するOCRソフトの値段は100万円以上と聞いて、我々の使用するOCRにあまり期待はしなくなりました。それでもVupの知らせが来ると付き合ってしまいます。確かに少し改良はされていますが、原稿の質で大きく左右される点は同じです。訂正するより、読み入力した方が速いので、指慣らしのつもりでそうしています。画像処理ソフトをお持ちでしたらそちらで原稿を修正しファイル保存してからOCRソフトで読み込むと好結果が得られることもありますが。
お礼
”読み入力した方が速い”ことはわかりますが、 原稿の絶対量が多い場合は大変だと思います。 ありがとうございました。
お礼
すいません。スキャナの調子が悪くお礼が遅れました。最新版の試用版をダウンロードしてみます。 ありがとうございました。