OCRソフト e.typistエントリー
キャノンのドキュメントスキャナーを購入しました。スキャナーには、OCRソフト「e.typistエントリー」がついていたので、それをインストールしてスキャンし、文字認識の精度を確認してみました。
私がワードで作ったドキュメントをスキャンしたところ、文字の認識度としては、85%くらいは正しく文字が認識されてました(15%が間違い)。それはよいとしても、大学の過去問題の本(通称=赤本)のページをコピーしてスキャンしてみたところ、80%くらいがわけのわからない漢字と記号の文字列が認識されたんです。自分で作成したドキュメントをスキャンするために、このスキャナーを購入したのでなく、職業上、赤本をスキャンしてPCに保存しておくために、スキャナーを買ったのに、これでは意味がありません。OCRソフトできちんとしたものを選ばないと、文字認識において不備が発生することを、以前に秋葉原の店員にきいたことがあります。
いずれにしても、このような症状は、私の操作で不足部分があるのか、設定をきちんとしていないからなのか、またOCRソフト「e.typistエントリー」自体に性能の限界があるのか、わからないのです。それがわかれば改善できるのに、と思っています。
OCRソフトに詳しい人がいれば、この症状の改善策を教えてください。お願いいたします。