- 締切済み
Adobe Acrobat の日本語認識能力
紙文書や書籍をPDF化し、スキャナで読み取ったあと検索できるようにしようと思っています。 そこでadobe acrobatを使おうと思うのですが、日本語の認識能力は、他のOCRソフトに比べどの程度のものなのでしょうか? もし低いのならば、どうやって認識能力を高めることができるのでしょうか?
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- te20
- ベストアンサー率35% (14/40)
回答No.1
Acrobat 7のOCRは「読んde!!ココ」のエンジンを使っているます。Acrobat 8のOCRのエンジンが何かは分かりませんが、使った感触では7のときと変わらないようなので、同じエンジンを使っていると思われます。ただ、最新のエンジンではないので、それ以上の精度を求めるのであれば、市販のOCRを使うのが良いと思います。 ただ、原稿の種類によりますが、最新のものを使っても、100%近くの認識率にはなりませんので、検索目的であればほどほどのところで満足しておくのがよさそうです。 経験的には、段組が複雑だったり、雑誌のように背景に色がついていたりすると、認識率が落ちるようです。