- 締切済み
pdfのOCR化について
全くの初心者です。 代行業者に本のスキャンサービスを頼み、オプションでOCRをつけてもらいました。できたファイルをソニーリーダ ー用に濃さや余白など最適化(これをしないとはっきりと読みにくい)し、ダウンロードしたらOCRが使えません。 説明では、スキャン時にOCR化するので、それを最適化するとOCRが無効になるということでした。画像のみのpdf? ではこれにOCRをかけるには、どのようなソフトがありますか?有償で構いません。 よろしくお願いいたします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- keithin
- ベストアンサー率66% (5278/7941)
回答No.1
スキャンして画面に見えているのは,基本的には画像(紙焼きコピーといっしょ)です。 OCR処理をして,そこにPDF内のデータとして「透明テキスト」を埋め込み,重ねて表示できます。 最適化等をすると,透明テキストのデータが抹消されてしまうこともあります。 市販のOCRソフトで出来るものが多いです。 http://mediadrive.jp/products/et/index3-3.html http://www.epson.jp/products/ai/koko/product/koko13/function.htm フリーのトライアル版もダウンロードできますので,一回試してみてはいかがでしょう。 個人向けのスキャナで,これらのソフトのエントリー版がオマケソフトで付いてきていた時は,アップグレード版を利用できます。 また,Acrobat8 Standard以上を持っていれば,それでも出来ます。
補足
ありがとうございます。 体験版のe.tipistで、テストしてみました。 pdfを開くときにある程度、画像文字を綺麗にできるみたいですね。 どういう設定にしたら、OCR保存の時に劣化して見えなくなるのを防げますか?例えば、線は細く?太く?手ブレ補正、ぼやけ補正はどうすればいいですか?コントラストは? おわかりの方がいらしたら、よろしくお願いいたします。