• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:PDF内の画像文字からテキストを抽出できるOCR)

PDF内の画像文字からテキストを抽出できるOCR

このQ&Aのポイント
  • 20~30年前の部品のデータシートのPDFファイルからテキストを抽出する方法を教えてください。
  • スキャナーで取り込んだデータシートの文字が画像としてしか認識されず、テキストをコピーできません。OCRソフトを使用しましたが、誤変換が多くて困っています。
  • 画像で構成されたPDFファイルから文字を簡単に抽出できるOCRソフトはありますか?

質問者が選んだベストアンサー

  • ベストアンサー
  • shintaro-2
  • ベストアンサー率36% (2266/6245)
回答No.2

少なくとも読んde!!ココでは 文字認識させる画像を回転させることが可能です。 自動の場合はかなり傾いていないと修正しませんが、 手動であればより少ない傾きでも修正可能です。 読取革命にもその機能はあると思います。 体験版でお試しください。 読んde http://www.epson.jp/download/dms/dl_yondekoko.htm 読取革命 http://panasonic.co.jp/snc/pstc/products/yomikaku/demo.html

diy_sunny
質問者

お礼

回答頂きありがとうございます。”読んde!!ココ”を使ってみました。複数ページあるPDFを一気に読み込んでテキスト化したPDFにしてくれる機能はものすごく効率が上がって助かりますねw また出力されたPDFのフォントや書式も原本になるべく似せて構成してくれたりと結構びっくりしました!  購入検討してみます。

その他の回答 (1)

回答No.1

>少スキャン時にページが傾いている感じがあるくらいで OCRに適すると思われるように加工してはいかがでしょうか? JTrimやIrfanViewといったフリーソフトでできます。 (カスタム)回転したり、ノイズ除去したり、リサンプリングして拡大処理するなど http://www.woodybells.com/jtrim.html http://www8.plala.or.jp/kusutaku/iview/

diy_sunny
質問者

お礼

回答頂きありがとうございます。いろいろと、画像の修正で認識率もかわってきたりするようですね。試してみます。

関連するQ&A