- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:PDF内の画像文字からテキストを抽出できるOCR)
PDF内の画像文字からテキストを抽出できるOCR
このQ&Aのポイント
- 20~30年前の部品のデータシートのPDFファイルからテキストを抽出する方法を教えてください。
- スキャナーで取り込んだデータシートの文字が画像としてしか認識されず、テキストをコピーできません。OCRソフトを使用しましたが、誤変換が多くて困っています。
- 画像で構成されたPDFファイルから文字を簡単に抽出できるOCRソフトはありますか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
少なくとも読んde!!ココでは 文字認識させる画像を回転させることが可能です。 自動の場合はかなり傾いていないと修正しませんが、 手動であればより少ない傾きでも修正可能です。 読取革命にもその機能はあると思います。 体験版でお試しください。 読んde http://www.epson.jp/download/dms/dl_yondekoko.htm 読取革命 http://panasonic.co.jp/snc/pstc/products/yomikaku/demo.html
その他の回答 (1)
- 某HN クロメート(Chromate)(@CoalTar)
- ベストアンサー率40% (705/1742)
回答No.1
>少スキャン時にページが傾いている感じがあるくらいで OCRに適すると思われるように加工してはいかがでしょうか? JTrimやIrfanViewといったフリーソフトでできます。 (カスタム)回転したり、ノイズ除去したり、リサンプリングして拡大処理するなど http://www.woodybells.com/jtrim.html http://www8.plala.or.jp/kusutaku/iview/
質問者
お礼
回答頂きありがとうございます。いろいろと、画像の修正で認識率もかわってきたりするようですね。試してみます。
お礼
回答頂きありがとうございます。”読んde!!ココ”を使ってみました。複数ページあるPDFを一気に読み込んでテキスト化したPDFにしてくれる機能はものすごく効率が上がって助かりますねw また出力されたPDFのフォントや書式も原本になるべく似せて構成してくれたりと結構びっくりしました! 購入検討してみます。