PDF内の画像文字からテキストを抽出できるOCR

2012/06/05 14:11

このQ&Aのポイント

20～30年前の部品のデータシートのPDFファイルからテキストを抽出する方法を教えてください。
スキャナーで取り込んだデータシートの文字が画像としてしか認識されず、テキストをコピーできません。OCRソフトを使用しましたが、誤変換が多くて困っています。
画像で構成されたPDFファイルから文字を簡単に抽出できるOCRソフトはありますか？

diy_sunny
お礼率84% (387/459)

オフィス系ソフト
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

shintaro-2
ベストアンサー率36% (2266/6245)

2012/06/06 16:27 回答No.2

少なくとも読んde!!ココでは文字認識させる画像を回転させることが可能です。自動の場合はかなり傾いていないと修正しませんが、手動であればより少ない傾きでも修正可能です。読取革命にもその機能はあると思います。体験版でお試しください。読んde http://www.epson.jp/download/dms/dl_yondekoko.htm 読取革命 http://panasonic.co.jp/snc/pstc/products/yomikaku/demo.html

質問者

お礼 2012/06/08 09:43

回答頂きありがとうございます。”読んde!!ココ”を使ってみました。複数ページあるPDFを一気に読み込んでテキスト化したPDFにしてくれる機能はものすごく効率が上がって助かりますねｗ　また出力されたPDFのフォントや書式も原本になるべく似せて構成してくれたりと結構びっくりしました！　購入検討してみます。

その他の回答 (1)

某HN クロメート(Chromate)（@CoalTar）
ベストアンサー率40% (705/1742)

2012/06/05 14:54 回答No.1

>少スキャン時にページが傾いている感じがあるくらいで OCRに適すると思われるように加工してはいかがでしょうか？ JTrimやIrfanViewといったフリーソフトでできます。 (カスタム)回転したり、ノイズ除去したり、リサンプリングして拡大処理するなど http://www.woodybells.com/jtrim.html http://www8.plala.or.jp/kusutaku/iview/

質問者