- ベストアンサー
PDFファイルの編集
お世話になります。 スキャナ等で取り込んでPDF形式で保存したファイルを、取り込んだ解像度の悪いものの場合、影やゴミのようなものを後処理できれいな白黒ファイルに修正することは可能でしょうか? 今はPDFデータをまずAdobeReader7.0で読み込んでいるのですが、他のOCRで読み込むときにきちんと文字として認識できるように、 例えばPDFデータをAdobeReader7.0で読み込んだときに、表示の拡大率を上げてページコピーしてペイントなどに貼り付けたとしてもそれは見かけ上の問題だけでもとのPDFファイル自体を修正したことにはならないでしょうか? PDFファイルをコピーしてペイントに貼り付けたもの(BMP)を読み込んでPDFファイルとして取り込んである文字をテキストに変換したいのですが、きれいに文字を認識してくれません。 例えばPDFファイルに「あいうえお」とあったとしますと変換作業後は例えですが「あ;11E!?」文字化けのようになってしまいます(うまくいく箇所もあるのですが・・・)。 本格読み取りと言うソフトを使ってExcelファイルに変換しようとしています。 わかりにくい説明ですみません。 どなたか良い方法をご教授ください。よろしくお願いいたします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
OCRソフトの読んde!!ココとかe.Typistでは PDFファイルを取り込んで、カラー情報を削除し、ゴミなど消して 白黒の画像ファイルや新たなPDFファイルを作成できます。 解像度を上げることは出来ないです。 Adobe Photoshop Elementsなどで、PDFファイルを画像ファイルに することは可能です。ゴミなど消して白黒にする、解像度を上げるのも可能です。 OCRソフトでは解像度400dpi以上で取り込むのが普通です。 >PDFファイルをコピーしてペイントに貼り付けたもの(BMP) では解像度が低すぎるので、きれいに文字認識できないのは当然です。 読んde!!ココとかe.Typistだと解像度の低い物でも補う機能などが有るのである程度文字認識してくれますし、 PDFファイルを取り込んで文字認識できるので、この手間はいりません。 元の原稿があるなら、本格読取でスキャナから取り込むのが一番です。 PDFファイルしかないのなら、 いきなりPDF to Data Professional 2とかいきなりPDF to Data 2、 (ソースネクスト) やさしくPDF OCR v2.0(メディアドライブ) などの利用を検討して下さい。
その他の回答 (2)
- violet430
- ベストアンサー率36% (27472/75001)
pdfから直接取り込むのは駄目ですか? http://www.vector.co.jp/soft/winnt/writing/se347707.html こちらはPdfコンバータです http://www.antenna.co.jp/RTC/RtcPDF/
お礼
補足にお礼を書いてしまいました。 すみませんでした。
補足
ありがとうございます。 試してみます。
bmpはたしか75dpiという解像度で、あまりOCR向きの解像度でないと 思います。 文字部分はtiff形式(300dpi?)にしてPDF化した方が認識率が よくなります。
お礼
補足にお礼を書いてしまいました。 すみませんでした。
補足
即座の回答ありがとうございます。 対応遅くなり申し訳ありませんでした。 回答内容知りませんでした、勉強になりました。
お礼
補足にお礼を書いてしまいました。 すみませんでした。
補足
丁寧に多くの情報ありがとうございます。 教えて頂いた方法はまだ具体的に試していないので少し検討、 使ってみる等(購入も考え)してみます。 ありがとうございました。