PDFファイルの編集
お世話になります。
スキャナ等で取り込んでPDF形式で保存したファイルを、取り込んだ解像度の悪いものの場合、影やゴミのようなものを後処理できれいな白黒ファイルに修正することは可能でしょうか?
今はPDFデータをまずAdobeReader7.0で読み込んでいるのですが、他のOCRで読み込むときにきちんと文字として認識できるように、
例えばPDFデータをAdobeReader7.0で読み込んだときに、表示の拡大率を上げてページコピーしてペイントなどに貼り付けたとしてもそれは見かけ上の問題だけでもとのPDFファイル自体を修正したことにはならないでしょうか?
PDFファイルをコピーしてペイントに貼り付けたもの(BMP)を読み込んでPDFファイルとして取り込んである文字をテキストに変換したいのですが、きれいに文字を認識してくれません。
例えばPDFファイルに「あいうえお」とあったとしますと変換作業後は例えですが「あ;11E!?」文字化けのようになってしまいます(うまくいく箇所もあるのですが・・・)。
本格読み取りと言うソフトを使ってExcelファイルに変換しようとしています。
わかりにくい説明ですみません。
どなたか良い方法をご教授ください。よろしくお願いいたします。