- ベストアンサー
PDFの文字データを外す方法
早速質問させてください。 文字、写真が記載されている書籍をPDFにしました。 そのPDFには書籍のテキストデータが入ってしまいました。 (OCRというのかな?PDFの文字をコピぺでテキスト貼付けが出来るようになっている) このPDFからテキストデータを抜く方法はないでしょうか。 ちなみに書籍は既に手元にございません。 50ページ~150ページくらいのPDFファイルが 60ファイルくらいあるので、 なるべく簡単な方法をご教授いただきたく存じます。 宜しくお願いいたします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは Acrobat(有償)の場合は、文書の検査から非表示テキストを削除すること が可能です。但しAcrobatXではメニューが違うので留意。 今Acrobatが無くても体験版なら使えるかもしりませんね。 http://www.adobe.com/go/tryacrobatpro_jp/ 画像で書き出して、再度PDFを作成はいかにも面倒と思います。 PDF作成ソフトをお持ちでしたら、Adobe Readerの印刷の詳細設定から 「画像として印刷」にして作り直す方法も考えられます。 参考フリーのPDF作成ソフト例CubePDF http://www.forest.impress.co.jp/lib/offc/document/pdf/cubepdf.html
その他の回答 (2)
- chieffish
- ベストアンサー率44% (1149/2554)
写真だけにしたいということでしたら Acrobatの文書処理メニューに 「すべての画像を書き出す」 というのがあります。
- shintaro-2
- ベストアンサー率36% (2266/6245)
スキャンした文書でPDFにテキストデータがあるものは 一般に透明テキストと呼ばれています。 >このPDFからテキストデータを抜く方法はないでしょうか。 「抜く」というのがタイトルどおり外すということで 削除という意味であれば、 お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。 そんな選択肢が無く、単に「テキストデータをコピーされたくない」ということであれば セキュリティを変更してテキストをコピー禁止にすれば良いと思います。 まあ、いずれにしても全ファイル一括処理は難しいのではないでしょうか? 次回から電子化する際にはOCR処理を停止しておくということですね。
お礼
早速のご解答ありがとうございます。 OCRの精度が悪く、 透明テキストが実際とは違う文字になっている箇所があるため、 削除したいのですが。。。 >お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。 当方アクロバットリーダーのみしかもっておりません。 上記の画像として保存が出来るソフトを教えていただけますでしょうか。
お礼
ご解答ありがとうございます。 Acrobatを持っておりません。 Acrobat以外で透明テキストを削除できないでしょうか。