• ベストアンサー

PDFの文字データを外す方法

早速質問させてください。 文字、写真が記載されている書籍をPDFにしました。 そのPDFには書籍のテキストデータが入ってしまいました。 (OCRというのかな?PDFの文字をコピぺでテキスト貼付けが出来るようになっている) このPDFからテキストデータを抜く方法はないでしょうか。 ちなみに書籍は既に手元にございません。 50ページ~150ページくらいのPDFファイルが 60ファイルくらいあるので、 なるべく簡単な方法をご教授いただきたく存じます。 宜しくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • dodemoii
  • ベストアンサー率59% (769/1282)
回答No.3

こんにちは Acrobat(有償)の場合は、文書の検査から非表示テキストを削除すること が可能です。但しAcrobatXではメニューが違うので留意。 今Acrobatが無くても体験版なら使えるかもしりませんね。 http://www.adobe.com/go/tryacrobatpro_jp/ 画像で書き出して、再度PDFを作成はいかにも面倒と思います。 PDF作成ソフトをお持ちでしたら、Adobe Readerの印刷の詳細設定から 「画像として印刷」にして作り直す方法も考えられます。 参考フリーのPDF作成ソフト例CubePDF http://www.forest.impress.co.jp/lib/offc/document/pdf/cubepdf.html

その他の回答 (2)

  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.2

写真だけにしたいということでしたら Acrobatの文書処理メニューに 「すべての画像を書き出す」 というのがあります。

kikaijima01
質問者

お礼

ご解答ありがとうございます。 Acrobatを持っておりません。 Acrobat以外で透明テキストを削除できないでしょうか。

  • shintaro-2
  • ベストアンサー率36% (2266/6245)
回答No.1

スキャンした文書でPDFにテキストデータがあるものは 一般に透明テキストと呼ばれています。 >このPDFからテキストデータを抜く方法はないでしょうか。 「抜く」というのがタイトルどおり外すということで 削除という意味であれば、 お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。 そんな選択肢が無く、単に「テキストデータをコピーされたくない」ということであれば セキュリティを変更してテキストをコピー禁止にすれば良いと思います。 まあ、いずれにしても全ファイル一括処理は難しいのではないでしょうか? 次回から電子化する際にはOCR処理を停止しておくということですね。

kikaijima01
質問者

お礼

早速のご解答ありがとうございます。 OCRの精度が悪く、 透明テキストが実際とは違う文字になっている箇所があるため、 削除したいのですが。。。 >お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。 当方アクロバットリーダーのみしかもっておりません。 上記の画像として保存が出来るソフトを教えていただけますでしょうか。

関連するQ&A