• ベストアンサー

PDFファイルのテキスト保存

PDFからテキストに保存する際、通常ならコピペでできるのですが、↓のファイルの場合、文字化けしてしまいます。何かいい方法はありませんか? http://kokushi.job.affrc.go.jp/H15genkyou/H15syousai/13L.pdf

質問者が選んだベストアンサー

  • ベストアンサー
  • yaksa
  • ベストアンサー率42% (84/197)
回答No.3

見たところ、テキストのコピー禁止とかにはなっていないようですが、 フォントのエンコーディングがIdentity-Hになっているようですね。これが原因かと。 これは、対象のPDF内部だけで有効なエンコーディングなので。 Illustratorとかに読み込めば、再変換してもとのエンコーディングに戻せる場合もありますが、Acrobatだけだと無理なような。

non209
質問者

お礼

回答ありがとうございます。 エンコーディングのことはよく分からないのですが、「Identity-H」を使っているほかのファイルではテキスト保存ができたので、原因不明です…。 Illustratorでうまく再変換できることを祈ります。

その他の回答 (2)

回答No.2

PDFファイルは作成の際に、いろいろな制限をかけることができます。ですから、作った人が、「ファイルをダウンロードできないようにする」「テキストでは読めないようにする」とかいうプロテクトをかけることができます。このファイルはそのようなプロテクトがかかっていますので、通常ではどうすることもできません。 私の思い浮かぶ方法といえば、デジカメで撮影するかスクリーン画面の保存をするとかして画像ファイルに変換し、OCRソフトで読むぐらいでしょうか。

non209
質問者

お礼

回答ありがとうございます。 プロパティを見る限り、セキュリティはかかっておらず、内容の抽出とコピーも可能になっています。 フリーのOCRソフトがなかったため、お試し版で読み込んで見ました。結構変換ミスがあったので、これを直す作業と、自分でイチから入力するのと、どっちが速いか微妙なところです…。

  • HAL007
  • ベストアンサー率29% (1751/5869)
回答No.1

PDFは書類の改ざんを防止しることを目的にして いますからコピーは出来ません。 可能なのは編集ソフトですがパスワードなどでプロテクと されていると思います。

non209
質問者

お礼

回答ありがとうございます。 書類の改ざんはもちろん禁止だと思いますが、コピー・配布は自由にできるものもたくさんあります。 今回のファイルも配布資料であり、転載も許可されているものです。

関連するQ&A