- ベストアンサー
PDFファイルのテキスト保存
PDFからテキストに保存する際、通常ならコピペでできるのですが、↓のファイルの場合、文字化けしてしまいます。何かいい方法はありませんか? http://kokushi.job.affrc.go.jp/H15genkyou/H15syousai/13L.pdf
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
見たところ、テキストのコピー禁止とかにはなっていないようですが、 フォントのエンコーディングがIdentity-Hになっているようですね。これが原因かと。 これは、対象のPDF内部だけで有効なエンコーディングなので。 Illustratorとかに読み込めば、再変換してもとのエンコーディングに戻せる場合もありますが、Acrobatだけだと無理なような。
その他の回答 (2)
- satoumasaru
- ベストアンサー率59% (325/545)
PDFファイルは作成の際に、いろいろな制限をかけることができます。ですから、作った人が、「ファイルをダウンロードできないようにする」「テキストでは読めないようにする」とかいうプロテクトをかけることができます。このファイルはそのようなプロテクトがかかっていますので、通常ではどうすることもできません。 私の思い浮かぶ方法といえば、デジカメで撮影するかスクリーン画面の保存をするとかして画像ファイルに変換し、OCRソフトで読むぐらいでしょうか。
お礼
回答ありがとうございます。 プロパティを見る限り、セキュリティはかかっておらず、内容の抽出とコピーも可能になっています。 フリーのOCRソフトがなかったため、お試し版で読み込んで見ました。結構変換ミスがあったので、これを直す作業と、自分でイチから入力するのと、どっちが速いか微妙なところです…。
- HAL007
- ベストアンサー率29% (1751/5869)
PDFは書類の改ざんを防止しることを目的にして いますからコピーは出来ません。 可能なのは編集ソフトですがパスワードなどでプロテクと されていると思います。
お礼
回答ありがとうございます。 書類の改ざんはもちろん禁止だと思いますが、コピー・配布は自由にできるものもたくさんあります。 今回のファイルも配布資料であり、転載も許可されているものです。
お礼
回答ありがとうございます。 エンコーディングのことはよく分からないのですが、「Identity-H」を使っているほかのファイルではテキスト保存ができたので、原因不明です…。 Illustratorでうまく再変換できることを祈ります。