- ベストアンサー
pdf を編集可能な文書に変換できない
pdfの文書を通常はrtf で保存して編集上書き(翻訳)しているのですが、ときどきそれが画像として扱われてしまって画面上で編集できない場合があります。私はAdobe writerは6.0を使ってます。これは元のpdf制作側の問題でしょうか。文書にする方法があったら教えて下さい。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
元のPDF製作側の問題です。 一応、OCRをかけて、テキストを抽出し、それを利用する、という事が出来ないわけではないですが……Acrobat6の標準のOCR機能はあまり精度が高くない事、Acrobat上でOCRすると基本的に検索用なため、透明テキストとして画像の上に配置されるという事などが翻訳用としては問題点として挙げられます。上メニューの「文書」から「page capturer」です。 一応、OCRエンジンはAcrobat 7で精度がかなり上がってるので、利用するならAcrobat 7にバージョンアップする事をオススメします。もしくは、PDFが扱えるOCRソフトなどが他にあるかもしれません。 よく使われるOCRソフトであるところの「読んde!!ココ」では、PDFからの入力はできないようです。 http://ai2you.com/ocr/product/koko11/koko11.asp 一度画像に吐き出せばOCRできますから、PDFから一度画像に直してOCRをかけることを検討しても良いかもしれません。
その他の回答 (1)
- bec
- ベストアンサー率29% (151/507)
元のPDF文書が、画像データなのではないでしょうか? 配布用の文書では、テキストを埋め込んだ形ではなく、 2次利用防止の為、画像データの状態(スキャニングしたような状態)で PDF化して配布しているものも多く見られます。 この様な場合、テキスト抽出するに為にはOCR作業が別途必要になります。 ただし、この様な形式で配布してあるPDF文書は、つまり編集や再利用を防止する為ですから、 著作権等の侵害に十分注意を払って利用して下さい。
お礼
迅速なご回答、びっくりしました。ありがとうございます。たぶん制作側が"save as Certified document"にしたんでしょう。すっきりしました。
お礼
よーく分かりました。制作側に依頼しなおします。同時にAcrobat 7を検討してみます。