- 締切済み
AcrobatでPDFファイルにする方法
Acrobat 5.0でプリント物からOCRを使ってPDFファイル を作る方法がよくわかりません。PDFファイルはできるのですが、それを編集するためにはOCRソフトをプラグインする 必要があるようですが、そのプラグインの方法がわかりません。現在、OCRソフトは「読んでココ」を使っています。 もっと精度の高いOCRソフトが必要になるのでしょうか?
- みんなの回答 (4)
- 専門家の回答
みんなの回答
「読んでココ」を使ったこともありますし、Acrobat5.0も使っています。 まず、WEB上で公開する手順そのものをご覧ください。Acrobat5.0のヘルプから「Acrobatのヘルプ」をクリックすると、マニュアルが表示されますので、その73ページ以降をお読みください。 次に、リンク先が入っているとのことですが、上記マニュアルでWEBリンクの指定方法をご覧になり、その方法でその部分にリンクを張ればいいでしょう。 ただ、ここまで書いて思ったのですが、このAcrobat5.0についているヘルプ、私ですら何のことやらさっぱり分からないことを書いています。 ですから市販の教本を買ってきたほうがいいかもしれませんね。 さて、少し修正したいところがある、とのことですから、そのページのみ、別途再びスキャナで読み取らせて、「読んでココ」を使ってテキストデータのみを得ます。 あとは、ワープロソフトなどで、罫線を引いて元のページを再現しますが、写真については、別途再びスキャナで読み取らせて、JPEGファイルを作成し、ワープロで文中に挿入すればいいでしょう。 そのページをAcrobatPDFWriterで印刷、Acrobatで「ページの挿入」と、もとあったそのページの「削除」をすればいいわけです。 以上、分かりにくいと思いますが、これで目的とされているところが達成できるものと思います。
- tetsus_2000
- ベストアンサー率67% (467/696)
どうも、PDF自体に誤解があるようです。 PDFは基本的にワープロやDTPソフトなどで編集した文書内容を出力する際の形式であって、それ自体は編集するのには向いていません。 例えば、段落が行の右端で折り返し表示している場合、ワープロなどでは簡単に編集できますが、PDF形式では見た目の行端で必ず改行されていますので、編集を行うと、各行が凸凹になってしまいます。 また、文字列の装飾などもAcrobatでは行えません。 「自分で作った本(約30ページ)がある」とのことですが、その本を作成した際のファイル自体は残っていないのですね? でしたら、OCRソフトで認識した結果をその本を作成した際に使用したワープロソフト(Word?)の形式を指定して出力して、再度、そのワープロソフトで内容の編集を行い、そのワープロソフトからAcrobatを使ってPDF形式で出力するという手順になります。
- WillDesignWorks
- ベストアンサー率36% (1407/3901)
基本的に、pdfにしてしまうと編集は出来ません。むやみに編集したり改竄出来ないというのもpdfのウリなので。 なので、ocrソフトから一旦ワードなどの編集可能なソフトに貼り付けて、編集して、ハイパーリンクなどを設定した後に、pdfに変換します。
流れがよくわかりません。 プリント物 ↓ スキャン ↓ PDF作成 ↓ 文字データ 取り出し って書いてあるように思うのですが、何をしたいのかがぜんぜん分かりません。 テキストデータが欲しいのでしょうか? 「編集するために」って言う意味が分からないのです。 プリント物 ↓ スキャン ↓ OCRで 文字データ に変換 ↓ PDFファイルにする だったらまだわかりますが、でも何のためにテキストデータにする必要があるのですか? ぜんぜん分かりません。 目的を書いてください。
補足
ありがとうございます。 後に書いてある通りのことです。 自分で作った本(約30ページ)があるのですが その中には情報源や問い合わせ先など多くのURLも その中に記載されています。そこで、その文面をスキャナーで読み込んでPDFファイルにしたのち、リンクを指定 したり、ちょっと内容を変えようとしたのですが、 このままではできないことが、わかりました。OCRで 文字データに変換してそれをPDFファイルにする必要が あるようですが、罫線や写真イラストもあるので、うまい具合にいきません。肝心のURLアドレスも文字化けするばかりです。現在OCRソフトは「読んでココ」を使っていますが うまくいきません。
お礼
ありがとうございました。 Acrobat のHPの中で Paper Capture 機能 Acrobat 5.0 Windows 版では別売りプラグインだった OCR 機能が、Acrobat 6.0 では標準搭載されました。 紙文書をスキャンして Paper Capture を実行することで、PDF ファイル中のテキスト検索が可能になります。 これにより、画像文書の電子化が容易に行えます。 というのを見つけました。 やっぱり、さらにお金がかかりそうです。 ありがとうございました。