- ベストアンサー
PDFからの変換
ワード等で作成した文書などをスキャナでPDF化するという物凄く単純なことは自分でも出来ますが、一度PDF化したものを元に戻すというのは難しいのでしょうか?最低限テキストデータだけでも元のデータに復元することは可能なのでしょうか?それともPDFとはあくまで画像データの一種でありテキスト等への変換は不可能でしょうか。そもそも画像データはテキストに出来ないのでしょうか。ソフトがあれば可能と聞いた気もするのですが。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
>ワード等で作成した文書などをスキャナでPDF化する 通常はワードなどから直接PDFに変換します。その方法だと見た目はPDFのデータでも内容は単なる画像データとなってしまうので、単語の検索などが出来なくなります。 PDFからワードなどのファイル形式に変換するにはいくつかの方法があります。 1.Adobe Acrobatの書き出し機能でワードに変換する。 2.変換用のソフトを使う。 3.一旦印刷したものをスキャナで読み込み、OCRソフトでテキスト化する。 1の方法は元になるPDFがワードなどから直接変換されたものであることが条件です。スキャナで読み込んだものは画像データとなっているので文字認識が出来ず、変換できません。又、そうでなくてもうまく変換できないことが多いです。 2の方法も同様です。ただ、そういったソフトの場合、OCR機能を応用しているものが多いですから、うまくいく場合もあります。ただし、そのようなソフトだと誤変換も多いです。きちんと文字認識して変換するタイプは誤変換が少ないです(その分高価)。 3の方法は一番遠回りなやり方で、誤変換もし易いでしょう。 2の方法を採る場合、変換率が最も高いとされているのは下記のソフトです。 http://www.antenna.co.jp/rpd/
その他の回答 (1)
- l-3-ly
- ベストアンサー率49% (394/793)
PDFファイルをWord形式に変換 リッチテキストPDF(有償ソフト) http://trendy.nikkeibp.co.jp/article/col/20050713/112801/?P=1 と言うソフトがありました。google等で検索すれば他にも ソフトがあるかもしれません。 写真で文章を写したような文章が画像ファイルになっている 場合は、OCRと言うソフトを使ってテキスト形式に抽出する 作業が必要になります。 PDF OCRで検索した所、 http://www.google.co.jp/search?hl=ja&q=pdf+ocr&lr= 無料でPDFのOCR「クセロReader ZERO」 http://www.moongift.jp/2007/11/xelo_reader_zero/ と言うソフトがありました。このクセロReader ZEROを使って 文章をプレーンテキストに変換すれば、文字データとして 使えると思います。
お礼
こちらもご丁寧に有難う御座います。試してみます。
お礼
早速どうも有り難う御座いました。ただ確実にコレというのは難しいのですね。ご紹介頂いたものをためしてみます。