- ベストアンサー
PDFの変換ソフトについて
会社の資料を整理したいのですがペーパーでなくデータ(テキストファイル)で保存したいと思っています。資料をスキャンしPDF化するのはすぐですが画像データはPCの容量を食うのでPDFファイルから変換ソフトを使ってテキスト化できればと思っています。フリーソフトでFirstPDFというものを使ってみましたが、文字化けが多くうまく変換できません。よいソフトを紹介してください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
無理だと思います。 2~3年前の事例ですが、市販の数万円のOCRソフトを使っても、和文に比べて簡単そうな英文でさえ、字体によっては1とlとか、mとrn等の認識エラーが多発して手直しを余儀なくされました。もし、手の届く価格で人間の様に前後の文脈まで認識して判別してくれるソフトが開発されても、100%完全はあり得ないと思います。多量の文書を確認・修正するのは不可能でしょう。 現在のご方針ですと、挫折する事請け合いですので、方針を転換して容量の大きな記憶媒体を準備される方が賢明です。どんな文書が対象か存じませんが、白黒二値なら、解像度を結構上げてもさほど巨大なファイルにはなりません。また、最近のドキュメントスキャナーのカラー高圧縮モードは、色調の差が大きな文字が判別できるレベルの画質ですが、ファイルは相当小さくなります。 また、最近のスキャナーは、スキャンと同時にOCRして、pdfにテキスト情報を付与してくれますので、検索の助けにはなります。(精度は上述の通りなので、検索してヒットしなくても存在しないと思ってはいけませんが) そんな事は無いという情報がありましたら、当方も教えて欲しいです。
その他の回答 (4)
- mitarashi
- ベストアンサー率59% (574/965)
#1です。 奇しくも当方が使用しているのは、#2さんお勧めのソフトで、ドキュメントスキャナーのおまけをアップグレードしたものです。既に最新版ではないと思いますが。 ちょっと言葉足らずのところがありましたので、補足させていただきます。 >最近のドキュメントスキャナーのカラー高圧縮モードは、色調の差が大きな文字が判別できるレベルの画質ですが、 →色調の差が大きな文字の色の違いが判別できるレベルの画質ですが 以上、ご参考まで。
- DOUGLAS_
- ベストアンサー率74% (397/534)
>会社の資料を整理したいのですがペーパーでなくデータ(テキストファイル)で保存したい >文字化けが多くうまく変換できません。 「文字化けが多」いかどうかは分かりませんが、下記をお試しください。 1)PDFを、拡張子「tif、tiff」(Tagged Image File Format)で画像化します。 2)画像化された「tif」ファイルを Microsoft Office Document Imaging で開きます。 3)予め、[ツール(T)] - [オプション(O)] - [OCR] タブ で [OCR 言語(L):] の下の選択肢から「日本語」を選択しておきます。 4)[ツール(T)] - [OCR を使用してテキストを認識(R)...] し、[ツール(T)] - [テキスト を Word に送る(T)...] します。 5)ワードで、拡張子「txt」で保存します。
お礼
ありがとうございました。
- kyuhan
- ベストアンサー率23% (43/181)
プリンターのメーカーは何処でしょうか?キャノンでしたら?PDFからテキストファイルに変換出来ます! またAdobe Reader でもPDFファイルをテキストファイルに変換出来ますが?
お礼
ありがとうございました。参考にします。
- bakamr
- ベストアンサー率32% (149/463)
有料ですが、e.typist がお勧めです。 http://mediadrive.jp/products/et/
お礼
ありがとうございました。参考にします。
お礼
ありがとうございました。参考にします。