- ベストアンサー
契約書をデータ保存したい。
アドバイスお願いします。 現在、紙ベースで保存されている契約書(大量) をデータでも保存したいと考えています。 理由は、例えば契約期間等必要な情報を拾う時に の時間的なロスを省きたいからです。 キャビネまでいき、契約書を初めから読むのではなく データで保存したものを何らかの検索方法で 必要な情報を利用したいのです。 その後私の業務に関する情報をエクセル等の一表に まとめたいと考えております。 紙ベースをデータへ変換するためには どのようにしたらいいのでしょうか?
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
契約書ですか、一般的な、OCR付きpdf作成業務の中で、ドキュメントフィーダーを使用しての、自動スキャンの大敵、鬼門です。 私の所では、ADF付き複合機を使用していますが、契約書の時は必ず原稿台を使用します。 おそらく、以下のようなバリエーションがありますよね? 1:1枚の紙ペラの物 2:紙がコピー用紙ではなく、半透明の薄い和紙のような物 3:袋とじ処理が施してある。バラしてはいけない。 1,2は、一見、ドキュメントフィーダー(ADF)の使用が可能なように見えますが、 実際やってみると、 収入印紙の剥がれ、めくれ 薄い用紙が、くちゃくちゃに などの発生があります。 3を含めて、契約書は、ドキュメントフィーダーを使用して、原本を自動スキャンするのは、あきらめて、フラットベッドスキャナー機能で、1ページずつ丁寧にスキャンする必要があります。 ISO14000を取得している会社の場合は、無理な方法ですが、環境負荷を無視すれば、コピー機で原稿台を使用して、コピーを取ってから、紙コピーをまとめてADFに掛けてスキャンする方法も実用的かと思われます。 スキャン時の解像度は、300dpi、白黒2値で良いと思います。 さて、スキャンした画像は、OCR付きpdf作成ソフト(ハード)により、pdfファイルにしましょう。 私の所では、 HG/PscanServPlus という、業務用ソフトを使用しています。 http://www.hypergear.com/pdf/pscanserv_plus_product.htm スキャナーのオマケのOCR付きpdf作成ソフトに比較すると、自動天地認識、自動の回転角度微調整、認識率の高さなどで、群を抜いた性能です。(価格も) 1ページにつき1本のpdfファイルや、1年分につき、1本のpdfファイルにするのではなく、1契約につき1本のpdfファイルにしましょう。 この様にして出来上がった、pdfファイル群を検索するための方法。 1:ゼロ円コース。 最も安価、安易なのは、 Adobe Reader (Adobe Acrobat)の、検索機能を利用して、フォルダー一括検索する方法 2:ゼロ円+努力コース フリーソフトの、Namazu を利用した、全文検索データベースを構築すること。 http://www.namazu.org/ 3:20万円コース 全文検索データベース機能付きの、NASにファイルを放り込む方法 http://www.iodata.jp/prod/network/fileserver/2004/fts-nas/index.htm 4:100万円オーバーコース 全文検索データベースをサーバーに導入する方法 http://www.evalue.jp/pro/vf/ などが、有ります。 繰り返しになりますが、くれぐれも、契約書原本を破損しないように、いきなりADFは、やめましょう。(トホホな経験者より)
その他の回答 (2)
- chirashizushi
- ベストアンサー率22% (571/2533)
大量の文書の場合は専用のドキュメントスキャナを使います。 連続してスキャンできる機種もありますので、ご予算に合わせて選んでください。 スキャナでスキャンしたらあとはOCRと呼ばれる画像データから文字情報を読み出すソフトがあるので、それでデータを読み込んでエクセルなどに流し込みます。 高い(^^;ドキュメントスキャナほど一連の作業が自動で出来ます http://arena.nikkeibp.co.jp/tokushu/gen/20050822/113196/
- telescope
- ベストアンサー率54% (1069/1958)
PDFで透明テキスト付きのファイルを作れるソフトがあります。 スキャナで紙文書をPDFに変換し、OCRでテキスト化したファイルを埋め込んで保存します。 画面ではPDF文書が表示されますが、裏に見えないテキストを保持していますので、前文検索が出来ます。 OCRでのテキスト化は、間違いもあり満足いくものではありませんが、検索に使うには十分です。 http://ai2you.com/ocr/product/scanpaper/feature01.htm (無料体験版もあります) http://www.sourcenext.com/products/pdf_scan/ 大量に処理するなら、 http://scansnap.fujitsu.com/jp/product/index.html http://cweb.canon.jp/documentscanner/dr-2050c/