大量OCR
下記のように大量文書のOCRファイリングを考えています。
(1)定型文書10種類 各数万枚から十数万枚 合計80万枚程度
(2)文字種類 すべて活字 手書きなし
(3)OCR方法 文書中の特定場所のみ数字10桁+英字数桁
(4)文書の種類 伝票、帳票 サイズA4 曲がった紙はほとんどなし
(5)誤認識の訂正方法
パートの派遣を利用して1枚あたり平均3秒程度の作業時間以下にしたい
(6)文書の検索方法
(3)の検索結果を検索キーにしたいと思います。
AdobeReaderの検索機能を使用
検索するのは社員の不特定者
(7)保存形式
PDF 透明テキスト付き
(8)スキヤナー
70枚/分 400DPI これから購入予定
(9)OCR ソフト
メディアドライブWinreaderProV10 これから購入予定
(10)OCR認識に使用するパソコン
2台 一台をOCR認識用 もう一台を認識結果の訂正用にして交互に使う
これから購入
何か問題点がありましたら教えていただけませんでしょうか
特に気になるのが下記の点です。
(5)誤認識の訂正方法
(6)(7)文書の検索方法 保存形式 この方法でいいのか ?
(9)OCR ソフト はこのソフトでいいのか
長くなりましたがよろしくお願いします