• ベストアンサー

カタログをデータベース化するのに最適なOCRソフトは?

OCRという便利なソフトがあることを教えていただきました。 仕事で使う、機械のカタログを読み込ませて 文字情報は、エクセルに取り込みデータベース化しようと考えています。 使い勝手の良いソフト・読み取り精度の良いソフトを教えてください! 今の所、スキャンは、CanonのMP830複合機があるので使用予定です。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

>スキャンは、CanonのMP830複合機があるので使用予定です これがあるなら、キャノンに相談しましょう。ソリューションとしてお願いすればいいです。 それが最もよいです。大手複合機メーカーは、それぞれソリューション部門を持っているので、それぞれオリジナルのアプリを開発しています。特にスキャナー+OCR+データーベースは、最も古くからあるソリューションです。20年位前からありますね。 何せバイトでその仕事していました。今じゃ考えられない、情報処理会社で住所録を作っていましたね(86系 DOS/V機486マシンOS2を使って、と言ってもわかんねだろうなあ~)。 業務用(ソリューション)と、市販の大きな違いは、DBと処理速度にある。10年くらい前だと、OCRエンジンに差があり、認識率の問題があったが、今はパソコンとスキャナーの速度が上がって、そんなにでない。 また、フォーマットを決めて、読み込むので、かなりの識字率になっている。 速度の面は、たとえば富士ゼロックスの業務用マシンだとA0サイズの白黒画像の読み取りで10秒前後で、DBに格納するのに10秒かからない。つまりほとんどストレスを感じないで、連続的にDBに格納していて、後でバックグランドでOCRをすればいい。 富士ゼロックスでも、リコーでもエプソン、キャノンでも同じソリューションをおこなっているので、マシンを選ぶというよりも、できる事のサービスを選ぶ事になる。 値段はソフト代だけで100万~1000万円くらいを覚悟しないとだめ。その代わり、市販で構築するよりも、絶対の認識率と効率化が計れる。市販だと格納先の構築だけで、そのつなぎの部分を自分で設計して、構築する必要がある。その辺を考えてみました? ちなみに、15年くらいの前のバイト先の識字率ですが、5、6ptの文字がA4にびっしりあり、ところどころ挿絵がある状態で1ページあたり、1,2文字の間違えです。業務用だと15年までもそのくらいの精度がありました。 まあ別売りだと下記のがあります。 http://biz.mediadrive.jp/wre01/

5gatu2009
質問者

お礼

ありがとうございます。 とてもそこまでの予算はないです。 仕事の片手間に、何とかしたい!!という希望なので 読み取り革命Liteのバージョンアップ版だと エクセルに落とせるようですが・・・ ちょっと考えてみます。

その他の回答 (2)

  • draft4
  • ベストアンサー率21% (1275/6017)
回答No.3

OCRは文字変換ソフトだからデータベース化とは別です データベースはエクセルでいいでしょう。 どのソフトも識字率が80%を超えないから、そのままだとデータベースになりませんよ

5gatu2009
質問者

お礼

ありがとうございます。 エクセルぐらいしか自分が使えないので そうするつもりです。 キャノンのプリンタについていたソフトでもそこそこ識字したので 市販のソフトでもいけそうな気がします。 不景気の折、1万円を超えると周囲の目が厳しくて・・。 所詮、以前の紙データ整理なので。 頑張ってみます。 皆様、ありがとうございました。

  • shintaro-2
  • ベストアンサー率36% (2266/6245)
回答No.1

>使い勝手の良いソフト・読み取り精度の良いソフトを教えてください! 認識率100%のソフトは存在しません。 まずは、MP830付属の読取革命liteで試してください。 webにカタログデータがあれば、テキストデータを取ることも可能かと思うのですが、お持ちのカタログは古いものだけなのですか?

5gatu2009
質問者

お礼

ご回答ありがとうございます。 早速、引っ張り出してみましたが ワードに保存されてしまって使いにくい!! 断念です。

関連するQ&A