- ベストアンサー
最新のOCRソフトを紹介してほしいのですが。
今現在、会社でOCRソフトをつかってpdf化したプリントをmicrosoft wordでデータ化しています。 具体的にそのソフトとは、e-typist11.0というソフトを用いています。 しかし、バージョン9.0では文字化けがかなり起こったりします。 例えば、ギャル文字みたいに「ん」が「w」になったりでたいへんです。 バージョンが11.0になってからは、少しマシにはなったのですが、自分が思い通りになるようには読み込んでくれません。 そこで、eーtypistを超えるOCRソフトを自分でさがそうかと思っているのですが、なにせ値段が高いので、自分で探そうにもコストがかかってしまいます。そこで紹介していただけないでしょうか。(技術者、専門家もしくは経験者のみの意見をお願いします。)
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
読んde!ココ は評判が良いです。 企業さんなら、営業窓口へデモ等を依頼されては如何でしょうか。 http://ai2you.com/ocr/product/koko13/koko13.asp
その他の回答 (1)
IT屋の者で、現在は違いますが以前は画像処理関係に従事して いた者です。OCRは専門ではありませんが調査経験があります。 さて。 OCRと申しますのは、結構技術的には難しいものです。 一旦点々(ドット)情報に落とし込んだビットマップ情報を再度 形を見て、「ここら辺が文字かな」と類推させ。 よく似た文字をはめてみて、文書にしてみて。 さらにその文を辞書にあてて、語彙として正しいものをPickUpして 文章を再現しています。 ただ、英語と違い日本語は文字が莫大に多いので、100%判読率は 今の時代でもまだまだ難しいのではないでしょうか? もし、それが実現していれば、OCRソフトはもっと一般に流行る はずです。 通常は「9X.XX%判読率あり!」のレベルであり。 ま、打率99%でも100文字に一文字はランダムで間違ってくれるので 小説で例えれば1ページ4文字も誤植が発生しチェックがどうしても 必要で、文書作成としてはそれでも使いづらいものになっております。 ここはいくら高価なソフトを買ったとしても。 超高解像度でスキャンしたり、膨大な辞書ライブラリをもったりの レベルであり、打率は上がりますが、しかし100ではないでしょう。 ただ、工夫としてはいくつか要素がありまして。 「原稿がはっきりしていること」が重要な要素です。 例えば、スキャン密度をより高解像度にし、しかし256階調グレー スケール程度でノイズがでづらくしてスキャンしてみたり、 原稿が薄い場合に黒い紙をしいて、スキャン光で裏うつりが しづらくするなどの処理を施せば、既存のものでも判読率は アップするのは、こういったジャンルの常識となっております。 また、法人様で予算が百万単位でねん出できます場合で、OCR使用量が 大量にあり、業務としてコストメリットとして必要と位置づけられる のであれば、某コピー機屋、カメラ屋さんが行っている法人向け ドキュメントソリューションを見せていただくといいと思います。 この場合は読みづらい「原稿のサンプル」をいくつか用意してから そういうメーカさんに問い合わせ、デモを見せていただくとともに、 機器を数週間、トライアルで借りればいいと思います。 以上でいかがでしょうか?