- ベストアンサー
正確にスキャンしてくれるOCRを探しています
現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております ソフトはe.Typistのエントリーを使用しております 印刷文をOCRでスキャンし、 テキストデータにしたいのですが (PC内で改変できるtextファイルです、画像ではありません) OCRの精度が悪く 意味不明の文字が多数出てきます 例えば http://www.abc.com というURLが印刷物にあったとしたら OCRはhttp://wwwabccom というように認識してしまいます もっと精度の高いOCRが欲しいのですが どうすれば良いのでしょうか? 良いスキャナーに変える、あるいは 良いOCRソフトに変えるのでしょうか? また、お勧めがあったら教えてください よろしくお願いします
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
AIソフトの「読んでココ!」と言うソフトが認識率95%以上と高いですが、残り数%がくせ者です。 数万円で買えるOCRソフトではAIソフトの物が今のところ一番優秀かな? スキャナ自体は問題ないですが、読み取り解像度が低すぎると認識率は悪くなります。
その他の回答 (5)
- travelKENKEN
- ベストアンサー率36% (1982/5385)
下手にスキャナの解像度を上げると、字体や文字の大きさ、原稿の状態によっては、かえって誤認識が増えますね。(体験談) お使いのマシンの解像度や解像度の変更が可能かわかりませんのでなんともいえませんが、解像度を落とすことで認識率が上がる原稿もあります。 変えるならソフトでしょうが、高度なソフトはそれだけ、PC本体のマシンパワーが必要になります。 私は、3~4年前に買ったe.typistで満足しているというか、この程度だろうと諦めてますので・・・
- big_dipper
- ベストアンサー率31% (78/246)
当該機を所有していないので一般論となりますが、No4氏と基本的には同じで、経験的には解像度が認識率にかなり効きます。 あと、 ○読み込ませるとき水平垂直を正確にする。 読み取りエンジンによっては傾きに弱いものがあったりするようです。 ○読み取り時の暗い明るいを調整する。 印刷物の地色が暗いものだったりすると読み込み時のバックグランドノイズが増えて、質問者例示のようなドットをノイズと誤認したり、逆にノイズをドットやカンマと誤認したりすることがあります。 ○読み込み時ガラスに密着させる。 特に書籍ものの場合閉じている部分がガラスから離れるため、スキャナの被写界深度が浅いとボケますし、読み取り画像も歪むので認識率に影響を与えます。 他の回答者も言及していますが、認識率にはある程度限界がありますし、誤認した部分が結構ポイントになったりします。 それを理解した上で各種調整などで認識率を向上させるのが良策かと思います。
- 4G52GS
- ベストアンサー率71% (1969/2770)
プリンタの修理屋です。 #2さんに一票。 MP370は(失礼ですが)比較的ローグレードな機種ですがスキャナの能力は充分なはずです。 対策としては原稿台のガラスを掃除する。(ホコリなどがあるとそれも込みで変換しますので) 解像度を上げる、などでしょう。 ただ、どこまで行っても付いて回る問題でしょう。 30年もまえだと「パターン認識」はコンピューターには不可能と言われていて、基本的には現在でも変わっていないように思います。 ソフトの進化で似たような作業が可能になってきているわけですが、 昔を考えると、たいした進化だと感心します。
- Fukurow
- ベストアンサー率43% (50/114)
MS-DOSの時代からもうかれこれ20年近くOCRを使っています。 自信を持って断言できます。「不可能」だと。 画像データから判断して文字データに変換するという方法をとっている限り、人間の目でさえ誤読があります。ましてや「機械」の場合は、推して知るべしではないでしょうか。 ただ、ほとんどのOCRソフトには、学習機能が備わっています。これを活用することにより、ある程度の精度アップは可能でしょう。
- k-josui
- ベストアンサー率24% (3220/13026)
ん~難しいですね・・・・OCRは 原稿の鮮明度とOCRソフトの精度でしょうか? スキャナの精度はそんなに影響しないような気がしますが。 私も時々使いますが、手入力の方が早い事もありますね。。。 回答でなくすみません。