• ベストアンサー

ある、OCRソフトですが、これくらいのことも認識しません(怒)

お世話になります。 ある、OCRソフトを購入しました。 さっそく使ってみたところ、 数字の・・ -25.04   これすら、まともに、認識してくれません。 フォントサイズは、約9 なので、そんなに大きい 文字とは、言えませんが、難しい漢字ではなく、 ただの数字なのに、認識結果をみると、 2801 とかなってしまいます。 マイナス記号も、小数点も、さらに数字でさえ 間違いをしています。 現在のOCRソフトってそんなものなのでしょか? これくらいのことも出来ないのでは、売り出している こと事態、サギではないのか? というくらい思います。 正しく認識してくれるOCRがあれば、すごく 便利なのですが・・・ どなたか、 フォントサイズ・・・ ”9” 文字 ・・・・・・・ ” -25.04 ” これを、ワードに書いて頂き、それを、 画面キャプチャーして、文字の、”-25.04 ”だけを 切り抜き、JPEGで、保存。 保存したJPGを、OCRソフトに読み込ませて、 処理させて、 その結果、 テキストとして、 ちゃんと、 -25.04 と してくれる、 OCRソフトを知りませんか? すみません、宜しく御願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.5

私も1泊出張でした。 52.17 14.29 45.83 64.45 0  → -A18 0 一〇.24 30.3 18.18 812 812 338 434 7行目以外は右端揃い。 e-Typist V10.0による認識→excel(表示形式=標準、横配置=標準、その他=標準 の条件)に転送→本レスへのコピペ(copy&paste)の結果です。 5行目に中身(セル内)は →の通り-A18となっています。 6行目は中身も0で、小数は認識していないですね。 7行目は表示の通りの中身です。 これに依れば、5~7行以外は正常認識、数値認識(7行目以外)は右端揃いとなっています。 多少、認識条件設定にも依るかも知れません。 認識率が悪いので購入後あまり使っていません。各社とも体験版(2week?だったかな無料)が有りますからお使いになって見られたら如何ですか?。現在はVerUPもしているはずです。 数字以外も含め良いのが見つかったら、私も知りたいのでここに追記ください。

nariyuki
質問者

補足

Setsuyakuyaさん こんばんは。 >私も1泊出張でした。 お疲れ様です。 Setsuyakuyaさんに頼りっぱなしでは、イカン ということで、e-Typist を検索してみました。 ベクターにver11がありました。 さっそく試してみましたところ、ある条件なら なんとか使えそうです。 認識する、文字を、 確実に 0~9と、記号の . と - だけに設定。 これで、試してみました。 でも、フォント8くらいをそのまま読み込むと やっぱりダメですね! そこで、ダメもとで、読み込む画像そのものを、 他の画像ソフトで2倍に拡大して、その後、 読み込み認識させて見ました。 すると、100%の認識です。 安心して、任せられそうです。 HP、新聞、などの確実にきれいなフォントであれば、 認識する、文字を絞り込み設定しておけば結構 いけるかもしれません。 フォント大きさは、14くらいであれば、大丈夫みたいです。 (これは、他画像ソフトを使用して、前もって拡大しておいてください) では。

その他の回答 (4)

回答No.4

e-Typist Ver10持っています。 次の通りでよろしいでしょうか?。 1.MS-Wordでご指定の通りfont size=9/MS明朝 2.Print screenでキャプチャー 3.MSペイントに貼り付け/切取り/jpg保存 4.e-typist V10で画像Fileを開く/文字認識 で正常?に認識しました。(全て全角文字として) これで宜しいでしょうか?。 私もこれまで何本ものOCRソフトを購入しましたが(1つ前が「読んでココV5」、その後、各社の体験版、そして現在の物) それでも未だに文字認識能力が足りなく不満たらたらです。 誤認識が多く、結局手入力の方が速い場合が多いです。 もう一つ、翻訳ソフトの認識はもっと悪く、「訳せゴマV6」以降verUp出来ていません。 どなたか、良いソフトご存じないでしょうか?。相乗りで申し訳有りませんが‥‥。

nariyuki
質問者

補足

Setsuyakuyaさん こんばんは。 返答遅れてすみません。(出張中で、今帰りました) さて、 Setsuyakuyaさんお持ちの、e-Typist Ver10で、 見事、認識されたとのこと。 うれしい限りです。 確認の為に、もう一度お願いできますか? 次のところに、bmpファイルを、貼り付けています。 ttp___up.spawn.jp_file_up21364.bmp (頭のhは、書き足して下さい) 画像の中身は、数字です。 (13行の数字が、書かれています) このbmpファイルを、読み込んでもらい、 もう一度、e-Typist Ver10で、 正確に、テキストとして、変換してくれるのか? 見てみたいです。 変換後の数字を、ここの、新しい回答に、貼り付けて 頂ければ、本当に、正解して変換できたと確認出来ます。 9フォントより、実際は、もう少し小さい文字大きさに なります。 また、明朝体では無く、ゴシックぽい字体となります。 すみません、お願いばかりで、どうぞ宜しくお願いします。 >それでも未だに文字認識能力が足りなく >不満たらたらです。 私も、そうです。 私の場合、この数字でさえ、全然ダメなので、 もう、本当に困っています。 数字でさえ、出来ないのであれば、売り出すな! といいたいくらいです。 各メーカーは、実際の使用状況、お客の声を聞くなり 改善に、もう少し力をいれてほしいと思います。 長くなりました。

回答No.3

9ポイントの画面表示の文字ってことは、Windowsだと仮定して、1文 字の大きさがせいぜい12x6ドットですね。これでは初期状態では御 認識するのが当たり前です。しかもJPEGなんて輪郭ボケボケの形式 とは… OCRソフトは300~400dpiの白黒2値でスキャンした画像を読むように 設計されています。1つの数字は60x30ドットくらいのディテールを 持つことが期待されますので、nariyukiさんのような条件では無理 です。ま、JPEGにさえしなければ、学習機能で辞書を整備していヤ ルだけで、アッという間に正しく認識するようになるでしょうけど ね。

nariyuki
質問者

お礼

書き忘れました。 JPEGにこだわりはありません。 保存する、画像形式は、より鮮明な、bmpでもOKです。 よろしくお願いします。

nariyuki
質問者

補足

grumpy_the_dwarfさん コメントありがとうございます。 はい、確かに、JPEGでは、Bmpより、ボケると思います。 >9ポイントの画面表示の文字ってことは、 >Windowsだと仮定して、1文字の大きさが >せいぜい12x6ドットですね。 ウィンドウズですので、12x6ドットですね。 >学習機能で辞書を整備してい >ヤルだけで、アッという間に正しく >認識するようになるでしょうけど 私もそのような機能があるソフトなら大丈夫では ないかなと思います。 数字0~9、+と-、それに.(小数点)だけ、認識して くれれば、いいわけですので、学習させるのも、 手間とらず、苦労しないで、いけると思います。 その、学習機能がついている、OCRソフトには どのようなものがありますか?

  • merlionXX
  • ベストアンサー率48% (1930/4007)
回答No.2

原因は画面キャプチャーだからではないでしょうか? プリントしてスキャナーで読んだら、英字や数字であればスキャナー付録のおまけOCRソフトでも99%以上は正しく認識しますよ。 わたしのは、e-Typistのオマケバージョンですが。

nariyuki
質問者

お礼

書き忘れました。 JPEGにこだわりはありません。 保存する、画像形式は、より鮮明な、bmpでもOKです。 よろしくお願いします。

nariyuki
質問者

補足

merlionXXさん こんにちは、お世話になります。 もし、よろしければ、merlionXXさん お持ちのソフトで、・・・ 下記の要領で、試して頂けませんでしょうか? スキャナから、取り込みにしても、画面キャプチャ にしても、そんなに、画質に違いがあるとは、 思われませんので、もしかすると、お持ちの ソフトでは、下記の認識出来るのではないかと 思いまして・・・・。 どうぞ、よろしくお願いします。(すみません) フォントサイズ・・・ ”9” 文字 ・・・・・・・ ” -25.04 ” これを、ワードに書いて頂き、それを、 画面キャプチャーして、文字の、”-25.04 ”だけを 切り抜き、JPEGで、保存。 保存したJPGを、OCRソフトに読み込ませて、 処理させて、 その結果、 テキストとして、 ちゃんと、 -25.04 と してくれる、 時間あれば、どうぞよろしくお願いします。 文字、カタカナ、漢字は、あきらめています。 数字だけでも出来ればいいと考えております。

  • sachi218
  • ベストアンサー率16% (545/3288)
回答No.1

OCRに過度な期待をしないほうが いいと思います。 どれくらいの価格帯のソフトを購入 されたのか解りませんが、数字や 難しい漢字は、苦手なようです。

nariyuki
質問者

補足

経験により、そんなに期待は、していませんでした。 でも、 このくらいの数字・・・ ただの数字ですよ! ひらがなでもなく、漢字でもなく、カタカナでもなく ただの数字! 数字でさえ、認識できないって・・・ もう、期待というか、予想を超えたダメぶりです。 設定も、認識-数字に設定していても、出来ないとは (悲) しかも、手書きとか、くずれた数字ではないのですよ! HP、ワードなどにある、ちゃんとした、フォントなのです。 どうなのでしょか? 先に書いた例が出来るOCRをご存知の方 よろしくお願いします。 sachi218さん、コメントありがとうございます。 ぜひ、可能なソフト知りたいのです。

関連するQ&A