• ベストアンサー

手入力と画像データのデータが違ってしまう

読み取りソフトで、英数文字を読み取ってそれを別な用途に使おうとしたら、手入力した状態と違ったものになってしまいました。画像のデータを改めて元に手入力すると目的のものが達成されました。このような場合に手入力と同じ状態に変換する方法または、これからよい方法がないのか。データが500程度あるので、教えて頂けませんか。

質問者が選んだベストアンサー

  • ベストアンサー
  • imogasi
  • ベストアンサー率27% (4737/17069)
回答No.3

これは、どうしようもない、ことです。 金を出す気もないでしょうから、なおさらです。 質問のことは、この世界では常識です。別のOCRソフト(それも、手書き文字!読み取りソフト)を購入するほかないでしょう。そうなると高価なものになります。 そのソフトの中には、部分的にその語句の部分で、数種の「OCRソフトが捉えた候補字句」を選択させてくれるものがあると思う。それなら逐次に人間がチェックして、正しいものを選んで決めていけるわけです。半自動になるわけですが。 OCRソフトも、機能や読み取り識別能力に応じて、価格が高くなります。 1985年ごろは、企業で使おうとして(業務用)、カタログ価格が1000万円以上ぐらいした記憶があります。その後CPU処理能力のUp、文字割り出しアルゴリズムの改良、語句候補用例の収集の容易さ(WEB記事などから)、AIの導入など変化はありますが、完全とは行かない分野です。 ーー 参考記事 https://rpa-bank.com/report/12762/?read_more=1 Googleで 「OCRソフト 価格」などで検索。

rr5se
質問者

お礼

ご回答ありがとうございました。

その他の回答 (4)

  • kkkkkm
  • ベストアンサー率66% (1719/2589)
回答No.5

エクセルでの操作だとしたら カタカナの説明ですが英数文字でも同じです。 全角と半角を変換する http://officetanaka.net/excel/function/tips/tips45.htm

rr5se
質問者

お礼

ご回答ありがとうございました。

  • papis
  • ベストアンサー率70% (3653/5178)
回答No.4

元データの条件が一切不明なのであくまでも一般論ですが、 現状、一般的なコンピュータとスキャナーがある状況で、 ある程度期待できる文字認識が出来るのは、 新聞や雑誌などの活字(しかも標準的な明朝やゴシックのフォント)を ベースにした、400dpi程度の高解像度データに限られると言って良いでしょう。 手書きなどであれば、郵便の宛名読み取りなどと言った規模になり、 パソコンの範疇ではありません。 500程度のデータであれば、入力量にもよりますが 音声入力環境があれば、 質問者様が読み上げた物をキーボード入力の代替とする方が まだ精度は良いかもしれません。 いずれにしてもどんなデータを扱うかによって かなり選択肢が変わってくると言って良いでしょう。

rr5se
質問者

お礼

ご回答ありがとうございました。

rr5se
質問者

補足

「azmfwgbwhv」これと「azmfwgbwhv」これの違いを言っているのです。この2つは前が画像で取った文字で、後ろが手打ちした文字です。前のものを、後ろに変換する方法はないのか、お伺いしたいのです。

  • kon555
  • ベストアンサー率51% (1842/3559)
回答No.2

読み取りソフトはOCRソフトと呼びますが、ソフトの原理上、どうしても誤認識は避けられません。 ソフト側で変更できる設定などがあれば、適切な設定にする事で読み取り精度が向上します。例えば英数と限定されている場合、日本語認識をオフに出来れば精度が向上します。 ただこの辺りが設定できるかは、完全にソフトに依存します。使用する側が工夫できる余地はそんなにありません。 または、ソフト自体をより良い(高額な)ものに変更するかです。

rr5se
質問者

お礼

ご回答ありがとうございました。

  • aokii
  • ベストアンサー率23% (5210/22062)
回答No.1

人間もそうですが、読み取りソフトでも、完璧なものはありません。

rr5se
質問者

お礼

ご回答ありがとうございました。

関連するQ&A