※ ChatGPTを利用し、要約された質問です(原文:e.Typistで表(つまり罫線枠の多い文章)を読み込むときのコツを教えて下さい)
e.Typistで表を読み込むときのコツ
このQ&Aのポイント
e.Typist V11.0を使って枠組みの多い住所録を読み込む際のコツについて教えてください。
紙に印刷された住所録をスキャンし、e.Typist V11.0で文字認識させると正しく認識されない現象が発生します。
組み込まれた罫線が認識に影響し、認識率が低下しているように感じます。どのようなアドバイスでも結構ですので、お教えいただけませんか?
e.Typistで表(つまり罫線枠の多い文章)を読み込むときのコツを教えて下さい
e.Typist V11.0 体験版を使い始めました。
【利用環境】
スキャナー:HP Photosmart 3210(オールインワン)
OCR ソフト:e.Typist V11.0 体験版
ドライバー:HP Photosmart 3210 TWAINドライバ
【現象(困っていること)】
紙に印刷された、枠組みの多い住所録をスキャナーで読み込み、e.Typist V11.0 体験版上に表示・文字認識させたところ、ほとんど正しく認識してくれない。(認識率は、たぶん半分以下です。)
【読込み対象の印刷物】※白地に黒文字の2色構成
縦に7本、横に3本の太い罫線の入った住所録
フォントサイズは項目ごとに異なり6~10ポイント
文字種は日本語(漢字・ひらがな・カナ・数字混在)
【OCRソフト(e.Typist V11.0)の設定】
(デフォルト設定のまま)
スキャン方式:通常スキャン
スキャンタイプ:(たぶん自動)
解像度:200dpi
濃度:自動
※ 縦横文字の認識方向は正しいです。
【教えて欲しいこと】
上記のような、枠線の多い印刷物の文字を正しく認識させるコツをご存知の方、助けてください!
または、別のOCRソフト(無料お試し版を入手できるもの)で推奨のものがあれば、教えて下さい。
【補足】
自分では、
1)印刷物レイアウトの問題か(文字は鮮明です)
2)TWAINドライバで読込み時の精度の問題なのか
3)OCRソフト上の設定(チューニング)の問題か
4)OCRソフトの限界なのか
切り分けができません。
ただ罫線があることがある程度影響して、極端に認識率が落ちているように感じています。(罫線を無視して読み込む設定があればいいのですが・・・)
どんなアドバイスでも結構ですので、教えていただければ助かります。
お礼
ありがとうございます! 解像度と濃度を調整してやってみます!
補足
締め切りが遅くなってごめんなさい! おかげさまで少し認識率があがりました。 どうもありがとうございます!