- 締切済み
OCRの性能について
OCRで英文の長文を読み取る必要があります。「読取革命」体験版で、ペーパーバックをばらしてスキャナーでPDFにしたものを読み取らせましたが、非常に不満足なできでした。「体験版」を有料版にすれば、格段に制度が上がるのなら購入も考えます。どなたかご意見、アドバイスをお願いします。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
エプソンの「読んでココ」とソースネクストの「本格読取」を使っていますが全く問題ない精度で手放せません。 他の方が書いているように、高解像度(400dpi)で取り込み画像の補正とゴミ取り、傾きの調整はもちろん、「読んでココ」は選択範囲の文字の英語か日本語か混在かの種別設置が出来るので、これで設定します。 変換後も誤変換を修正していくと賢くなるので、うちの場合だと英数字は100%近く、漢字交じりでも95%以上は正確に変換していきます。 スキャン設定を変えてみたり(うちはフルカラーで取り込んでソフトで編集してます)、設定を見直してください。 体験版は期間が決められているだけで、性能面では変わらないと思うけど。 *「本格読取」は「読取革命」の廉価版だから同じと思いますが、読み取った結果を修正せずにそのままWordに送っていませんか? これだとあまり使い物になりません、ソフト上で修正し、コピペでWordに入れています。
- 4610_459
- ベストアンサー率34% (141/414)
印刷のつぶれ具合にもよるからね。ゴシック系の太い文字は印刷で広がってしまいやすいし 細い書体だとスキャン時に切れてしまったりする。 400dpi以上でスキャンして 傾き補正とごみ抜き 2均化した時点で、人間の目で印刷つぶれなら OCRがドンだけ性能よくても間違える。 正確に読み込ませるために2均化前の補正だけでも数十分かかるので そのまちがえを、拾い出して打ち込む こんな手間があるようなら、手で打ったほうが早い場合がある。 手で打てば分200文字はいける筈だから
- keithin
- ベストアンサー率66% (5278/7941)
e-typistと読んでココの2つを使っていますが,いずれも体験版と製品版の性能差は極めて顕著です。 どちらもメーカホームページから最新版の30日間トライアル版が入手できますので,試してみてはいかがでしょう。 http://pac.mediadrive.jp/support/et/et_try.html http://ai2you.com/ocr/product/koko13/trial01.asp スキャナやソフトの調整によって,性能が上がったり下がったりすることはもちろんあります。 ○スキャン解像度は400以上 ○モノクロでスキャンする ○スキャン濃度はやや薄めにする ○自動傾き補正は必ず行う 長文,ペーパーバックということで表などはあまり無いと想定しますので,領域指定はお任せで大丈夫と思います。
お礼
ありがとうございます。参考になります。
- violet430
- ベストアンサー率36% (27472/75001)
精度の向上は期待薄ですね、 私自身、やさしくPDF OCRを使っていますが、識字率は満足のいくレベルでは有りません。 他社の体験版も試しましたが、どれも精度は高くなかったですね。
お礼
ありがとうございます。
お礼
早速の回答ありがとうございます。試してみます。