- ベストアンサー
できるだけ安上がりでスキャナーとOCRソフトを使って紙媒体からテキストデータを取得したい
【したいこと】 分厚い本(電話帳くらいの頁数です)に記載された情報をExcelシートに効率的に取り込んで管理したいです。読み取り対象の印刷物(本)はモノクロで、文字情報と枠線のみで構成されています。(画像も複雑な段組もありません。) 【やり方】 スキャナーと(できれば製品に付属版か無料版の)OCRソフトを活用して、約2000頁の印字された情報を、直接Excel出力して取得したいです。 【ポイント】 お金があまりありません。 ただ、調べてみるとA4サイズ対応のスキャナーで1万数千円~くらいのものも市販されているようです。簡易版のOCRソフトも付いているようです。 【教えてください】 1)投資金額1万円台で、上記のしたいことは実現できるでしょうか? 2)1枚の紙媒体をスキャナで読み込んで、その後Excel出力するのにだいたい何秒(何分?)くらいかかりますででしょうか? (※ご認識文字の手修正など、加工作業は一切時間に含めない場合の、単純な読取時間+Excel変換時間) 【補足】 今のところ、文字認識の精度がいいと聞いた「読取革命Lite(Canonのスキャナに同梱)」か「e.Typist(体験版)」をOCRソフトとして考えています。 上記の1)、2)を教えてください。 どうぞよろしくお願いいたします!
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
2のみご回答します。 スキャナ読み込み:自動紙送り機能のついたコピー機に、スキャナ機能がセットされているものがあります。本をばらしていいなら、一気に読み込めます。(ただし一度に読み込める枚数は、コピー機の容量と読み込み時の解像度に依存します) kinko'sのようなお店で、この機能のついたコピー機を借り、画像化することができれば話は(仕事も)早いです。 テキスト認識:ファイルを開く→認識で、最短1ページ1分くらいでないでしょうか。
その他の回答 (1)
- ASIMOV
- ベストアンサー率41% (982/2351)
>直接Excel出力 OCRソフト上でテキスト表示されますので、それをExcelにコピーするということなら出来ます >1枚の紙媒体をスキャナで読み込んで、その後Excel出力するのにだいたい何秒(何分?)くらいかかりますででしょうか? 1分は掛からないと思います...が、修正作業は10~20分位掛かると思います(^_^;) 《懸念される事》 1.分厚い本、との事ですので綴じ代付近の文字が、スキャナーのガラス面に密着しない可能性があります(コピー機でコピーしてみてください) そうすると、その部分はほとんど読めません 2.OCRの精度は、文字の印刷具合(大きさ、つぶれ具合)で大体決まります 古い本で活字が小さかったり、不鮮明だったりすると、変換精度が低下して、修正が大変です
お礼
こんなに早く回答を下さりありがとうございます! 教えてもらえるってこんなに嬉しいものなんですね(*^_^*) 本が分厚いので、しっかりスキャンできるか気になっています。おっしゃるようにコピー機でまず試してみますね。昨年発行された本なので文字の鮮明度は良いです。どうもありがとうございました。
お礼
すごく参考になります! 実は数日前に会社でプリンタ「HP Photosmart 3210 All-in-One」を発注しており、このオールインワンプリンタには、スキャン機能(Windows環境ではOCR機能含む)が付いていることに思い至りました!ということは、上手くすれば、追加投資無しに、テキストデータの取得まではできるかもしれませんよね!この回答を読んで初めて気づきましたf^^;やってみます。ありがとうございました!!