- ベストアンサー
英文書類をテキストファイル化するためのスキャナを教えてください
- 大量の英文書類をテキストファイル化するための適切なスキャナについて教えてください。
- メーカーのサイトでは写真の取り込みやPDF化の説明しかなく、英文書類をテキストに変換するタイプのスキャナについての情報が見当たりません。
- 読み取りミスや誤変換が少なく、価格もリーズナブルなスキャナのメーカーや機種を教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
OCRの用途なら、市販のどのスキャナでも性能的に問題はありません。ただし、OCRソフトは別に買い求めることをお薦めします。 大量の文書を画像化するなら、ADFは必須です。文書専用のスキャナがお薦めです。 http://scansnap.fujitsu.com/jp/feature/ http://cweb.canon.jp/documentscanner/dr-2050c/index.html 本のようなものも含むならフラットベッド型になります。 http://cweb.canon.jp/documentscanner/dr-1210c/index.html 複合機でADF付きでもいいと思います(HPやブラザーなどはインクの入手製に難がありますが…)。 http://cweb.canon.jp/pixus/lineup/mp830/index.html http://h50146.www5.hp.com/products/printers/bizinkjet/oj/product/oj6310/index.html http://www.brother.co.jp/product/mymio/info/mfc460cn/index.htm >できるだけ読み取りミスや誤変換が少なくて、… これはOCRソフトの性能によります。一般的な製品しか使ったことはありませんが、細かい文字、図表が多い場合の変換精度は、相当落ちます。 使ってみれば分かりますが、「lと1」「Oと0」などに限らず誤変換は多いです。はっきり言って自分で打った方が早いのでは?と思うこともしばしばです。 以下のようなソフトはメジャーで試用も可能ですから、自分で試すのが一番です。 http://ai2you.com/ocr/ http://pac.mediadrive.jp/products/ http://panasonic.co.jp/pss/pstc/products/yomikaku/index.html ↓なども参考になると思います。 http://arena.nikkeibp.co.jp/tokushu/biz/20050322/111776/index.shtml
その他の回答 (4)
- microham2
- ベストアンサー率30% (64/207)
一時期ひたすらOCRしてました。日本語も英語もやりました。 英文の場合、英文専用OCRソフトを使うことがとても重要です。私はe.Typist internationalに付属のTextBridgeなどを使ってました。 英文の活字は隣り合う文字がくっつくので、和文OCRソフトでは正しく認識されないことが多かったです。 rnをmと認識したり、 fiが活字ではiの点がfにくっついているため、nと認識されたりします。また、Iをエに変換されたりするのも苦痛ですしね。 あと、英文スペルチェッカー機能は必須です。機械がスペルがおかしいと指摘された文字だけチェックするだけでほとんどの誤字は直ります。人間が全文を目でチェックすると、全文入力し直した方が楽じゃないかと思うほどたいへんです。特に英文はスペルチェック機能が優れてますから、必須といっていい機能でしょう。 スキャナーは、ふつうの文字サイズだと、白黒400dpiで読みとることが非常に重要で、300dpiだとエラーが多発し、600dpiだとソフトがA4に対応しなくなりました。もっとも、今ならどのスキャナーもこれはクリアしてます。原稿が新聞紙だと、紙のざらざらが点になって写り込むせいか認識率は落ちました(1行に5カ所くらい誤字がある程度)。つるっとした紙に印刷された文字だと認識率は高かったです(2~3行に1文字の誤字がある程度)。 蛇足です。 1年ぐらいひたすらOCRやった後、結局OCRはかけずにキーワードだけ手入力してグラフィックのまま保存するのが最も便利で時間節約になると判断して、OCRしなくなりました。レイアウトも読みやすさの重要な要因で、ベタのテキストだけだと読みにくいです。またどこの文字が誤字か考えながら読みなおすのも苦痛でした。一番良いのは頭に入れてしまうことなんですが。OCRする作業時間中は文字ばかり見ているので文章としては頭に入ってきませんでした。後日読み直すなら、OCRしないでそのときにしっかり文章を読んで頭に入れるのがお得です。
お礼
ありがとうございます。 やはり英文専用のOCRがあるのですね。こちらで質問してみてよかったです。 蛇足の件は、テキストファイル化した英文をさらに加工しなければならないので、グラフィックのままでは役に立たないのです。しかし親切に教えていただきありがとうございます。 今日お店に行ってCANONとエプソンのカタログをもらってきました。 みなさんのご意見を参考に、もう一晩考えてから買いにいきます。
補足
みなさま、お世話になりました。 エプソンの一番安い機種を購入しました。 まだいまいち使い方がわかっていないのと、WindowsMeでは読み込みに途方もない時間がかかってしまうのですが、来週には新しいパソコンが届くので(Vistaです!!)それまでに使い方を勉強したいと思います。
- norosi
- ベストアンサー率26% (430/1614)
時々スキャナ→OCR変換をしていますが・・・(日本語ですが) 原本にもよりますがOCRの認識率はよくありません、場合によっては再入力した方が速い場合があります。 (業者の使用するソフトは知りません) 従ってあまり大量の書類をテキスト変換するのであれば、#1 さんも書いていらっしゃいますが、業者に出した方が確実で早いと思います。 Googleなどで「英文 入力代行」などと検索すればヒットします。
お礼
ありがとうございます。 業者に出すことは考えていません。 日本語の場合、認識率はよくないとのことですが、英文の方が日本語ほど文字が複雑でないので、日本語よりもよく認識されるのではないかと思いました。
- kai3_r
- ベストアンサー率33% (5/15)
えっと、スキャナは書籍→画像ファイルのみを行います。 画像ファイル→テキストファイルはOCRソフト(大抵のスキャナ付属)を用いて行っています。 スキャナを良くすると画像ファイルの画質が良くなり、OCRで読む際に精度が上がったりするのですが むしろOCRのソフトの質の方が問題だと思います。 付属のOCRソフトはどれも質が良くないので。 >>英文書類→テキストファイルにどういった機種が適しているかという点については説明が見あたりません。 ここはスキャナの説明ではなく付属のOCRの説明に当たるので、説明があまりないのだと思います。 自分はOCRを読んde!!ココ Ver.10 ファイリングOCRを使用していますが、個人使用では特に問題ないです。
お礼
ありがとうございます。 スキャナ自体は安いものを購入し、使い勝手をみたうえで、OCRソフトの良いものを買い求めようと思います。
- kkkkk007
- ベストアンサー率25% (179/691)
予算、枚数が分からないのですが、場合によっては、業者へ頼んだ方がいい場合もあります。 A4一枚あたりの作業時間をどのくらいと想像していますか?
お礼
補足要求ありがとうございます。 業者に出すことは考えていません。スキャナ購入を前提に質問させていただいています。
お礼
ありがとうございます。 自動紙送りがついているとたしかに便利ですが、かなり値段が張るようなのであきらめるつもりでした。原稿を差す時間よりも、誤変換などを見つけて直す時間と手間が惜しいので、そちらを重視するつもりです。 OCRソフトのサイトの紹介、助かります。 スキャナは安いものを購入して、いろいろなソフトを試してみようと思います。
補足
★★英文を変換させるなら、日本製のOCRよりもアメリカ製などのOCRソフトの方がよいのでしょうか?★★