- ベストアンサー
本をスキャニングしてワードに変換したいのですが、どのスキャナーがお奨めですか?
本を開いた状態でB5程度の本をスキャナーで読み取り、ワードの文章として保存したいのですが、どのスキャナーを選んだらいいでしょうか? 以前、OPTICBOOK3600を使って試みたのですが、イメージとしての保存は出来るのですが、ワードとしての保存は、特に縦書きの本の場合は、ほとんど日本語として認識してくれませんでした。これは英語圏の横文字文化の故かもしれません。 他の機能は要りませんので、本の文字部をワードの文章にするためだけのスキャナーと変換ソフトが欲しいのです。 宜しくお願いいたします。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
#2です。 (1) スキャナーは「ハードウエア」であって、実際の画像を画像ファイルに変換する機械です。 (2) OCRは「ソフトウエア」であって、画像ソフトの文字部分を、テキストファイルに変換するアプリケーションプログラムです(例:e.Typist)。 文字印刷物からテキストファイルを作るには、(1)(2)の両方が必要です。 しかし、スキャナ-を買うと、多くの場合、OCRソフトが「オマケ」として付いてきます。これは「バンドルソフト」といって、実は本格ソフトを買ってもらうための「試供品」です。タダですから、いろいろな制約がありますが、一応使えます。しかし使っているうちに、もっと便利なものが欲しくなるでしょう。 キャノンのスキャナーには、e,Typistが、エプソンのスキャナーには「読んdeココ!」が付いてきます(「読んdeココ!」のメーカーがエプソンの子会社だからです)。 バンドル版を持っていると、本格版が安く買えるので、スキャナーを選んだ時点で、実際上OCRも選んだことになりがちです。私は、ここで評価を申し上げるほどのデータを持っていませんが、5年ぐらい前の比較で、キャノン~e.Typist系を選びました。スキャナーは超安物ですが、OCRは仕事の関係で高価な本格版に投資しました。今では、この方針が良かったものと思って、ほぼ満足しています(ノドが撮りにくいので、CCDにすべきだったと思いますが)。 スキャナーの値段は広範囲ですが、画面読み取り性能では、大差はありません。しかし、(1)書籍のノド部分が良く読めるか?、(2)読み取り速度は?、(3)用紙の大きさ制限は?、(4)多数枚の自動読み取りは?など、用途によって選ぶべきでしょう。
その他の回答 (5)
- abic
- ベストアンサー率65% (63/96)
#3です。 #5さんの回答で、私の言いたい事を全部言われました。 スキャナーで読み込んでの透明テキスト付にしたPDFファイルも直接ワードに変換すると、囲み記事とか縦書き横書きの混在したもの等、 レイアウトの複雑なものほど復元率というか、認識率は悪かったように思います。 解像度を上げれば認識も上がるのでしょうが。。。 透明テキストは検索の為のものだから、認識率が低いのもしようがないのでしょうね。 透明「テキスト」だから、テキストとしてコピー&ペーストができて、それをワードに貼り付けるという事になります。 PDFでは白抜き文字に加工してあるものも、普通の字になりますね。
お礼
大変有り難うございました。 皆様のお陰で、試行錯誤少なく、目的に進めそうです。スキャナー選びから、一歩踏み出してみます。 有り難うございました。
- sekiya-h
- ベストアンサー率61% (1543/2514)
OS は Windows でしょうか? スキャナーですが、見開きした本をスキャンするなら、"OpticBook 3600" がベストだと思います。但し、TWAIN規格準拠なので、多分大丈夫だとは思いますが、ソフトの動作環境に注意が必要です。 OCR ソフトは、"e.Typist" と "読んdeココ!" が定番のようです。 どちらのソフトも PDF 形式や JPEG 形式のファイルからの OCR も可能ですから、体験版を利用し、実際に手持ちのファイル(又は、取説などの PDF 形式のファイルをダウンロードして)を OCR 変換し、使い勝手や認識率について確認しましょう。 e.Typist e.Typist v.12.0 for Windows http://mediadrive.jp/products/et/ e.Typist v.12.0 無料体験版ダウンロード http://mediadrive.jp/products/et/index8.html 読んdeココ! エプソン|OCR製品総合サイト OCR WORLD http://ai2you.com/ocr/ 【読んde!!ココ Ver.13】無料体験版 http://ai2you.com/ocr/product/koko13/trial01.asp >文章の中からキーワード検索をしたい為にするものです。 検索の為で、文書の編集(書き換え)をする訳ではありませんよね。 それなら、Word 形式より、透明テキスト付きの PDF 形式の方が向いていると思います。 透明テキストPDFとは:PDF即効テクニック http://pc.nikkeibp.co.jp/article/NPC/20060401/234127/ 【BIGLOBE SOFTPLAZA】透明テキスト付PDFを活用した電子スクラップ術 http://softplaza.biglobe.ne.jp/shop/aisoft/escrap/ PDF画像に透明テキストを付加するOCRソフトの性能比較です。 ↓ 写本工房 - METAC: PDF-F-3 OCR変換・透明テキスト http://metac.cocolog-nifty.com/script/cat6255900/index.html
補足
有り難うございます。 透明テキストPDF、興味あるやり方で感心いたしました。ただ、説明文を細かく読み進めていないので、分からないところが一点あります。 検索のためにワード化(この場合は透明テキストPDF化)をするのですが、検索した後、必要なところは、「コピー&ペースト」で、ワードに貼り付ける作業が必須(ここまでの一連の作業を行いたい)です。 透明テキストPDFから、「コピー&ペースト」は、簡単にできるのでしょうか?
- abic
- ベストアンサー率65% (63/96)
OpticBook 3600って評判の、本なんかを切り取らないで、そのままスキャンできる機械ですよね。 英語対応だけあって、横書きは割りとうまく認識するけど、日本語の縦書きなんかは苦手だという噂ですね。 しかし、本をそのままの状態で保存なら、OpticBook 3600しかないでしょ? バンドルソフトを使って、TWAINからPDFに変換する時に日本語読取がうまく行かないのではないですか? それだと二度手間ですが、画像→PDFを定評のあるソフトで一回変換して、PDF→ワードに変換できるソフトを使えばどうなんでしょう?
補足
ずぶの素人で申し訳ございません。 本をそのまま保存することが目的ではありません。本の文章を、WARDの文章としてというか、手書きで打ち込んだ文章と同じように保存したいと思っております。この目的は、文章の中からキーワード検索をしたい為にするものです。それをしないのであれば、スキャナー画像で十分なのですが・・・ また、「二度手間」以降の文章が全く理解できません。赤ん坊に説明してやろうと思われるのであれば、噛み砕いた説明をお願いできませんでしょうか?
- Ishiwara
- ベストアンサー率24% (462/1914)
書籍を読み取る場合、一番苦労するのは「ノド」の部分です。できればCCD(電荷結合素子)を使ったスキャナーをお買いください。 スキャナー/OCRは、使い方が難しいので、熟練が必要です。私は e.Typist を使っていますが、認識率はほぼ100%で、まったく問題ありません。
補足
有り難うございます。 (1)まず、CCDのスキャナーを使用する必要がある。 (2)次いで、OCRのソフトではなく、e.Typistというようなソフトを使え。 ということでしょうか? (3)それは、e.Typistのソフトで、スキャナーで読み取った画像を読み込むということでしょうか? 素人で申し訳ございません。今一度お教え下さい。
- fifaile
- ベストアンサー率25% (622/2403)
というか、そもそもOCRの認識率は高くないですよ。 縦書きとか横書きとか関係なく、です。 ライブラリとして使おうと思ったら、打ち直したほうがよほど早いです。 手間はかかりますが・・・
補足
有り難うございます。 opticbook3600の認識率ですが、縦書き文章の本では10%に満たないのもが、試しに横書きを試してみると、70~80%位まで認識したように記憶しております。 ただ、私がワード化したい本は全て横書きの本なので、日本製のスキャナー(のソフト)でないと無理なのかなと思った次第です。 打ち直しをしなければならないのなら、量が膨大なので諦めざるを得ません。が、本当に、この高度技術化している日本で、こんな事が出来ないのでしょうか? 余りにも小さな隙間の技術なのでしょうか? パソコンお宅の皆様、お知恵をお願いいたします。
お礼
有り難うございます。 やっと自分がやりたいことの全貌がつかめました。 これから、スキャナー選びに入りたいと思います。 懇切なご教示、心から感謝申し上げます。有り難うございます。