• ベストアンサー

英文をスキャンして特定の部分をテキスト化するには?

英語の文章を複合プリンターのスキャナでスキャンして画像の特定の部分だけをテキスト化する方法を教えてください。 使っているプリンターはCANON MP610です。

質問者が選んだベストアンサー

  • ベストアンサー
  • 4G52GS
  • ベストアンサー率71% (1969/2770)
回答No.4

プリンタの修理屋です。 スキャナという機械に対しての認識の誤りと、PDF万能信仰が良く現れた質問と回答と感じました。 質問から少しはなれますけど、スキャナ自体には読取ったものをPDFで出力する機能はなく、すべて使用するドライバやソフトが行っています。 さらに、PDFは「Portable Document Format」の頭文字で、Document といっている通りで、あくまでも文書の記録フォーマットであって、画像データーではありません。 PDFの場合、Adobe Readerなどで開けば、文字の部分を範囲指定して読取ることが出来るはずです。 OCRソフトを使うなんて無駄なことをする必要もないわけです。 もし、読取ったものをOCRで保存しているようでしたらお試し下さい。 手書きの部分の識字率はOCRと同様に低いですけど、勝治部分の識字率は、ひょっとするとOCRよりも高いかも。 また、OCRソフトは、画像データーを文字として認識するソフトで、大半の人が原稿台に置いた原稿をそのまま変換すると勘違いしていますけど、すでに読み込んだ画像データーを呼び出して変換することも出来ます。 そういったことを踏まえて、方法を2つほど。 ひとつは、上に書いた方法です。MP Navigatorを開いて、文書として読み取って、PDFで保存します。 そのデーターをAdobe Readerなどで開きます。 選択したい部分にマウスカーソルを持っていき、左ボタンを押してドラッグして範囲を設定。 範囲の上で右クリックしコピー。 後はメモ帳などを開いて貼り付けます。 もうひとつの方法は、 MP Navigetor を立ち上げて「文書や写真(原稿台)」を選択。 左側のスキャンボタンのすぐ上の「スキャナードライバーを使う」にチェック。 「スキャナードライバーを起動」をクリック。 スキャなドライバが起動しますので、「プレビュー」をクリック。(事前に原稿は載せて置いてください) プレビュー画像の上にマウスを持っていくとカーソルが十文字になりますので、範囲を決めます。 こうすると、その範囲しか読取りません。 読取ったら、「保存」をクリック。 ファイルの種類を選択できますので、JPEGでも差し支えないとは思いますけど、「BMP」で保存します。 保存先は控えておきます。 「読取革命Lite」を立ち上げます。 色々と案内のウインドウが出てきますけどすべてとじていってください。 入門ウィザードを開き、画像の入力方法を「ファイルから」とし、「指定」をクリックして保存してあったデーターを指定し、次へ。 画像の回転などは必要なら行って、次へ。 認識結果の保存方法を決めます。これはWord形式か、テキスト形式か(メモ帳などで開けます)と言うことなので、お好きなほうで。 「認識実行」をクリック。 指定したソフトで開いてくれるはずですので、適当に名前をつけて保存します。 ただし、他の方が言われている通り、識字率は驚くほど低くなることがあり、手打ちしたほうが早かったなんていうこともあります。 PDFで出力しているのでしたら、最初の方法が楽でよいです。

HEALTHER
質問者

お礼

御回答いただきありがとうございます。 大変参考になりました。

その他の回答 (3)

  • m2052
  • ベストアンサー率32% (370/1136)
回答No.3

最初にスキャンした結果をPDFで保存をして、それを「読取革命Lite」で読ませることはできないようです。(画像として認識しない) 最初に「読取革命Lite」を立ち上げ、ダイアログがでますから「次へ」、「TWAINデバイスから」、画像の回転、結果を受け取るアプリケーション、を選んでスキャンします。 PDFで保存ではなくJPGで保存すれば最初の方法でできるかもしれません。(経験ありません)

HEALTHER
質問者

お礼

御回答いただきありがとうございます。

  • uruz
  • ベストアンサー率49% (417/840)
回答No.2

>PDFファイルには対応していませんと出てきます。 「読取革命Lite」は実際に触ったことも見たこともありませんので詳しいことは解りません。PDFファイルが扱えるOCRソフトも有るかもしれませんが、普通はBMPやJPEG(JPG)などの画像ファイルを使用するはずです。 マニュアルやオンライン・ヘルプなどで確認してください。 蛇足:完璧なOCRソフトはまだ世の中ににありません。 読み取り(テキスト変換)後は必ず変換結果を自分の目で確認してください。

HEALTHER
質問者

お礼

御回答いただきありがとうございます。

  • uruz
  • ベストアンサー率49% (417/840)
回答No.1

OCRソフト(Optical Character Recognition)を使用します。 CANON MP610には「読取革命Lite」というOCRソフトが付属していますので、使って見てください。

HEALTHER
質問者

お礼

御回答いただきありがとうございます。

HEALTHER
質問者

補足

使ってみたのですが、エラーが出てテキスト化できませんでした。 PDFファイルには対応していませんと出てきます。 やり方を間違っているのでしょうか? また他の方法はありますか?

関連するQ&A