• 締切済み

印刷物をテキストファイルに変換するソフト

印刷物などを(例えば、新聞など)スキャンしてそれをそのまま自動的にテキストファイルへ変換するソフトというものはあるのでしょうか。

みんなの回答

  • poor_Quark
  • ベストアンサー率56% (1020/1799)
回答No.4

 いわゆるOCRソフトというジャンルがご質問の内容に当たるかと思います。ただし認識率は不満を持たれるかもしれません。私の手許にある「読んでココver6」というソフトで試したところ、エクセルで10桁の整数を縦横10個合計百個の表にして12ポイントOCRフォントでエプソンPM900Cで印刷したものを読み込ませて、もう一度結果をエクセルに読ませたところ、結構認識ミスがありました。  もう一つ読取革命というソフトでは、表の認識については「読んで~」とあまり変わらなかったのですが、新聞の切り抜き(社説全文)で試したところ、一字の間違いもなく認識しました。認識率を上げるには、各種のユーザー辞書を上手に使うこと、傾き自動補正機能を使わず、正確にスキャナーで正立した状態で原稿をセットするなどの手間が必要かと思います。  また原稿の紙質、印刷のかすれや紙面上やスキャナー上のごみなどで大きく結果は変わります。それから1行ごとに網掛けがしてある明細書などのテキスト変換は、私の経験では何を使っても全滅でした。またスキャナの解像度や、性能によって結果は変わることもあるようです。これだけネットが普及したのに請求明細書など印刷物でしか届かないものが多いの、はがゆいことです。  各ソフトのサイトに試用版があることもありますので、スキャナーをお持ちならお試しになってはどうでしょう。ただし使用に当たっては認識結果をビジネス文書に使う際は、必ず念入りにベリファイ(照合)をかけてください。大恥をかくことがよくありますので。

参考URL:
http://www.pit.panasonic.co.jp/yomikaku/index.htm,http://ai2you.com/ocr/
  • nightowl
  • ベストアンサー率44% (490/1101)
回答No.3

それは「OCR(光学文字認識)」ソフトウェアと呼ばれるものです。 値段の安いものから高いものまで、文字の認識率の差もピンからキリまであります。 高いものの方がやはり認識率が高い傾向があります。 ただ、現在の OCR のレベルでは「そのまま自動的に変換」できるようなものはなく、 程度の差はあれ誤認識を訂正するために人間の介入が必要となります。 PFU からは文書を自動的に PDF ファイルに変換するスキャナが発売されています。

参考URL:
http://www.pfu.fujitsu.com/sales/snap/,http://www.watch.impress.co.jp/pc/docs/2002/1112/pfu.htm
  • tamra
  • ベストアンサー率21% (40/187)
回答No.2

OCRというソフトですね。エーアイソフトの『読んde!!ココ』とか.

参考URL:
http://ai2you.com/ocr/
  • master-3rd
  • ベストアンサー率35% (582/1641)
回答No.1

OCRソフトですか? 読んでココとか、いろいろあります。 普通はスキャナ購入したときに体験版とかが付いてますよ。

関連するQ&A