• ベストアンサー

TIFファイルをテキストファイルに変換したいのですが・・・。

よろしくお願いいたします。 現在入力のお仕事をしているのですが、原稿がTIFファイルで送られてきます。それをプリントアウトして、Accessに入力するということをやっているのですが、手入力だと莫大な時間がかかりますので、TIFファイルをテキストデータに変換して、Accessに貼り付けをできないかな~と思うのですが、TIFファイルをテキストデータに変換する方法はありますでしょうか? また、スキャナ(EPSON GT8300UF)に付属していた、「読んDE!!ココパーソナル」でテキストとして読み込みをしてみたのですが、あまりにもめちゃくちゃでとても貼り付けに使える状態ではありませんでした。 何かよい方法がございましたら、どうぞよろしくお願い致しますm(__)m

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

#2です。 > あまり期待しないで、手入力でやった方がよいですかね? 原稿の長さに依りますね。私は1ページ程度でしたら手打ちでやっちゃいますけど、3ページも4ページもあるんでしたら、スキャナーで読んでOCRにかけた方がいいような気もします。 > それから同じTIFファイルでも「読んDE!!ココ」では開けないものがあります。 「読んDE!!ココ」は使ったことがあんまりないのではっきりとはわかりませんが、TIFファイルにも何種類かあるんですよ。 TIFイメージがBMPイメージより小さいサイズになっていたとしたら、それは圧縮がかかってるからですよね。 「読んDE!!ココ」では圧縮がかかっているイメージは読みとれないというケースが考えられます。 また、その圧縮の形式にも何種類かあるようです。 kojyopi-さんは画像ビューアソフトのIrfan View32というものをご存知ですか? このソフトを使うと、TIFイメージを異なる圧縮形式で保存できます。それで試してみたところ、圧縮形式によっては他の画像編集・ビューアソフト(例えばPaint Shop ProやGV)では読みとれないというケースもありました。「読んDE!!ココ」もそれに当てはまるのかも知れませんね。 で、どの圧縮形式にすればいいのか少しだけテストしてみましたが、「LZW」というものにして保存し直したら、他の画像用ソフトでも読み取ることができました。 何ページもある場合にも、Irfan View32はファイル形式の一括変換もできます。 Irfan View32は、オーストリアの方が作っている無料のソフトです。また、日本語版もあります。下記URLからダウンロードできますので、お試し下さい。 http://cvnweb.bai.ne.jp/~kusumoto/

参考URL:
http://cvnweb.bai.ne.jp/~kusumoto/
kojyopi-
質問者

お礼

ありがとうございました!! 早速、Irfan View32というものをダウンロードしてみました・・・がヘルプが英語でなんだか使い方がよくわかりません。(T_T) でも、とりあえず、試行錯誤しながらやってみようと思います。 いろいろと沢山のことを教えていただき、どうもありがとございました。 またどうぞよろしくお願い致します。 今度の入力はAccessでの入力なのですが、原稿は沢山あって、日本語や英語、学術記号が混じっています。(^_^;) OCRでは難しいでしょうかね~・・・。(-_-;)

その他の回答 (2)

回答No.2

プリントアウトしたものをもう一度スキャナーで読み取ってるのではなくて、送られてきたTIFファイルをそのままOCRにかけても認識率が悪いということですね? TIFファイルのサイズ(ピクセル数)はどの程度になっていますか? OCRは、解像度をある程度高くしないと認識率が悪くなります。解像度を高くすると、ピクセル数が大きくなります。解像度は400ぐらいにした方がよろしいかと思います。 A4サイズの原稿を解像度400にして読み取ると、3400×4680ピクセル程度になります。認識精度を上げるにはそれぐらいのサイズが必要ではないかと思います。 その辺を確認されて、送られてきたTIFイメージがもっと小さいものだったとしたら、サイズを拡大するなり、プリントアウトしたものをもう一度上記の条件でスキャナーで読み取ってOCRにかけるなりしてみたらいかがでしょうか。 また、OCRソフトにも色々ありますからね。スキャナーに最初から付属しているものではちょっと性能的に劣るところがあります。日本語ならWin Reader Pro、英語(外国語)だったらText Bridge Proぐらいのものを使えば、かなりの認識率にはなりますが。 で、kojyopi-さんがテキスト化したいとお考えの原稿は日本語ですか? だとしたら、認識率が100%になることを期待しない方がいいと思いますよ。OCRにかけてテキストにした後、ある程度修正することは必ず必要になるものだとお考えになった方がよろしいかと思います。

kojyopi-
質問者

補足

ご回答ありがとうございます。 解像度を400にしてやってみたところ、なんとか読み取れるようになりましたが、やはり、訂正箇所が沢山あるようです。 テキスト化したいと思っているものは日本語と英単語が混じっています。 あまり期待しないで、手入力でやった方がよいですかね? それから同じTIFファイルでも「読んDE!!ココ」では開けないものがあります。 なぜでしょうか??? よろしければ教えてくださいませ。 よろしくお願いいたします。

  • asuca
  • ベストアンサー率47% (11786/24626)
回答No.1

画像処理ユーティリティでコントラストをはっきりさせると認識率が高くなります。

参考URL:
http://www.vector.co.jp/vpack/filearea/win/art/graphics/index.html

関連するQ&A