- ベストアンサー
印刷物(活字)のデジタル(テキスト)変換の手段ってありますか?
(1)印刷物(本、新聞、レポート)等の「活字」を「テキストデータ」にデジタ ル変換できる手段を探しています。アナログベースからデジタルの「テキスト形式」データへ加工する方法ってありますか? (2)ニーズはどこかにあると思うのですが、こんなことができたらいいな、と思 うのは私だけでしょうか?同じようなことを思ったことのある人っていますか?あるとすればどんな利用シーンですか?
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
検索データにしたい場合はそういうニーズはありますね。 まずは紙の原稿をパソコンに取り込む(デジタル化する)というのが第一段階、これがスキャナと呼ばれる部分ですね。 次に、スキャナしたデータ(大抵は TIFF or JPEG)を文字データに変換する、というのが第二段階、これがOCR(Optical Character Recognition)といわれるものです。 スキャナは家庭用のものでも解像度さえ高くしてあれば十分ですが、問題はOCRです。いろいろなメーカーで作っていますが、 共通して言えるのは 「手書き文字は誤認識しやすい」「表組み、画像のちりばめられた原稿は段組を正確に拾い難い」 などでしょうか。そしてそのソフト自体も金額的には本当にピンきりです。特に日本語と英語が混ざったような原稿を認識するにはそれなりに高価なものになるでしょう。 高性能なものはビジネスでの用途を考えられているので高価なものが多いです。 製品によりますが最終的には原稿と見比べるというチェックが必要になります。 安いものにしてしまうと、結局は手で打ち直したほうが早かったかな、というパターンもあるでしょう。 文章管理ソフトに付属のOCR機能を使う http://www.ricoh.co.jp/ridoc_ds/rds/ridoc_2000/ http://cweb.canon.jp/Product/appli/dmanager/function_01.html 専用のソフトを購入する(他にもいろいろありますので調べてみてください) http://cweb.canon.jp/Product/appli/ocr_input/index-j.html http://www.justsystem.co.jp/software/dt/ocrpro/
その他の回答 (3)
- taknt
- ベストアンサー率19% (1556/7783)
私は、音楽用のCDの曲名をスキャンして、それをOCRでテキストに変換して リネーム用ソフト(自分で作った)で貼り付けて、mp3の曲名に入れてました。 このためだけに、スキャナを購入して、今は ぜんぜん使ってません。 だいたいどのスキャナも購入するとOCRソフトは ついてますよ。
- coco1
- ベストアンサー率25% (323/1260)
スキャナ+OCRの活用で実現できるというのは他の方の回答どおりです。 実際、私もそのパターンはよく利用しています。 ただし、製品によって認識精度にかなり差があり、そうとう根気の要る作業には違いありません。図形、表などがあるともっと厄介です。 人間が点検しても、人と入、はとほ、ぱとばの認識ミスなどはなかなか気付かないものです。そして、これが後述する「検索」の際に支障を及ぼす場合もあります。 古い文書(漢字タイプやワープロ専門機で作成されて、データがないもの)をテキストデータに変換することで、 ・印刷フォーマットの変換、例えば、もともとB5で印刷されているものを現代風にA4で印刷し直すとか、ポケットサイズにするとかが自在になります。 ・各種の検索ツールを使うことで、データファイルの検索が自由自在に、瞬時に完了します。しかし、前述の通り「日本人」を検索したいのにデータが「日本入」だと当然ヒットしません。 ・再利用が容易です。例えば、部分的に引用するとか、規則類を改正するとか、適当でない用語を一括置換するとか ・必要かどうかわからないような古い文書は、データファイルを作成しておくことで、とりあえず紙媒体としては思い切って捨てることができます。 ざっと思いつくだけでも、こういったメリットがあります。
- shy00
- ベストアンサー率34% (2081/5977)
まずスキャンします そしてスキャンした物をテキストに書き出すソフトは いろいろとあります。 Word OCR v.1.0 http://japan.cnet.com/JustIn/jp_soft/010522/ji01.html などなど スキャナに書き出し用ソフトがついている物もあります