- ベストアンサー
画像データやCADデータをテキスト形式でよめますか?
画像データ(BMPやJpegやGif)をテキスト形式で出力して読みたいんです。 出きるんでしょうか? 出きるのであれば、必要なソフトはありますか? それと、CADデータ(CATIAやI-deas、UG)なんかのCADデータをテキスト形式で読むには、どうしたらいいんでしょうか? 少し、素人では難しくて、どうしたら良いかわからないんです。 どなたか詳しい人、いたら教えてください。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
バイナリを直接読んで、絵が浮かぶ人はいないと思いますので、画像データに表示されている文字を、テキストデータで取り込みたいということだと思います。 上記をふまえて、 OCRというソフトウェアがありますので、探してみてはどうでしょう。 私のところでは、一太郎とセットで販売されていた、「一発OCR」 http://www.justsystem.co.jp/software/dt/ocrpro2/index.html というソフトを使っています。他にも、 「読んde!!ココ」 http://www.vector.co.jp/soft/win95/writing/se277726.html とか、 「読み取り革命」 http://panasonic.co.jp/pss/pstc/products/yomikaku/ とかがあります。 他にもあると思いますので、検索してみてはいかがでしょうか。 もう一つの、CADデータからの読み取りは、少々むつかしいかと思います。 CATIA I-deas UG はどれも3次元CADなので、データを簡単に見る方法すらありません。それぞれのCADを用意するか、そのデータを扱えるビューワ(表示だけ出来るソフト)を用意されるしかないでしょう。 それでも、そこからテキストデータを切り出すことが出来るかどうかは、ビューワの仕様によります。 CADは3次元でも、テキストが書かれているのが2次元データであれば、DXF形式等で出力して頂いて、2次元CADで読み込む。あるいは、DXFそのものがテキストデータなので、エディタ等で開いて、該当部分を切り出す方法が使えるでしょう。 最悪でも、元のCADデータを表示することが出来れば、スクリーンコピーで表示画面をビットマップに保存して、OCRにかけることで読み取ることも出来ますね。
その他の回答 (5)
- qKAZp
- ベストアンサー率47% (71/148)
>識字率は50%以下ですから 対象物にもよりますね。 新聞や、フォントの決まった書類、CADでかかれた図面などは、汚れが少なければ90%を切ることはありませんよ。 今のOCRソフトは、誤認識した文字を指定して教えてやれば、同一(近似)パターンはすべて直してくれますので、やるたびに利口になっていきます。 たとえば、毎日同じ新聞の切り抜きを読み込ませると、最初の数回は誤認識の修正が必要ですが、後は、ほとんど手直しが必要ないレベルになります。 いかにきれいなソースをかませてやるかがポイントになるようです。 ただし、手書きの文書や図面では悲惨なことになります。図面はわりと読み込みやすい様です。製図規格がきちっとしている会社の図面ほど識字率はいいですね。 特に数字については、あまり問題になった記憶がありません。(小数点とカンマの誤認識は多いですが、さして問題にはなりませんでした) 数字は書く人の癖が一定しているようです。いっそのこと、おもいっきりくせ字の方のほうが、字体が一定していていいかもしれませんね;P
画像データをOCRというソフトで認識させることができるのですが、印刷物をスキャナでスキャンした時でも識字率(文字として正確に判別できるかどうかは50%以下ですから、まして画像データ(写真とか)から文字を識字させるのは、ほぼ無理と考えてください。 やってみれば分かりますが、やるだけムダだったというのがほとんどです(^^;
?リ?・JFIF ・・ ?・?hotoshop 3.0 8BIM・ x H H -7?・・;E鵤{・ XX wp d ' 0 ・ ・ @ 8BIM・ ・ ・ 8BIM x8BIM・ 8BIM 8BIM' 8BIM・ H /ff lff /ff 。劒 2 Z 5 - 8BIM・ p ??????????????????????・ ??????????????????????・ ??????????????????????・ ??????????????????????・ 8BIM @ @ 8BIM 8BIM ゜ p T P n@ テ ?リ?・JFIF H H ? &File written by Adobe Photoshopィ 5.1?・Adobe d? ?ロ ・ ?タ T p" ?ン ?ト? 3 !1AQa"q・贈アB#$Rチb34rびC%担鞜?s5「イ・D典dEツ」t6メU稙魍・モu胚F'筈・米ヤ蔬・オナユ襄Vfv・ヲカニヨ踐7GWgw∠ァキヌラ銷 5 !1AQaq"2¢。アB#チRム・$b疵rCScs4・「イ・&5ツメD典」dEU6te糘ウ・モu胚F筈・米ヤ蔬・オナユ襄Vfv・ヲカニヨ踐'7GWgw∠ァキヌ?レ ? ・テエo・_ト6ニオニ・ゥ・・Kヘ・Pオウ Aレ・9・ュ|リOオ? 喙???? ワ・Qナ雰霰7陌レuuイ諧f゜ムツ"頡H朎Mud(1)&KG?ロカマボ勸.・ケ鋧ヲロA・毆サw・~日・・ヨXタヌ龜$KZ89フロ﨏ケ? ??節???俍26華ンミニ﨎?・? G・・bユクテ=6・ン・゛詬ウfマ馞f臭5マ項ラヒ・沾ラ C゜ソ?6ヌ}& メ!サ・沆ヘ蕫ハ?勀廚cwZラ・ヒy・>髞樒キンソ$ヨ? ネ・アョ0ツ?H;H琢ルケッル? ? I・k釈|クシ?vマホu{ソッ・? =傔ンサ峡ミチsセ馬ン・・ 擱カ・k$サYヨ}ア}/?J」Tホシ>u際ァkc弡[・ ム{Lャ寄1・ツv・ッ これが画像データの中身ですが(最初からの数行です) 慣れれば、これを見て中身がどんな画像か分かるとは思いますが、一般的には無理でしょうね。プロでも無理でしょう(^^;
- shinopo
- ベストアンサー率24% (26/105)
#2さんの説明で、質問の意味が理解できました。 私はよく質問の意味をはき違えて発言してしまうことが 多々あり、迷惑をかけてしまいます^^; 申し訳ありませんでした。
- shinopo
- ベストアンサー率24% (26/105)
画像はバイナリファイルなので、 テキストエディタでは文字化けして読めません。 バイナリエディタですと、16進数で表示された 数字の列は見れると思います。