- ベストアンサー
文字化けしないOCRアプリ
スマートフォン(iPhon4S)利用ですが、 カメラで撮った文章をOCRでPDF化できるアプリを探してます。 もちろん完璧に近いものは求めていません。認識率が高く、文字化けが少ないアプリがありましたら、ご紹介ください。 無料有料問いません。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
私も色々試しますが、まず無理なようです。 Acrobat付属のOCRでも、写真から文字を拾い出すのは難しいです。 写真は、人の目では黒白を判別できますが、写真となったらダメなのですよ。 [例] 外に干してあるワイシャツも取り込んだワイシャツも人の目には真っ白ですが、写真にすると室内のものは真っ黒に写ります。 文字も光が多く反射している黒い文字は人の目には黒く見えますが、写真に取ると灰色や白になってますよ。 ⇒すべて : 目の錯覚画像 まとめ 【面白い、おもしろい画像】 - NAVER まとめ( http://matome.naver.jp/odai/2131022599702771401/2131022651502780503 ) ⇒色が。。。 : 目の錯覚画像 まとめ 【面白い、おもしろい画像】 - NAVER まとめ( http://matome.naver.jp/odai/2131022599702771401/2131022619502775003 ) 人間の目は、いとも簡単にその補正をしてくれますが、カメラでは無理なのです。 (逆じゃないです。!!!)下の例で言うと、現実にこのような風景を見たときに人の目は、AとBは異なる色だと判断できますが、カメラ(機械)には、全く同じ色としか認識できないのですよ。 それが文字だったら・・・ どうしてもスキャナでスキャンするしかありません。 間接照明で、撮影するテキストの前面に均一に光が当たるようにして、遠くから望遠でうまく撮影し、それを画像ソフトでニ値データーに減色できれば、OCRで読み込むことは出来るかもしれません。実際に、そこまで手をかければOCRで読み込むことが出来ます。 従って、OCRと言うより、人の目に勝る画像ソフトを開発しないと無理でしょうね。
その他の回答 (4)
- ORUKA1951
- ベストアンサー率45% (5062/11036)
>最初のリンク、AとBが同じなんて信じられません。 ですが、現実世界では明らかに異なる色と認識できないと困るのですが、カメラは区別していない全く同色に撮ってしまう。その写真を見た人間は異なる色だと知ることが出来る。 色とは、「その部分に白色光が当たった時にどの波長の光を反射/吸収するか」という、その物体固有の表面の性質です。そこからどんな光が目に届いているかじゃないです。 人の目では、視細胞どおしを連結する水平細胞やアマクリン細胞を用いて、隣の色とどう変化しているかと、その周囲の変化とを総合して、実際にそれが何色かを演算処理してその【色!!】の結果を脳に送っている。目、自体が頭脳---発生学的にも脳の一部が皮膚に向かって伸びていって、表皮を巻き込んで目を作る。---なのですから、極論すれば目で見て脳に送られる時点でOCR化されている。 Johnny5君の目は、どう見たってテレビカメラですから、あの環境ではOCR化できないでしょうね。私は、仕事で英語の論文を翻訳することがあるのですが、そのときはスキャンしてOCRで英文に直して、翻訳で概略を得ることがありますが、カメラでは無理ですね。ペーパーブックならまだしも、光沢紙に印刷してあったら無理です。 唯一の方法は、No.1で説明したように、そのための撮影環境を作るしかないのです。専用の光源をもつスキャナカメラが市販されています。
お礼
サイドのご回答有難うございます。 やっぱり現時点ではスキャンしてOCRしないとだめですねー。 進化をのぞみます!
- cliomaxi
- ベストアンサー率33% (2921/8736)
問題は色では無く形だと思うが・・・。 原因は日本語ですよ。 アルファベットなら大文字小文字合わせても52文字しかありません。 平仮名、片仮名だけで既に100を越えますし、漢字や更には人名に使われる様な旧字体を加えれば数千数万の単位。 それでも日進月歩と言うか10年前に比べれば文字の認識率は格段に上がっています。 と、言ったところでEvernoteかな。
お礼
ご回答ありがとうございます。 なるほど。日本語は用いる文字種も数すごいですが、漢字も複雑な形態です。 やっぱり今は地道にスキャンか手動入力するしかないようですね…
- ORUKA1951
- ベストアンサー率45% (5062/11036)
No.1です。 >これだけいろいろなデジタル技術が進んでても、OCRは一向に進化しないのはこのような理由からなのですね。 OCRではなく、カメラです。中学校あたりで、カメラと目の構造を並べて、レンズ-水晶体、絞り-虹彩、フィルム-網膜と対応を示した図がよくありますが、カメラと目はまるで異なります。まず、シャッター--デジカメだと走査---がない。例の図( http://matome.naver.jp/odai/2131022599702771401/2131022619502775003 )のAとBを同じ色だと認識できない、そもそもしっかり見えているのは中心だけなのに、全体を理解できる・・・など、二つはまるで異なるものです。 カメラで本に書かれている文字を読み取ることは、実は今の技術では無理なのです。 ⇒INPUT Short Circuit - YouTube( http://www.youtube.com/watch?v=Pj-qBUWOYfE ) 映画ショートサーキットのひとコマです。 それにしても、目とはすばらしいですね。
お礼
ご回答ありがとうございます。 最初のリンク、AとBが同じなんて信じられません。 錯視については私も本当におもしろいなと思ってます。それもひとつな人間な高度のメカニズムです。 カメラは人間の目の構造を真似ていますが、それでも機械は人間の身体の複雑な構造を超えることはできないと思ってます。 「ショートサーキット」のシーン、このロボットが本をOCRしている?のでしょうか(笑)
- yoratomi
- ベストアンサー率57% (4/7)
質問者も完璧は求めてないって書いてますしねー。 とはいえ、私もサイトを紹介するしかできませんが。 http://app-liv.jp/customizations/barcodes/1325/ OCRは、フリーのエンジン(OCRパーツ)があるので、フリーなものは、どうしても識字率が低い(似たりよったり)です。 フリーのOCRパーツを使いソフトを作ったこともありますが、識字率もさることながら、使い勝手が今ひとつだったり。 自分のところで、OCRを開発し、なおかつ性能がいいモノが理想ですが・・・。 WinやMacで、OCRソフトを開発しているメーカーのiPhoneヴァージョンがあると、多少識字率も上がると思いますが・・・。 かと言って有料のも、実は中身がフリーのOCRだったりする可能性もあるので、なんとも。
お礼
ご回答ありがとうございます。 アプリを使った人のコメントだと「騙された」というのが多いですね。だったらなぜ売るのか?と思いますが…。完璧じゃなくてもいいんです、本当に!!
お礼
ご回答ありがとうございます。 リンク先、見ましたが驚きました。 これだけいろいろなデジタル技術が進んでても、OCRは一向に進化しないのはこのような理由からなのですね。 当面(というよりずっと!?)スキャンしてコピペするしかないですね…。