- 締切済み
デジタル数字の画像認識で数値取得
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- MT765
- ベストアンサー率57% (2080/3618)
可能です。 機械学習やパターン認識と言った最近よく聞くAI的な技術を使います。 使う電卓に合わせて学習させればokです。 プログラミングやAIに関する知識が必要になりますがこの程度であればそこまで難しくはないのではないかと思います。 【AI(人工知能)初心者向けパターン認識と機械学習について5分で解説】 https://aizine.ai/pattern-learning0702/ 【機械学習初心者向け】ロジスティック回帰で手書き文字認識【機械学習の実装】 https://aidemy.net/magazine/652/ 【OCRをpythonで自作する方法【機械学習】】 https://ebi-works.com/ocr-python/
- kon555
- ベストアンサー率51% (1842/3559)
既に実用化されて、サービスとして複数社から提供されています。 (例) https://conexio-iot.jp/serviceproduct/sri/template_meter.html https://www.hakaru.ai/ 使われている技術は、基本的にはいわゆるパターンマッチ認識です。デジタル数字だけでなく、最近は手書きの数字や文字もかなりの精度で認識します。 画像文字認識、いわゆるOCRの解説と歴史などは、こちらが参考になるかと。 https://journal.pfu.ricoh.com/ocr/00011/
- neKo_quatre
- ベストアンサー率44% (735/1636)
どういうレベルで? ・対象の電卓、表示される数字の大きさ、形状は毎回異なる? ・100%の精度で認識できるか? > タブレットやスマートフォンで写真撮影し、 > それを取り込んで画像認識させるのでも > いいのですが、 って事は、数字のサイズや色、傾き、縦横回転なんかもバラバラ? それを100%認識ってのは、難しいです。 そこそこ認識できればOK程度なら、可能だと思うけど。 例えば、下記は甲骨文字を学習してOCRに挑戦する記事とか。 MISO 未来を創造するITのミソ - 甲骨文字で書かれた文章をOCRで読み取れるようにしてみる https://www.tdi.co.jp/miso/tesseract-ocr -- 汎用のOCRよりは、7セグメントの7つのセグメントのON/OFF判断して場合分けの方が確実かも。 ↓の逆をやるみたいな。 Wikipedia - 7セグメントディスプレイ https://ja.wikipedia.org/wiki/7%E3%82%BB%E3%82%B0%E3%83%A1%E3%83%B3%E3%83%88%E3%83%87%E3%82%A3%E3%82%B9%E3%83%97%E3%83%AC%E3%82%A4
- chie65536(@chie65535)
- ベストアンサー率44% (8741/19839)
>写真で撮影し、その画像から、画像認識し、 >数値を取得することは可能ですか? ほぼ不可能です。 「大きさに決まりが無いもの」を画像認識するには「マーカー」が必要になります。 一般的な「バーコード」も、大きさが決まってないので、バーの中に「マーカー」が仕込んであります。 バーコードは「細い線」「太い線」「細い隙間」「太い隙間」の4つで構成されていて、バーコードリーダーは「太さの違い」を「マーカー」として認識して「バー太さと隙間の太さ」を読み取って、細い、太いの組み合わせを見て、データを読みます。 2次元バーコード(QRコード)も、ドットの中に「マーカー」が仕込んであります。 QRコードで目立つマーカーは3カ所の大きな四角形。 この他にも、四角形と四角形を結ぶラインに「白黒白黒白黒白黒白黒白」と白黒が交互に並んだ、ガイドになるマーカーがあります。 バーコードリーダーは、この「中に仕込まれたマーカー」を頼りに、バーが示す「データ」を読み取ります。 で、問題の「電卓の液晶」ですが、マーカーが無いので「液晶が消えている部分なのか、元々液晶が無い部分なのか、判断する材料が無い」ので、正確に読み込む事は不可能です。 例えば「1」がひとケタだけ出ている状態と「7」がひとケタだけ出ている状態を考えてみて下さい。 マーカーが無いので「上の横棒」が有るのか無いのか、簡単には判りません。もしかしたら「カメラに映った汚れ」かもしれません。 たったそれだけの事で「1なのか7なのか判らない」です。 リーダーを使って読み取る物は、殆どの物に「ここを読む目印」として、マーカーが付いています。 なお、マーカーが無い紙の文書を読む「OCR装置」も「行」つまり「文字の並び」を「マーカー代わり」に読み取っています。そして「読み取る対象の文字のパターンが沢山ある」ので「何の文字が書いてあるか、ある程度は読める」のです。 ですが、電卓のように「文字の変化パターンが少ない」と「似た形状の物ばかりになって、文字の区別が出来なくなってしまう」のです。 オンオフだけの違いしか無いと「逆に読み取りが難しくなる」のです。
- w4330
- ベストアンサー率25% (377/1477)
Optical Character Reader(OCR)と言い、何十年も昔からある技術です