- ベストアンサー
大量のスクリーンショットからテキストを抜き出す方法
- Mac/iPhoneで大量のスクリーンショットをキャプチャし、PDF等のファイルにまとめてOCRテキスト認識を行い、テキストのみを抜き出す方法について教えてください。
- 1枚ずつではなく、1000枚単位のスクリーンショットからテキストを抜き出す方法を教えてください。
- 環境はMac OS X 10.7.4 Lionで、Acrobat 9 ProとLibreOffice 3.5.4.2を使用しています。テキストだけ抜き出せる方法を教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
>要は、複数枚のOCR可能な解像度の画像を >如何に効率的にOCRできるかを Acrobatを使うのでしたら、複数のファイルをバインドして ひとつのファイルにするだけでは?
その他の回答 (4)
- adobe_san
- ベストアンサー率21% (2103/9759)
#1です。 webでなくアプリだと言うのは了解しました。 MACで何をキャプチャーしてるかは不明ですが・・・・ ご存知の通りWebは「html」で表示されるので表示後、タグの処理をどうするかで整理できます。 フリーソフトも存在してます。 ところで 何でOCR使うためにPDFの選択されてるのですか? 普通はjpgフォーマットで読めますが・・・・ あっ! アドビのアクロバット内の「OCR」を使うことを前提にしてませんか? そうならお望みの事は出来ません。 多数の書類を処理するなら「OCR」のみに特化したソフトを使うべきです。 出来れば有所プノソフトを! 販売店に相談されれば幾つかのソフト紹介してるれます。
お礼
ご回答頂き、ありがとうございました。 (新しいソフト好きなので) 「有所プノソフト」が引き続き、気になっております。。 ご協力頂き、誠に感謝申し上げます。
- kmee
- ベストアンサー率55% (1857/3366)
・GraphicConverterとか、Imagemagick等コマンドラインツールとかを使えば、「手作業」で一枚にする必要はなくなる ・AppleScriptとかAutomatorとかを使えば、他の「手作業」も自動化できるかもしれない。 「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。 どこまでできるか、はそのOCRソフトの機能しだい。
お礼
AppleScript、Automatorはいつか勉強したいです! 質問に対しても、解決法の方向性を示して頂き 大変助かりました。 有難う御座いました。
補足
ご回答ありがとうございます! >>「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。 こちらが一番現実的かと思います。 AppleScript、Automatorは別件で 何度かトライしたことがあるのですが Web上の文献では私には十分理解できませんでした。 もしご存知であれば、わかりやすい参考書などあれば お手数ですが、お教え頂けると有難いです。 (本屋でも探してみたのですが、 昔の本が多く、購入をためらった経験があるので) 有益な本など無ければ、なんとかバッチ処理する手段を 試しまくろうと思います。
- chieffish
- ベストアンサー率44% (1149/2554)
そもそも、そんな解像度の低そうな書類をまともにOCRできるのですか。
補足
ご回答ありがとうございます。 "まとも" の基準は人それぞれでしょうが 上記質問文の通り、少なくとも 私のキャプチャした素材に関しては 1枚単位で問題なくOCRできています。 要は、複数枚のOCR可能な解像度の画像を 如何に効率的にOCRできるかを ご教授頂きたいのです。
- adobe_san
- ベストアンサー率21% (2103/9759)
確認ですが >1) Mac/iPhoneで大量のスクリーンショットをキャプチャする これwebページじゃ無いの? webページなら別方法あるけど・・・・ 教えてください。
補足
ご協力ありがとうございます! Webページではなく iPhoneアプリ内データのキャプチャや Macのスクリーンショット機能(Cmd + Shift + 4)です。 Webページの場合は どのような方法があるのでしょうか? ■以下、質問文への補足です Office系のソフトに 大量png画像を挿入 → PDF化 → 一括でOCRテキスト処理 の流れで試したのですが、 LibreOfficeですと複数画像が挿入できない時点で頓挫しました。。
お礼
度々ありがとうございます! chieffishさんからのアドバイスをヒントに 下記手順でほぼ理想の結果が得られました。 誠に有難う御座いました☆ ========================== 1) Finderで複数のpngファイルを選択 2) 右クリック or コンテキストメニューで 「このアプリケーションで開く」を選択 3) Acrobat Proを選択 4) ダイアログ表示 「Acrobat は開いているすべての画像ファイルから 単一の文書を作成できます。 すべての画像ファイルを 1 つの文書にまとめますか?」 5) 複数pngファイルが一つのPDFファイルとして開かれる 6) OCR処理を実行 ==========================