• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:大量のスクリーンショットからテキストを抜き出したい)

大量のスクリーンショットからテキストを抜き出す方法

このQ&Aのポイント
  • Mac/iPhoneで大量のスクリーンショットをキャプチャし、PDF等のファイルにまとめてOCRテキスト認識を行い、テキストのみを抜き出す方法について教えてください。
  • 1枚ずつではなく、1000枚単位のスクリーンショットからテキストを抜き出す方法を教えてください。
  • 環境はMac OS X 10.7.4 Lionで、Acrobat 9 ProとLibreOffice 3.5.4.2を使用しています。テキストだけ抜き出せる方法を教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.5

>要は、複数枚のOCR可能な解像度の画像を >如何に効率的にOCRできるかを Acrobatを使うのでしたら、複数のファイルをバインドして ひとつのファイルにするだけでは?

doh-
質問者

お礼

度々ありがとうございます! chieffishさんからのアドバイスをヒントに 下記手順でほぼ理想の結果が得られました。 誠に有難う御座いました☆ ========================== 1) Finderで複数のpngファイルを選択 2) 右クリック or コンテキストメニューで  「このアプリケーションで開く」を選択 3) Acrobat Proを選択 4) ダイアログ表示  「Acrobat は開いているすべての画像ファイルから   単一の文書を作成できます。   すべての画像ファイルを 1 つの文書にまとめますか?」 5) 複数pngファイルが一つのPDFファイルとして開かれる 6) OCR処理を実行 ==========================

その他の回答 (4)

  • adobe_san
  • ベストアンサー率21% (2103/9759)
回答No.4

#1です。 webでなくアプリだと言うのは了解しました。 MACで何をキャプチャーしてるかは不明ですが・・・・ ご存知の通りWebは「html」で表示されるので表示後、タグの処理をどうするかで整理できます。 フリーソフトも存在してます。 ところで 何でOCR使うためにPDFの選択されてるのですか? 普通はjpgフォーマットで読めますが・・・・ あっ! アドビのアクロバット内の「OCR」を使うことを前提にしてませんか? そうならお望みの事は出来ません。 多数の書類を処理するなら「OCR」のみに特化したソフトを使うべきです。 出来れば有所プノソフトを! 販売店に相談されれば幾つかのソフト紹介してるれます。

doh-
質問者

お礼

ご回答頂き、ありがとうございました。 (新しいソフト好きなので) 「有所プノソフト」が引き続き、気になっております。。 ご協力頂き、誠に感謝申し上げます。

  • kmee
  • ベストアンサー率55% (1857/3366)
回答No.3

・GraphicConverterとか、Imagemagick等コマンドラインツールとかを使えば、「手作業」で一枚にする必要はなくなる ・AppleScriptとかAutomatorとかを使えば、他の「手作業」も自動化できるかもしれない。 「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。 どこまでできるか、はそのOCRソフトの機能しだい。

doh-
質問者

お礼

AppleScript、Automatorはいつか勉強したいです! 質問に対しても、解決法の方向性を示して頂き 大変助かりました。 有難う御座いました。

doh-
質問者

補足

ご回答ありがとうございます! >>「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。 こちらが一番現実的かと思います。 AppleScript、Automatorは別件で 何度かトライしたことがあるのですが Web上の文献では私には十分理解できませんでした。 もしご存知であれば、わかりやすい参考書などあれば お手数ですが、お教え頂けると有難いです。 (本屋でも探してみたのですが、 昔の本が多く、購入をためらった経験があるので) 有益な本など無ければ、なんとかバッチ処理する手段を 試しまくろうと思います。

  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.2

そもそも、そんな解像度の低そうな書類をまともにOCRできるのですか。

doh-
質問者

補足

ご回答ありがとうございます。 "まとも" の基準は人それぞれでしょうが 上記質問文の通り、少なくとも 私のキャプチャした素材に関しては 1枚単位で問題なくOCRできています。 要は、複数枚のOCR可能な解像度の画像を 如何に効率的にOCRできるかを ご教授頂きたいのです。

  • adobe_san
  • ベストアンサー率21% (2103/9759)
回答No.1

確認ですが >1) Mac/iPhoneで大量のスクリーンショットをキャプチャする これwebページじゃ無いの? webページなら別方法あるけど・・・・ 教えてください。

doh-
質問者

補足

ご協力ありがとうございます! Webページではなく iPhoneアプリ内データのキャプチャや Macのスクリーンショット機能(Cmd + Shift + 4)です。 Webページの場合は どのような方法があるのでしょうか? ■以下、質問文への補足です Office系のソフトに 大量png画像を挿入 → PDF化 → 一括でOCRテキスト処理 の流れで試したのですが、 LibreOfficeですと複数画像が挿入できない時点で頓挫しました。。

関連するQ&A