ベストアンサー Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法 2008/05/21 18:07 Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法を教えて下さい みんなの回答 (2) 専門家の回答 質問者が選んだベストアンサー ベストアンサー fufu01 ベストアンサー率31% (498/1603) 2008/05/21 19:01 回答No.1 1.OCRするとはスキャナーで原稿を読み取るということでしょうか。 その手順で、PDFファイルを作成すると、 ハード;ACROBAT6インストール済みのPCにスキャナーを接続し正常に動作する状態。 Acrobat6の操作;ツールバーのpdfの作成-スキャナー で接続済みのスキャナーを確認してスキャンすれば、pdfファイルが完成。 但し、スキャナーで取り込んだデータをpdf化したファイルは、画像ファイルですから、画像に書かれているテキスト文字の検索はできません。 2.通常テキスト選択可能なpdfファイルを作成するには、ワードやエクセル等の文字データファイルをacrobatを使用してpdf化します。具体的手順は以下3.です。 3.画像データの文字を検索可能なPDFファイルに変換するには、画像→文字変換ソフト(よんでココ、読み取り革命 等のソフト)で画像を文字に変換後データファイルに保存してから、そのファイルをacrobat6でPDFファイルに変換する 何か参考になれば幸いです。 質問者 お礼 2008/05/22 09:10 ご回答ありがとうございます。 Acrobat6.0の機能にOCRでテキスト検索可能なPDFファイルを作る ことが出来るみたいなのでその設定を探しています。 広告を見て全文表示する ログインすると、全ての回答が全文表示されます。 通報する ありがとう 0 その他の回答 (1) fujillin ベストアンサー率61% (1594/2576) 2008/05/21 20:51 回答No.2 手元にあったAcrobat 7.0で確認しましたが、6.0でも多分同じでしょう。 1)スキャンして読み込むときに「OCR認識をする」にチェックを入れればできます。 2)一端読み込んだイメージをOCRする場合は、「文書」-「OCRを使用してテキストとして認識」で可能です。 スキャンデータが144dpi以下だとだめだと、説明はありますが、本当にだめかは実験していません。 いずれにしろ、解像度が高いほうが認識精度はあがりますね。 質問者 お礼 2008/05/22 09:13 ご回答ありがとうございます。 知り合いがAcrobat 7.0を持っていてその方法を教えてもらったのですがAcrobat 6.0ではその部分に設定が有りませんでした。 機能としてはAcrobat6.0にもOCRでテキスト検索可能なPDFファイルを作るみたいなのですが、どのように設定したら良いか解りません。 何処の設定に有るのか悩んでいます。 広告を見て全文表示する ログインすると、全ての回答が全文表示されます。 通報する ありがとう 0 カテゴリ パソコン・スマートフォンソフトウェアその他(ソフトウェア) 関連するQ&A AcrobatでPDFファイルにする方法 Acrobat 5.0でプリント物からOCRを使ってPDFファイル を作る方法がよくわかりません。PDFファイルはできるのですが、それを編集するためにはOCRソフトをプラグインする 必要があるようですが、そのプラグインの方法がわかりません。現在、OCRソフトは「読んでココ」を使っています。 もっと精度の高いOCRソフトが必要になるのでしょうか? 透明テキスト付きPDFをバッチ処理でOCR 中途半端に透明テキストのついたPDFがたくさんあり, バッチ処理にて新たにOCRをかけなおしたいと考えています. 手元には Acrobat 6 Professional Acrobat 7 Standard 読んdeココ Ver13 読み取り革命 Ver12 があります. Acrobat 6.0 ProfessionalのPaper Captureだと 元の透明テキストのせいかOCRがかけられません. (テキスト付きで完全な画像ファイルではないと言われます) 読んdeココはバッチ処理ができないが, 個別であれば期待した処理ができます. 読取革命はフォルダーウォッチャーという機能がありますが PDF→PDFは不可・・・ といった具合なのですが, バッチ処理でどうにかする方法はないでしょうか. 数万以内であればあらたにソフトウェア購入もできます. よろしくお願いします. アドビアクロバットのOCR機能について アドビアクロバット(目下,無償版)でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。 文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。 一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか(つまり前段のテキスト取り出しはOCRではないということ?) アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。 よろしくお願いします。 携帯料金を賢く見直す!格安SIMと端末選びのポイントは? OKWAVE コラム 「透明テキスト付きPDF」の検索 「透明テキスト付きPDF」の検索の方法を教えて下さい。 Acrobatを使えば「透明テキスト付きPDF」の検索が出来ることはわかるのですが、Google デスクトップやWindowsの検索等の方法で「透明テキスト付きPDF」の検索をする方法があれば教えて下さい。 以上 透明テキスト付きPDFファイルを作成したい pdMaker for ScanPaper や 読んde!!ココ 等のOCRソフトでは、スキャン後、認識した文字を透明テキストにてPDFに付加し、その情報をもとに文字情報を検索できることがわかりました。 この「透明テキスト」は、adobe Acrobat 7.0でも 作成することは出来るのでしょうか。 Acrobat 7.0評価版をダウンロードしたのですが、「透明テキスト」というような項目はないようです。 なお、Acrobat7.0の メニュー→文書→透かしと背景の追加 機能が同等の機能かとも思うのですが、よくわかりませんでした。 既存のPDF形式のデータに、検索可能な文字情報を付加する方法を教えてください。 PDFファイルに表示されているテキスト検索は可能ですか? ホームページを作成する際に、ページのリンクボタンからPDFファイルにリンクさせ、そのPDFファイルのテキストのキーワードを検索できるようにしたいと考えています。 AcrobatのPDFファイルに表示されているテキストを検索することはできるのかどうか教えてください。 1.ブラウザ上でできるのか。 2.ブラウザ上に表示させているPDFファイルのテキストのキーワードを検索しようとした場合、ASPやJavaScript等プログラムを作成すれば検索は可能となるのか。 質問が下手ですみませんが、ヒントでもいいので是非教えてください。宜しくお願いします。 アクロバット7.0文書をocrで保存したい アクロバットスタンダード 7.0を使っています。 PDFをocrに変換できるようなのですが、やり方がわかりません。 「文書 → ocrを利用してテキストとして認識 → 開始 → OK その後どうすれば良いのかわかりません。 PDFをAcrobatで透明PDF化する方法 PDFの文書を、文字選択できる状態にするため、Acrobat DC で変換したいのですが、可能なのでしょうか? というか、最適化をすれば、文字選択はできるようになるのですが、圧縮がかかると文字がぼやけて非常に汚くなってしまいます。見た目はそのままでOCR処理(透明テキスト化、と言うのでしょうか)をすることは可能なのでしょうか?または、Acrobat DCにはその機能はないのでしょうか? 画像とテキストが混在したPDFファイルをOCR認識させる方法 1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。 この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。 スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。 できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。 なお、当方のOSはWindowsXPです。 以上よろしくお願いします。 PDFからテキストだけ抜き出すには OCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。ここからノートパッドかワードにテキストだけコピーしたいのですが、どのようにしたらいいのかわかりません。教えてください。(このソフトのほかにAdobe Reader 8 と Adobe Acrobat 6 をインストールしてあります。) PDFのOCR変換 お世話になります。 現在やさしくPDF OCR v2.0を使用しているのですが、昨日スキャナでデータをエクセルに取り込んで保存形式をPDFにして、その保存したものを上記ソフトでテキストに変換しようとしたのですがファイルを読み込んでくれません。 PDFでも変換可能なものもあるのでなぜこの場合ができないのかわかりません。(PDFのバージョンやエクセルでのPDFは何かAcrobatと違う?) 使用OSはWinVistaHomeです。 どうか宜しくお願いします。 pdfをテキストファイルにしたいです 文書をスキャナで読み込み、ひでまるエディタでテキストファイルにしたのですが。 再度やってみたらやり方を忘れてしまってできません。 スキャナで読み込んだtifファイルを保存して、アクロバットリーダーで PDFにしました。 それを何かをして保存したらデスクトップに秀丸でテキストファイルになって保存できて いました。 再度やってみたら、どうやったのか、どうしても思い出せないのです。 それと、A5の本を見開きで横にしてスキャナで取り込んだので、文字が横になっているので( A4は縦に置かないと認識しないので) アクロバットリーダーで90度回転させ、保存しても、ファイルを開いたら 読み込んだままの90度回転した(文字が横になっている)ファイルになっています。 どうしたら文字が真っ直ぐ上を向いたままの状態で保存できるのでしょうか? 聞きたいことは、 1.PDFをテキストファイルにする方法 2.PDFのファイルを90度回転させたまま保存する方法です。 OSはWINXP アクロバットリーダーはX アクロバット スタンダード7.1もあります。 よろしくお願いします。 ヤバいパソコンが壊れたかも!?事前に知っておきたい3つの兆候と対策 OKWAVE コラム PDFファイルを検索可能型にしたい PDFファイルを検索可能型にしたい PDFファイルを検索可能型にしたいのです 透明テキスト付加などと言われていますが スキャナーでスキャンして作成したPDFファイルは 要するにテキスト情報が無い”絵”の状態です この状態だと ある文字が含まれるページを探すには1ページずつ開いて目だ探すしかありません しかし透明テキストが付加されているPDFファイルだと アクロバットリーダーなどの 検索機能が使えます 今時のスキャナーはPDFファイル作成時にテキスト情報を付加する機能があり これはこれで問題ないのですが その機能を持たないスキャナーでスキャンして作成したなどのPDFファイルでは 後からテキスト情報を付加してやる必要があります この機能を持ったソフトを探しているのですが なかなか見つかりません ソースネクストのものを購入しましたが あくまでもスキャナーで読み取った時に テキスト情報を付加するものであり既に出来上がっているPDFファイルには 対応しませんでした 無駄金使ってしまいました この要望にこたえられるソフトはあるのでしょうか? Docuworcusも利用していますが これもそのあたりがイマイチです・・。 PDFファイルを一括して透明テキスト付PDFファイルにするソフトはありませんか? 書類をスキャンした数千のPDFファイルがあります。このファイルを管理するために、透明テキスト付きにしてデスクトップ検索ソフトを使いたいと思います。 複数のPDFファイルをOCRにかけて一気に透明テキスト付きにしてくれるソフトはありませんか。 キーワードを引っかけられればいいので、認識精度をうるさくは言いませんが、斜めにスキャンされたものを自動修正して文字認識してくれるようであれば最高だなぁと思います。 Acrobat8でpdfファイルを軽くする方法について イラストレーターやフォトショップで作ったデータをAcrobat8でpdfファイルにしているのですが、 ファイルサイズを抑えるために色々設定を弄り、イラストレーターからpdfにする時に圧縮サイズなどを変え、pdfにしたらAcrobat8で 最適化をしてサイズを抑える、という方法で行っていました。 ところが、友人から聞いた方法で、まずイラストレーターからpdfにする時は、画像の圧縮など行わずにpdf化する。 それをAcrobat8で印刷→Adobe PDFというプリンターで印刷すると、かなり小さくなる、と聞きやってみたところ 自分が四苦八苦してファイルサイズを抑えていたのに、それよりも かなり軽くすることができました。画像の劣化もそれほどでもなく モニターで見るには十分な画質を保てています。 このAdobe PDFで印刷するとどうしてこんなに軽く出来るのでしょうか? 何か、削っていはいけないデータを削ってしまっているようで怖いのですが、問題などありましたら教えてください。 埋め込みフォントが消されてフォントが変わってしまう事もないようです。 ※Acrobat8は学校のPCに入っているので、こうしてみなさいというアドバイスにすぐに対応できない場合があります。なるべく早めに試して返事をするようにしますので、ご了承ください。 フリーソフトでPDF表示テキストを削除 PDFから非表示テキスト情報(OCR)を削除してデータサイズを小さくしたいです。いろいろと調べてみたのですが、Adobe Acrobat を使った方法しか見つかりませんでした。Acrobatは持っていないのでフリーソフトでPDF表示テキストを削除する方法を知りたいです。宜しくお願いします。 OCR機能のないスキャナで取り込んだPDFをOCR化できる? OCR機能のないスキャナで取り込んだPDFファイルが多数あります。 このPDFファイルを、OCR情報を含んだPDFファイルに変換する方法はあるのでしょうか? 要は、最初からOCR付スキャナで処理すれば良かったのですが・・・。 【PDF】これはOCRなのでしょうか? エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか? pdfファイルのテキスト部分を書き出すことはできますか? タイトルの通りなんですが… 文字情報を多く含むpdfファイルのテキスト部分だけ書き出して テキストファイルとして保存することはできるのでしょうか? Adobe Acrobat 4.0 はあります。 よい方法があったら教えてください。 よろしくお願いいたします。 イメージから作ったpdfファイルのテキスト化 Acrobat5.0について伺います。 イメージファイル(gif,jpg等)から作ったpdfファイルは、テキスト化できませんか? WORD等、テキストファイルから作ったpdfファイルは、テキスト選択ツールで容易にテキスト化できますが・・・。 注目のQ&A 「You」や「I」が入った曲といえば? Part2 結婚について考えていない大学生の彼氏について 関東の方に聞きたいです 大阪万博について 駅の清涼飲料水自販機 不倫の慰謝料の請求について 新型コロナウイルスがもたらした功績について教えて 旧姓を使う理由。 回復メディアの保存方法 好きな人を諦める方法 小諸市(長野県)在住でスキーやスノボをする方の用具 カテゴリ パソコン・スマートフォン ソフトウェア Excel(エクセル)Word(ワード)PowerPoint(パワーポイント)Access(アクセス)その他MS Office製品オフィス系ソフトPhotoshop(フォトショップ)Illustrator(イラストレーター)その他Adobe製品画像・動画・音楽編集ホームページ作成ソフト筆まめ・はがき作成フリーウェア・フリーソフトその他(ソフトウェア) カテゴリ一覧を見る OKWAVE コラム 突然のトラブル?プリンター・メール・LINE編 携帯料金を賢く見直す!格安SIMと端末選びのポイントは? 友達って必要?友情って何だろう 大震災時の現実とは?私たちができる備え 「結婚相談所は恥ずかしい」は時代遅れ!負け組の誤解と出会いの掴み方 あなたにピッタリな商品が見つかる! OKWAVE セレクト コスメ化粧品 化粧水・クレンジングなど 健康食品・サプリ コンブチャなど バス用品 入浴剤・アミノ酸シャンプーなど スマホアプリ マッチングアプリなど ヘアケア 白髪染めヘアカラーなど インターネット回線 プロバイダ、光回線など
お礼
ご回答ありがとうございます。 Acrobat6.0の機能にOCRでテキスト検索可能なPDFファイルを作る ことが出来るみたいなのでその設定を探しています。