• 締切済み

PDF上の文字を認識できるようにする方法

スキャンしたPDF上の文字を、認識できるようにする方法はありますか? 文字を認識し、選択や検索ができるようしたいです。 文字認識でいないPDFから文字認識できるPDFへの変換方法です。 調べてみましたが、自分に合ったものがありませんでした。 ・GoogleDriveを使った方法→できればクラウド上にアップロードしたくない。 ・自分でコードを書いて作る方法→ヒットするのはテキスト抽出する方法(抽出をしたいわけではない) よろしくお願いいたします。

みんなの回答

回答No.3

やはりAcrobat一択になるのではないでしょうか? 私が所持しているのはAdobe Acrobat Standard 2017ですが、テキスト認識機能を含めかなり満足のいく結果です。 https://www.amazon.co.jp/Adobe-Acrobat/b?ie=UTF8&node=3257928051

kakajimmnn
質問者

お礼

ご回答ありがとうございます! やはり有償版の購入が良いでしょうか… 仕事で使用するため、その方向性も検討しながら相談したいと思います。

回答No.2

スマホカメラで映る範囲内なのでページ数があると...あれですが。 Adobeの公式アプリでOCR処理、pdf保存 https://app-liv.jp/4444824/ アプリインスト時にログイン求められ氏名、生年月日を入れる必要があります。 (もちろん偽名ok) デジタル(テキスト)下され文字検索もできますね。 ただ、モニター越しなら表面の汚れも一緒に撮影しているわけなので 妥協は必要ですね。 複数のpdfを結合する方法はcubePDFとかいくつかありますね。

kakajimmnn
質問者

お礼

ご回答ありがとうございます! スマホの公式アプリでそのような機能があるのですね。 社内資料のため、基本的にはスマホ撮影はできませんが、相談材料として検討いたします。

  • tkkz55okwv
  • ベストアンサー率49% (570/1163)
回答No.1

念の為、PDFで文字選択できない、画像処理されたものが対象ということでよろしいでしょうか? ↓文字選択方法 https://helpx.adobe.com/jp/acrobat/kb/cq05250752.html ネットで、PDF OCR で調べていただいて、適切なものを選んでいただくのがベストかと思いますが… とりあえず、Windows10の標準機能として、スクリーンショットから抽出する機能があります。 (Windowsをお使いかわかりませんが…) Windows 10の標準機能だけで画像からテキストを抽出する方法 | TECH+ https://news.mynavi.jp/techplus/article/20210108-1625729/ あと、かなりアナログ感がありますが、 LINEの検索窓にある4角のマーク(マイクマークの左側)をクリックして、 「文字認識」を選んで、 LINEの機能で、文字を読み取るという方法もあります。

kakajimmnn
質問者

補足

ご回答ありがとうございます。 はい、文字選択できない画像処理されたPDFが対象です。 そしてそれを文字選択できるPDFに変換をしたいです。 1つ目のURL先にある、「文字の選択」ができるようにするにはどうしたらいいのか、と悩んでおります。