- 締切済み
AdobeReader9で文字列検索が出来ません。
AdobeReader9.2.0で下記の文書を開き、 『東』という文字を簡易検索したのですが、 「Readerによる文書の検索が終了しました。一致するものはありませんでした。」と表示されてしまいます。 ほかの文字列でも同じように検索できません。 何が原因なのでしょうか? https://www.release.tdnet.info/inbs/140120091026036159.pdf 使用OS:WindowsXP SP3
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- dodemoii
- ベストアンサー率59% (769/1282)
PDF内の文字を選択して適当なテキストエディタに 貼り付けても文字が化けてしまうようなので ・検索文字をPDFファイル内から選択した文字を 検索窓に貼り付けて検索を実行すると検索自体は できるようです。 PDF→テキスト変換を試みましたが、文字が化けて 変換できませんでした。 もしテキストを抽出したいと言うことでしたら、 一旦画像に変換して、OCRソフトで変換(PDF→画像→TEXT) すれば、それらしい文字は抽出できました。 (JUST PDFデータ変換)
このpdfは私の今の環境では開くことができないので何とも言えませんが、考えられることとして、 1.全体または「東」が画像になっている。(テキストではないということ。) 2.Illustratorなどで作成してあるが文字がアウトライン化されていて、もはやテキストではない。(ベジェ曲線) の、どちらかではないでしょうか。 ※「ファイル」-「プロパティ」-「フォント」で確認できるかも。 もしフォント名が表示されれば別の原因ということもありますが、ひとつも表示されなければ全体が「画像」か「ベジェ曲線」ということになります。 ※「セキュリティ」がかかっていなければ「すべてを選択」を実行し「東」の文字が選択されるかどうかを確認してください。 選択されなければ「東」はテキストではないということです。
お礼
早速の回答ありがとうございました。 補足の「」は、文字化けした文字を貼り付けたのですが、 文字コードに変換されてしまってますね。
補足
「東」という文字をコピーできますが、 貼り付けると「」というように文字化けしてしまうことが分かりました。 この原因は何でしょうか?
お礼
テキスト抽出方法まで試していただき、ありがとうございました。
補足
質問の目的は、本文書をどうしても検索したいということではなく、 同じような現象を起こす文書をさくっと検索できるようにしたいということです。 本現象の解決か、OCRの方法よりも簡易な代替手段があるといいのですが。