- ベストアンサー
スキャナーで読み取った文章を検索するには
スキャナーからOCR機能のついたフリーソフトのクセロReaderZeroを使ってテキストの埋め込まれたPDFファイルを作りました。adobe reader 8 で文字を検索するのですが、できません。 教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
検索の方法がわからないのですか? それとも検索した文字が見つからないのですか? もし見つからないのならその文字が存在しないということでは?
その他の回答 (4)
- ORUKA1951
- ベストアンサー率45% (5062/11036)
やはり、文字も画像としてPDF化されているようですね。 だとしたら直接にしろ間接的にしろ、そのままのデザインでテキストデータをもつPDFは作れません。 画像とテキストデータをまったく別のデータとして取り出す必要がありますが、それは不可能です。
No.1です。 >検索の方法はわかります。 >検索した文字が見つかりません。 >文字も存在します。 了解しました。 しかしくどいようですが、文字が存在するのに検索できないということは普通に考えてまずあり得ません。 「すべてを選択」でテキスト全部を選択できますのでWordにでもコピペしてみてください。そして今度はWordで同じように検索してみるのです。AdobeReaderで検索できないのですからきっとWordでもできないと思いますがためしてみてください。 No.3の方がおっしゃるように似てるけど違う文字だったり、 No.2の方がおっしゃるように文字でないためコピペすらできなかったりしませんか?
補足
回答ありがとうございました。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。
- ts3m-ickw
- ベストアンサー率43% (1248/2897)
OCRでテキストになっているのだとすると、文字の誤認識により正しいテキストになっていないのかもしれません。 OCRとて完全ではありませんので、貼り付けたテキストがどんな文字になってるかテキスト抽出して確認してみてはいかがでしょうか。
補足
回答ありがとうございました。 テキスト抽出しましたら、データがありませんでした。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。
- ORUKA1951
- ベストアンサー率45% (5062/11036)
OCRは文字を抽出するソフトです。 ですから、スキャンして文字を取り出して、別途画像も切り抜いてそれを使って書類を作ってPDFにしないと、単にスキャンしてPDFにしたら、画像を圧縮しただけになってしまいます。 その証拠に、できたPDFを拡大すると文字の縁がギザギザで画像のままであることがわかると思います。
補足
回答ありがとうございました。 クセロReaderZeroでjpgデータをOCR変換ボタンを押せば透明テキストデータ付PDFファイルができてると思ったのですが出来ていませんでした。 OFFICE変換ツールボタンでWORD変換すれば誤変換文字がありますが文字検索可能になりました。 透明テキストデータ付PDFファイルが作りたいのですが、教えてください。 よろしくお願いします。
補足
回答ありがとうございます 検索の方法はわかります。 検索した文字が見つかりません。 文字も存在します。 READERによる文書の検索が終了しました。一致するものはありませんでした。とメッセージがでます。