• 締切済み

書類の電子化を行っていて、PDFで保存していますが検索がヒットしません

書類の電子化を行っていて、PDFで保存していますが検索がヒットしません(ちなみにmac book proです)。 パソコン上でははっきり文字は読めます。設定の問題でしょうか? また、それなら、いったん読み取ったものを検索できるようにするにはどうすればいいでしょうか?(書類は破棄してもうありません)

みんなの回答

noname#252929
noname#252929
回答No.3

PDFは、画像と文字を扱うことが出来ます。 ですが、スキャナで読み込んだデータは、単純に画像でしか有りません。 スキャナソフトで、画像から文字を抽出するソフトを使用していなければ、文字データにはなりません。 文字データになって居なければ、文字の様に見えるだけの「絵」としか認識していませんので、検索は出来ないのです。 ソフトによっては画像から文字を抽出してくれる物もあると思いますので、それらを使用する必要があります。 ただ、ソフトによっては抽出能力が低く、誤字脱字が多い物なども有りますので、抽出後のテキストデータをチェックしないとそのままで万能につかえると言う物ではありません。

  • hana-hana3
  • ベストアンサー率31% (4940/15541)
回答No.2

Macでは文書内の検索が可能なのですか? PDF化の手順が書かれていませんが・・・ スキャナーで読み取ったものなら画像なので、文書内に文字情報は含まれませんから、検索しても何もヒットしませんよ。

回答No.1

まず、何を使用してどういった書類をPDF化しているかによりますが… 書類をスキャニングしてPDF化しているのでしたら OCRソフト側の精度次第です。 書類がWordやExcelなど文字データがある物に対しては、 フォントが埋込でしたら、PDF化した際に 文字ボックス(段や行の繋がり)がバラバラになってしまっていて、 単語として連結していない場合もあります。 テキスト選択ツールできちんと繋がって選択できるのであれば検索でもヒットします。 前者の場合、検索ヒットさせるには、OCRでテキスト化するか、 打ち直して作成し直すしかないでしょう。 後者の場合は文字の精度も高いと思われますので 元データがないのでしたらOCRで一発変換が可能かと思われます。 AcrobatのProシリーズでOCR機能を使用して再読込させるか ドキュメントスキャナを利用すると良いと思います。

参考URL:
http://scansnap.fujitsu.com/jp/