• ベストアンサー

pdfファイルよりテキストの読み取り

いきなりpdfのver4を使っています。 斜めにスキャンされた文字や、下線が入ったテキストをうまく読み取ってくれません。最新バージョンはいかがでしょうか? ※OKWAVEより補足:「ソースネクスト株式会社の製品・サービス」についての質問です。

質問者が選んだベストアンサー

  • ベストアンサー
  • MT765
  • ベストアンサー率57% (2091/3632)
回答No.2

会社でいきなりPDF Ver10 Completeを使っています。 試しにWordで下線付きの文書(フォントはMSPゴシック)をラスターPDFにして「抽出」を使ってみましたが「抽出するオブジェクトがありません」となって何も読み取れませんでした。 ちなみに同じ文書をベクターPDFにしたところ正常に抽出できましたがこれは全く意味がないですね。 参考 【いきなりPDF Ver.11 - 機能詳細】 https://www.sourcenext.com/product/pdf/feature/ おそらく最新バージョンでも読み取り性能は変わってないのではと思います。

その他の回答 (1)

  • ware121
  • ベストアンサー率42% (1224/2856)
回答No.1

最新バージョンでもデータによっては変換が上手くいかない場合があります。最新バージョンで少なくなる可能性がはあります。

関連するQ&A