• ベストアンサー

いきなりPDF to Dataについて

私こと、今般ソースネクスト社の「いきなりPDF」と「いきなりPDF to Data」を同時購入し、早速使用を試みましたが、うまく使いこなせず困っています。具体的に申し上げますと、(1)「いきなりPDF」でテキストファイルをPDFファイルに変換し、それを「いきなりPDF to Data」で再度テキストファイルに変換し直すと、概ね良好に変換されますが、(2)「いきなりPDF」でワードの文書をPDFファイルに変換し、それを「いきなりPDF to Data」で再度ワードに変換した場合にうまく変換されません(=ディスプレイ上は、一見、通常のワード文書に変換されたように見えますが、実は、テキストボックスが組み合わされた状態になっております)。つきましては、(2)のケースでうまく変換できる工夫がありましたら、ご教示願います。なお、上述の(1)、(2)の作業は、一見無意味のようですが、仕事の関係で、このような作業が必要である旨、念のため申し添えます。

質問者が選んだベストアンサー

  • ベストアンサー
  • habburu
  • ベストアンサー率42% (373/880)
回答No.3

Wordに特化したOCRソフトを使ってみたらどうでしょうか。 製品名で、やさしくWord OCR v.3.0やワンタッチOCR Ver.2 for Word 文書OCR for Word V5.0など。体験版もあると思います。 e.Typistと読んde!!ココを持っていますが、元がWordのPDFを認識させWordへ 転送した時に、「テキストボックスの組み合わせ」になったことがあります。 ExcelにもWordにもどちらにも転送することを考えると テキストボックスになるのも仕方ないように思います。

noname#13483
質問者

お礼

お礼が遅くなりました。 「テキストボックスの組み合わせ」になるのが、私だけでないことが確認でき、ある意味安心できたような気分です。 今後ともよろしくお願いいたします。

その他の回答 (2)

  • rinkun
  • ベストアンサー率44% (706/1571)
回答No.2

PDFからレイアウト情報込みでワードに変換するのはあまり上手くいかないでしょう。 レイアウトは諦めてPDFからテキストに変換してワードで読み込んでレイアウトし直すのが比較的手間が少なくて済むかと思われます。

noname#13483
質問者

お礼

お礼が遅くなりました。 PDFからデータへの変換技術に、まだ改善の余地があることを認識したような気がします。 今後ともよろしくお願いいたします。

noname#17254
noname#17254
回答No.1

なんかPDFってものの考えから、PDFファイルからデータ抽出ってのもなんか変ですよね。 余談ですがPDFファイル作るだけだったら、フリーのもの結構ありますよ。

noname#13483
質問者

お礼

お礼が遅くなりました。 PDFからデータに変換するソフトで、フリーのものをご存じでしたら、教えていただければ幸いです。

関連するQ&A