• 締切済み

スキャナで取り込んだPDF→エクセル変換→自社データへ

PDFファイル→エクセルのデータへ変換→自社専用データへの流れについて 最も効率の良い方法はないでしょうか? 私(エクセル初心者)が考える方法以外に アドバイスがあればお願い致します。 現在サイト構築に対する見積もりを 出す上での説明に必要な内容ですので、 先方へわかりやすくお伝えしたいです。 質問内容に対する重要項目を記載させていただきます。 ※PDFファイルはスキャナで取り込まれたものしか入手できません 【最終目的】 PDFファイルの中から「必要な文章」と「必要な数値」を抜き出し、 自社データとして管理し、その後、自社サイトへその情報を公開したいです。 なお、抜き出したデータはそのまま使用するものもあるのですが、 そのデータに基づいて算出したい情報もあります。 (例) 文章Aならば、答えは文章Bとなる設定 数値Cならば、答えは数値Dとなる設定      抜き出したAやCといった情報をBやDといった 答えに導き、その情報をサイトへアップしたいと思っています。   私が考えた流れ (1)PDFファイルをOCRソフトで認識させる (2)エクセルのデータへ変換させる (3)変換後のデータから「手動」で   セルにあらかじめ組んだ数式(?)へ貼り付けると   必要な情報が導きだされる (4)算出された情報をサイト専用のフォームへ「手動」で   貼り付けなどして、サイト上で閲覧できるようになる エクセル素人レベルで申し訳ありません。 エクセルでなくてもかまわないのですが、 上記に記載した最終目的に対して 限りなく「自動化」しなければいけない状況にあります。 なお、OCRソフト(PDF認識ソフト?)もいくつかあるようですが、 OCRソフトの精度は高いに越したことがないので、 今は【日本語・英語活字カラーOCRソフト「読取革命Ver.12】 の体験版を使用して試案している状況です。 「メディアドライブ」のほうが認識率が高い聞くこともあるので、 そちらを使用する予定ではあります。 もし、現時点でPDFファイルを認識するソフトで こちらのソフト以上のものをご存知でしたら 合わせてお答えいただけると非常に助かります。 大変わかりにくい文章で申し訳ありませんが よろしくお願い致します。

みんなの回答

  • ralf124c
  • ベストアンサー率52% (232/446)
回答No.2

他と比較したことが無いのでよくわかりませんが、いきなりPDFtoDATAと言うのがあります。 認識は取り込む原版によるところが大きいのでなんともいえませんが、一世代古いバージョンを持っていて重宝しています。

参考URL:
http://www.sourcenext.com/titles/use/92000/?i=o_ranking
HASH88
質問者

お礼

ありがとうございます。リンク先にあった5製品の評価が参考になりました

回答No.1

固定帳票から数値を取り込まれるのであれば、 以下のような製品もあります。

参考URL:
http://biz.mediadrive.jp/products/package/formocr/
HASH88
質問者

お礼

ありがとうございます。参考にさせていただきます。

関連するQ&A