締切済み

スキャナで取り込んだＰＤＦ→エクセル変換→自社データへ

2008/10/29 15:00

ＰＤＦファイル→エクセルのデータへ変換→自社専用データへの流れについて最も効率の良い方法はないでしょうか？私（エクセル初心者）が考える方法以外にアドバイスがあればお願い致します。現在サイト構築に対する見積もりを出す上での説明に必要な内容ですので、先方へわかりやすくお伝えしたいです。質問内容に対する重要項目を記載させていただきます。 ※ＰＤＦファイルはスキャナで取り込まれたものしか入手できません【最終目的】ＰＤＦファイルの中から「必要な文章」と「必要な数値」を抜き出し、自社データとして管理し、その後、自社サイトへその情報を公開したいです。なお、抜き出したデータはそのまま使用するものもあるのですが、そのデータに基づいて算出したい情報もあります。（例）文章Ａならば、答えは文章Ｂとなる設定数値Ｃならば、答えは数値Ｄとなる設定　　　　抜き出したＡやＣといった情報をＢやＤといった答えに導き、その情報をサイトへアップしたいと思っています。　私が考えた流れ (1)ＰＤＦファイルをＯＣＲソフトで認識させる (2)エクセルのデータへ変換させる (3)変換後のデータから「手動」で　セルにあらかじめ組んだ数式（？）へ貼り付けると　必要な情報が導きだされる (4)算出された情報をサイト専用のフォームへ「手動」で　貼り付けなどして、サイト上で閲覧できるようになるエクセル素人レベルで申し訳ありません。エクセルでなくてもかまわないのですが、上記に記載した最終目的に対して限りなく「自動化」しなければいけない状況にあります。なお、ＯＣＲソフト（ＰＤＦ認識ソフト？）もいくつかあるようですが、ＯＣＲソフトの精度は高いに越したことがないので、今は【日本語・英語活字カラーOCRソフト「読取革命Ver.12】の体験版を使用して試案している状況です。「メディアドライブ」のほうが認識率が高い聞くこともあるので、そちらを使用する予定ではあります。もし、現時点でＰＤＦファイルを認識するソフトでこちらのソフト以上のものをご存知でしたら合わせてお答えいただけると非常に助かります。大変わかりにくい文章で申し訳ありませんがよろしくお願い致します。