- ベストアンサー
PDF からの 数値データ抽出
PDFファイルに数値データが表として載っています。 どうにかデータ(EXCEL,CSV など)で抽出したいのですが。 そもそもPDFなので無理は承知なのですが 画像データから数字をデータとして 変換できるソフトor方法 何かありませんでしょうか?
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
まず、PDF といってもビットイメージの場合があります、 この場合はちょっと除外します。 文字コードで書かれてる場合(文字で検索するとヒットする)は、 <Alt>を押しながらだと四角形で範囲指定できますから、これで スペース区切りでコピーが取れます。 そのまま Excel に貼り付けると、横1列xタテ数行に貼りつきます。 このままでは横方向は1列のみ使ってる状態なので、 スペースで区切って複数セルに分割する操作をします。 対象セルの列を選択し、データ(D)→区切り位置(E) で子ウィンドウを開き 「元のデータ形式」で ●カンマやタブなどの... のラジオボタンにマークを入れ [次へ(N)]「区切り文字」で チェックボックス ■スペース にチェックを入れます。 この時に下の小窓に区切りの具合が表示されますから これで問題なさそうなら ボタン[完了]を押すと実行します。 これで横方向も複数セルに分割されます。 あと、あとで気付いたのですが、この分割ルールはその後も機能しているようで、 以降は「内容がスペース区切り状態」の文字列ペーストを?貼り付けると、 横方向を自動的に複数セルに分けて格納してくれれます。 以上は Excel2003 で確認したことですが、他バージョンでも同様かと思います。
その他の回答 (5)
- imogasi
- ベストアンサー率27% (4737/17069)
http://internet.watch.impress.co.jp/cda/biz_tool/2008/09/09/20801.html のような記事がある。使えないでしょうか。 PDFはテキスト(文字コードで)も併せ持つ場合がある。 その場合検索文字指定で検索が出来たりする。 http://oshiete1.goo.ne.jp/qa3503153.html 参考
お礼
一応質問の問題は解決したのですが この参考URLは非常におもしろかったです 今後の参考にさせていただきます。 ありがとうございました。
- Wendy02
- ベストアンサー率57% (3570/6232)
こんばんは。 >画像データから数字をデータとして 変換できるソフトor方法 >何かありませんでしょうか? 別に、データが埋め込みされているなら、それは、いずれにしても、テキストデータは取れるでしょうけれども、私の経験では、列と行の関係がうまく行きませんでした。 データが埋め込みなされていなくても、OCR(『読んde!ココ』など)で取れば出来ます。そちらのほうが楽です。そして、やはり、OCRの専門メーカーのものが良いと思います。仕事の原稿(PDF)は、100%データ埋め込みされていませんから、それが出来ないなら、私は仕事になりません。 p.s.以前、私がいろいろ使っていたOCRの評価は、現在、かなり変わってしまいましたが、上記の『読んde...』は、表には格段に強いようですね。
お礼
開発関係の書類なので データは取れませんでした。 おっしゃるようにスキャナー&OCRにて 問題は解決しました。 少し面倒ですが 仕方ないですね ありがとうございました。
- saru1234
- ベストアンサー率37% (223/593)
ANo.3 です、足りなかったので補足。 > <Alt>を押しながらだと四角形で範囲指定できますから、これで > スペース区切りでコピーが取れます。 これは Adobe Reader 7 でのハナシです。現在流通してるのは Ver9 になってるようですが、 基本的操作は多分変わってないと思います...
- ookami1969
- ベストアンサー率14% (137/953)
右クリックして「すべて選択」で 全部選択出来ればコピペできますよ。
お礼
前選択できません・・・。 他にも試してみます
- n-jun
- ベストアンサー率33% (959/2873)
お礼
参考URLありがとうございます。 いろいろ見てみます
お礼
非常に丁寧にありがとうございました。 今回は上記手順ではできませんでした BITイメージか作成先でなにかしているとは思います 今後の参考になりました ありがとうございました。