- ベストアンサー
PDFからエクセルへの変換について
- PDFファイルをエクセルに変換する方法を探しています。特に画像としてPDFになったファイルをテキストとしてエクセルに変換する方法が知りたいです。
- ネットで検索したり、エプソンのスキャナを使用してOCRで読み取ったりしましたが、うまくいきませんでした。無料で利用できる方法があれば教えてください。
- エプソンのスキャナを使用して画像としてPDFになった表をテキストとしてエクセルに変換したいですが、綺麗に変換できませんでした。無料の方法があれば教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
PDFはテキスト情報も併せ持つものと、画像的なものだけのものが会えいます。 後者と判明したようだから、途はOCRソフトで、テキスト化(さらに欲を言えばエクセルファイルに、さらに罫線つきとか)を目指すほか無いわけです。 そのOCRソフトは実は技術的には難しい(こうしたら正確に文字を決められる、という方法は無いようで、色んな方法を組み合わせるようです(語句辞書を併用とか。特に手書き文字は難しい。)だから高性能のものは高価だと思います。 (ちなみに1980年代はコンピュターも専用機が必要で、数千万円もした。) プリンタに付属するOCRソフト辺りが、一番安価でしょう。個人でOCRプログラムを造るのは難しそうなので、フリーソフトではそこそこのものしか無いのではないかな。やろうとしていることが高等な技術なので、お金のかからない、といっても一般には無理だ。 ーー もうひとつ、スキャナで取り込んだ瞬間のメモリの画像ファイルと、既にPDF化してパソコンディスク二「保存してある画像ファイルは、コンピュタ的には同じ部類のものなのだが、パソコンのPDFファイルをOCRソフトに読ませることが出来るかどうかはソフトのつくり具合によるが、出来ないかもしれない。 よく調べてください。出来ない場合は1枚ずつOCRで画像ファイルを取り直しにだるかもしれない。 PDFをOCRに架けられる単位というものが、ソフトで決っているものです。 ーーー Googleで「VECTOR OCR フリー」などで照会してみてみてください。 http://freesoft.livedoor.biz/ >フリーソフトベクターの全体でOCRのソフトを探すと、45のソフトウェアが検索にヒットします。 名刺読み取り専用(項目が決っていて、活字印刷物が多い)などの物が含まれているかも。
その他の回答 (2)
- Wendy02
- ベストアンサー率57% (3570/6232)
>エプソンのスキャナがあり、OCR(だったかな?)の機能 たぶん、『読んde!ココ』が入っていると思いますが、これに敵うものはないと思うのです。 もし違うソフトでしたら、無視して結構です。 『読んde!ココ』は、表に対して、使いこなしが、イマイチなってしまったようですね。たぶん、慣れの問題なんだろうと思います。昔は、もっと上手く出来たような気がしますが……。 画像対象を「表」として選んで、OCRの青い線ではなく、赤い線とセルの枠線を上手く合わせられればよいのですが、それが、青い線だけで区分けされていると思うと、そこが抜けてしまうのですね。それで、上手く切り分けできないのですが、丁寧に、頑張ってするしかないと思います。何度もやりなおして、イラッとするのは分かるけれども、残念ですが、私の知る限り、他に勝るものがないと思います。フリーソフトなどとは比較にならないと思います。 もし、『読んde!ココ』を持っていなかったら、試用版が出ていますし、それはフル機能で、数週間か使えます。 努力しかないみたいなことしか言えなくてすみません。他のOCRもあるけれど、私は、『読んde!ココ』が一番だったのです。
お礼
ありがとうございます。たまたまそれを入手したのですが、やはり改行などの誤りがひどくて、結局は使えませんでした。 それさえなければ読み取り自体はうまくいったのですが、、どうもありがとうございました!
- sakaota
- ベストアンサー率20% (3/15)
スキャナで読み取り、画像になったものは、画像のままですので、文字としては取り込めません。文字情報はありません。OCRなどで取り込めば文字になっているので、取り込めます。
お礼
ありがとうございます。今回は、読み取りのOCRを入手したのですが、改行されてしまい(変なふうに)うまくいきませんでした。 またの機会に試してみます。ありがとうございました。