• ベストアンサー

画像ファイル中の文字をテキスト化するソフト

画像になっている文書の文字をテキストデータにする、2~3千円の安いソフトはないでしょうか。 今すぐ必要なのでダウンロードできるものがよいです。 PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。制限は何もかかってないし、文字列の選択もできます。 で、画像としてキャプチャして、テキストにできないかと思うのですが・・・Webで探して、高価なOCRソフトが見つかったのですが、の今回だけのために買うのはもったいないし・・・「読んdeココ」は、体験版だとクリップボードからのOCR機能がないので、だめでした。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • foxfire
  • ベストアンサー率36% (22/61)
回答No.4

>スキャナで読み取るのではなく、PC上で画像として保存すればよいのですよね そうです。 PC上で画像での処理で大丈夫です。 デジカメ、TWAIN、画像からの読み込みが可能です。

toyboys
質問者

お礼

どうもありがとうございました。 安いので買ってみました。「e」が全部「c」になったりして文字化けは多いですが、ゼロから手入力するよりはずっと楽なので、モトは取れた感じです。

その他の回答 (3)

  • foxfire
  • ベストアンサー率36% (22/61)
回答No.3

>画像としてキャプチャして、テキストにできないかと思うのですが・・・ PDFデータをキャプチャーして、JPG等のデータにしてからなら ソースネクストの「本格読取(R)」で可能かと思います。 直接PDFデータを読み込む事は出来ないので、一度Acrobat Reader で読み出してから キャプチャーして別形式データで保存後に「本格読取(R)」で編集って流れです。 私は使用してますが、かなり便利です。 スキャナーで読み取った雑誌をワード形式で編集出来たりします。 「本格読取(R)」の仕様は参考URLにて確認してみて下さい。(値段は2,079円で即DL可能です)

参考URL:
http://www.sourcenext.com/products/honkaku_y/
toyboys
質問者

補足

ありがとうございます!よさそうですね。 スキャナで読み取るのではなく、PC上で画像として保存すればよいのですよね(スキャナを持ってないので)。 Webサイトの説明では確信が持てなかったのですが・・・

  • s_yoshi_6
  • ベストアンサー率73% (1113/1519)
回答No.2

下記ページに、 『…和文フォントを含むPDFファイルを作成する場合、Acrobat3互換形式を選択してPDFファイルを作成すると、和文フォントはエンコーディング=ビルトインでPDFファイル中に埋め込まれてしまいます。この形式で作成されたPDFファイルはAcrobat3、Acrobat4で正常に表示・印刷されるように見えますが、Acrobat3 環境では以下の不具合が見られます。 1.テキストの再利用が不可(コピー&ペーストで他アプリで文字化け) 2.テキスト検索不可 』 との旨、記述があります。 (元ページが見つからないのでGoogleのキャッシュです) http://www.google.co.jp/search?q=cache:1berJqDZNpcJ:www1.kcn.ne.jp/~k-tm/KTworld/tandt/driverwin.html+PDF+%E3%83%95%E3%82%A9%E3%83%B3%E3%83%88%E3%80%80%E3%82%B3%E3%83%94%E3%83%BC%E3%80%80%E6%96%87%E5%AD%97%E5%8C%96%E3%81%91&hl=ja PDF書類の閲覧には、どのようなソフトをお使いでしょうか。もしAcrobat Reader 3.0xなど古いバージョンのソフトをお使いでしたら、新しいバージョンのものをインストールすると、もしかしたらコピー&ペーストの際の文字化けが解消するかもしれません。 http://www.adobe.co.jp/products/acrobat/readstep2.html

参考URL:
http://www.adobe.co.jp/products/acrobat/readstep2.html
toyboys
質問者

補足

詳しくありがとうございます。 Acrobat5.0で開いています。また、中身は英文だけなので、和文フォントの問題ではなさそうです。説明不足ですいませんでした。(でも今後の参考になります。) 作成時のソフトのバージョンは不明です。 単にファイルが壊れているのかも・・・

noname#236902
noname#236902
回答No.1

> PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。 PDFの中の文字はちゃんとテキストなんですよね。だったらコピペでうまくいくと思うんですが。 何のソフトにペーストしていますか?そのソフトのフォント設定によっては化けてしまうことがあります。 例えば、『あ』と入力して日本語になることを確認した後、その『あ』を選択してペーストしてみて下さい。 それでもだめでしょうか?

toyboys
質問者

補足

ありがとうございます。 テキストエディタDanaやMS Wordにコピーしたのですが、だめです。Acrobatで、txtやrtfで保存しても同じ結果です。(たまに、こういうPDFに出会います。。。) PDF内で文字列検索できないので、そもそも文字として認識されないようです。