• 締切済み

【PDF】これはOCRなのでしょうか?

エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?

みんなの回答

  • mrkato
  • ベストアンサー率47% (1008/2121)
回答No.1

同梱版「読んde!!ココ パーソナル」が変換しているはずです。 http://www.epson.jp/products/ai/koko/product/personal/personal.htm 製品版もエプソン販売が取り扱っていましたが、 2012年9月30日をもって販売終了となりました。 文字化け原因は、コピーを取ったPDFリーダー画面上の文字コードと、 ワードの取り扱う文字コードのモードが異なると考えられます。 日本語PDFデータ自体がフォント(活字)も含んだ形だと、 いわゆる「シフトJISかユニコード漢字か」がOSと合わない事があります。 すぐ出来る手は、一度ワードでなく、メモ帳の編集画面にペーストするか、 さらに一度保存するときに文字コードを指定し、改めて開くと思ったのですが。

noname#206454
質問者

補足

ご回答ありがとうございます。 やはりOCR化されていたのですね。 PDFのテキストをメモ帳にコピペし、ANSI、UDF-8、Unicode、Unicode big endianという形式のそれぞれのコードで保存し、次にワードに載せてみましたが、やはり文字化けは同じままですした…

関連するQ&A