• ベストアンサー

Acrobat professionalについて

わたしはMac OS10.6を使っており、Acrobat professional6.0にて、英語のpdfファイル(科学雑誌のpdf)をhtmlに変換し閲覧するということをよくしております。 しかしhtmlファイルにした際に、ものによっては例えば“This is a pen”という文が“Thisisapen"のようにスペースが無くなって変換されてしまう場合があります。 この原因であったり、対処法をご存じの方がいらっしゃいましたら是非ともお教えください。 お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Hoyat
  • ベストアンサー率52% (4897/9300)
回答No.2

#1です。 >その場合の補正方法などは何かございませんでしょうか? htmlに変換してと言う事だと「htmlエディター(Dreamweaver、ホームページ・ビルダー等)」で手動で補正するしかないです。 「ボックス情報を失う」のは言ってしまえば「位置情報もロスト」するわけですから。 >もしくはそういったソフトはご存じないでしょうか? 直接htmlにと言うのは存じ上げません(Acrobat以外には)。 ただ、上記で述べたように「手動調整が必要」になります。 AcrobatXは使用していないので解りかねますが9までは同じですので。

その他の回答 (1)

  • Hoyat
  • ベストアンサー率52% (4897/9300)
回答No.1

まぁ突き詰めると「htmlに変換するのが原因」なんですけどね。 と言うのは「PDF」と言うのは「十人十色のデータ」だからなのです。 データとしては確かに「PDF」なんですけど、その元になっているアプリケーションは様々です。 PDFと言うのは言ってしまえば、プリンのアウトされた「紙」で、実態としてはその「紙」の代わりに「データ化されたもの」になっているに過ぎないので、「アプリケーションのデータの作り(形式)」に「依存しない」ようになっています。 ところがその「依存しない」が実はネックで、それは「書式が統一される」訳ではなく「見た目が同じ」になるようになっているだけなのです(プリントアウトですからそれで支障がない)。 ですので質問文の例で言えば見た目が「This is a pen」でも、PDFでは「This」「is」「a」「pen」と、文字間が「空白」ではなく、「文字ボックス」で位置を調整されたもの形成されていたりする場合があり、その場合は文字がAcrobat(又はAdobe Reader)では「連続の文字」と認識されるので「Thisisapen」になってしまうわけです。 それがPDF上であれば問題はありませんが(文字ボックスはそのままだから)、それをhtml等他の形式に書き出すと「文字ボックス」が省略されてしまい文字間がない文章になってしまうのです。 この「文字ボックス」はIllustrator等で使用される同じ「文字ボックス」になるのでエクセル等の表組みの「セル」の様な書き出しが出来ないのです。 なので、突き詰めると「htmlに変換するのが原因(PDFは変換しないのが基本、変換した場合は修正が必要)」なんです。

yuki_314
質問者

補足

なるほど、原因については非常によくわかりました。 ただそうしますと、その場合の補正方法などは何かございませんでしょうか? もしくはそういったソフトはご存じないでしょうか?

関連するQ&A