フォントの話は、私自身、ちょっと苦手で間違っていることがあるかもしれません。もし、間違っているようなら、ぜひ指摘してください。
さて、「死んでしまった文字」について説明するには、フォントの仕組みを整理すると良いと思います。
フォントは、文字セットと文字コードでできています。
文字セットは、文字の形とか文字の種類とかです。
文字コードは、コンピュータが理解できるように字形に与えられた符号体系です。
「死んでしまった文字」は、文字コードと文字セットがうまく一致していない状態だと思われます。
逆に、altosaxさんが言う「テキスト情報」というのは、文字コードと文字セットがきちんと維持された状態だと思います。
まず、ビットマップ化されてしまうことと、「フォント情報」がなくなってしまうことは、関係ありません。
DTPのフォントは、通常解像度に依存しないベクトルデータ=アウトラインフォントです。だから、大きさを変えても、同じように滑らかな形で表示されます。
しかし、ある程度の大きさよりも小さくなると、アウトラインフォントだと返って見づらくなってしまいます。そこで、ある一定以下のフォントについては、ビットマップフォントを使うのです。
ただし、「アウトラインフォント+ビットマップフォント」という構成はTTFやCID、OCFなどで、OTFはアウトラインフォントだけです。
いずれにしても、ビットマップ化については表示されてる字形の問題なので、文字化けとは関係ありません。
文字が「死んでしまう」のもう1つの理由は、エンコードが違うなどなんらかの理由でフォント情報が失われるということです。
フォントは、字形との対応のデータベースを背後に持っています。このデータベースとの対応が、文字コードごとに異なります。だから、文字コードが違うと、データベースでは同じ場所を指していても、表示される字形は違うということになるのです。
異なる文字コードでエンコードされる理由としては、レイアウトやPDF化に使うアプリケーションがその文字コードに対応していないことが考えられます。
たとえば、日本ではまだシフトJISが一般的で、それ以外の文字コードに対応していないものも少なくありません。Illustratorは、CS以前はシフトJISですし、Quark6.5もシフトJISです。QXがOTFの異体字に対応できないというのは、Unicodeに対応していないからです。
また、Acrobat4(PDF1.3)以降であれば、和文フォントのエンベッドに対応しています。それ以前のバージョンは対応していません。
Illustrator 8.0は、日本語にきちんと対応していません。
PostScriptフォントを使ったデータを8で作り、IllustratorのPDFLibraryを使って書き出すと、エンコーディングが83pvから90pvに変わってしまいます。
ですから、もっとも信頼性の高いPDF化の方法としては、PS書き出し→Acrobat Distillerなのです。
次に、PDFのフォントエンベッドについてですが、基本的には、レイアウトデータで使用されているフォント(文字コード+文字セット)のデータを、PDFのデータに付与する(埋め込む)ということです。だから、基本的にはフォントが埋め込まれたPDFならば、文字化けは起こらないと思います。
ただし、フォントによっては、PDFの埋め込みに対応していなかったり、使用許諾権で許可していないものもあります。そうした対応はフォントベンダーごとに違います。
また、アプリケーションや設定によっては、PDF化する際にフォントをアウトライン化してしまうものもあります。そうなると、文字は画像と同じになってしまうので、文字コードは失われてしまいます。でも、一部の文字だけがアウトライン化されるというのはちょっと考えられませんね。
無理やりまとめると、以上のことから、私はエンコーディングが違うせいだと推測しているのです。
お礼
新年おめでとうございます。 IllustratorでPDFが読み込みと配置できることを知り、試しにやってみた所、次のような警告窓が出てくれました。 Type3フォントまたはユーザ設定フォントを使ったテキストは無視されました。 所在不明媚のType1フォントは初期設定フォントで代用します。 特殊なエンコーディングのフォントは再エンコードされました。 これを強行突破した結果、「死んでいるフォント」(ビットマップ化したと思っているフォント)は、無視されたようで全く表示されませんでした。 …ということは、「死んだ」とか「ビットマップ」などと表現していた文字は、「ユーザー設定フォント」だったことになりそうですが、これも釈然としません。 なぜなら、アクロバットではきちんとした字形と文章内容で可読できるからです。 (これまでの教えて頂いた知識だと、フォントの埋め込みがされていないとこのようにはならないのだと思っていました) (実態はアクロバットで読めて(しかし文章のコピペは不可能)イラレで完全に無視される、という状態だということが判りました!) (これらで自作のものはType3にはならないようにPDF作成時のPS設定は全部Type1を選んである元文書でした) …このへんが解明の糸口になりませんでしょうか。 どうか今年も引き続き宜しくお願いします!
補足
Tq-bayさん、いつも本当にありがとうございます!! >まず、ビットマップ化されてしまうことと、「フォント情報」がなくなってしまうことは、関係ありません。 >DTPのフォントは(以下略しますね^^) なるほど、マックOSの画面表示処理とアクロバットでの処理は完全に同一だったのですね? #以前私が聞いて納得してしまった「ビットマップ化」のからくり種明かしの話は、多分普通のマックファンで詳しい方だと思うのでアドビの仕様をきっちり知っているDTPの方ではなさそうでした^^; そこでは、アクロバットpdfになる時には条件により「字の形をした絵になる」という説明を受けましたので、FAX文字用のTIFFとかアウトライン化した文字と似たように「pdfにおける文字のビットマップ化=もはやそれは絵の情報」と理解して納得した気になってしまってました。これがそもそも間違いだったというのが鍵ですね! >IllustratorのPDFLibraryを使って書き出すと、エンコーディングが83pvから90pvに変わってしまいます。 なんと!そうなんですねー、これはとてもありがたい情報で助かりました! 同じアドビ商品なのに困ったことをしてくれますね^^ 必ず綺麗に文字が抽出できるクセロPDFのようなマガイモノのほうが正直だったりするのかもしれませんね? >アプリケーションや設定によっては、PDF化する際にフォントをアウトライン化してしまうものもあります。そうなると、文字は画像と同じになってしまうので、文字コードは失われてしまいます。でも、一部の文字だけがアウトライン化されるというのはちょっと考えられませんね。 この伝が、多分、冒頭の以前私が教わった予備知識のことになりそうですね? 「一部の文字」というのは、同一原稿内にある「一部の書体」のこともありますので、これは充分あり得るかもしれませんね? はたしてあれは単なるマックファンの方のアドバイスに過ぎなかったのか、Tq-bayさんのようにadobePS仕様を熟知した方の判断だったのか、微妙ですね^^; ※理解不足なので系統立ったきちんとした検証ができないのが自分でもどかしいのですが、Windows用のまがいもの互換pdf作成が連戦全勝なのが一番気になるポイントです… >私はエンコーディングが違うせいだと推測しているのです。 これがユニコードとEUCとS-JISとJISのいずれに変換しても「謎の文字」のままだとすると、未検証の選択肢として他にどんな文字コードが残っていますでしょうか? 年明けになってからでも結構ですので、ぜひ解明にご協力よろしくおねがいします! じっくり構えて犯人をつきとめてみたいです!