• ベストアンサー

文字コードの問題について

IE6.0を使っていますが、以下のようなメッセージがでてしまいました。「このメッセージには既定の文字セットで定義されていない文字が使用されているます。・・・・・。」多分「たく」を「火」偏に「主」の「たく」にしたかったのでIMEパッドで探して書いたのですがそれが、気に入らなかったらしいです。そこで「焚く」にして送信するとOKでした。あまり一般に使用されていない漢字もよく使うのですが、もし、変更せずに送っていたら、うまく表示されないとか、どのような障害が出るのでしょう?また、文字コードの問題をわかりやすく理解するためのホームページなどがあれば教えてください。よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • ranx
  • ベストアンサー率24% (357/1463)
回答No.3

スイッチを入れたり切ったりすることで電流を流したり切ったりし、 その状態が電気信号として相手に伝達されるという、かなり原始的な 通信方法です。例えば「A」という文字を伝えるには一回短く通電した後 今度は長めに通電します。「トン・ツー」という組み合わせです。 Bならば「ツー・トン・トン・トン」です。「トン・ツー」という 信号を受け取った人は、これは「A」の文字を表すのだと理解します。 ところで、「トン・ツー」という信号のどこに「A」という文字の形が 表されているのでしょうか。ありませんね。文字の形状などは無視して 単に「トン・ツー」という信号が「A」という文字を表すという約束事 だけが決められているわけです。 実は文字コードもこれと同じなのです。ただ、モールス信号が通電時間の 長短で文字を表したのに対し、文字コードは電圧の高低で文字を表します。 例えば、シフトJISの場合、「あ」という文字は 高低低低低低高低高低高低低低低低という電圧の組み合わせで表します。 この組み合わせを受け取ったコンピュータは、これは「あ」の文字を 表すのだと判断して、画面に「あ」の文字を表示します。文字の形は コンピュータが最初から持っているのです。海外で製造されたコンピュータは、 日本語の文字の形を備えていない場合が多くあります。そのような コンピュータでは、この記号を受け取っても「あ」の文字を表示することが できません。記号自体には文字の形は含まれないからです。 今、「シフトJISの場合」と書きました。これはこの方式の名前で、 これが「文字コード」と呼ばれるものです。 別の方式もあります。例えばUnicodeという方式では同じ「あ」が 低低高高低低低低低高低低低低高低という組み合わせで表されます。 ある方式で表現される文字が別の方式では表現できないこともあります。 質問のケースがまさにそうなのですが、「火」偏に「主」の字はUnicodeで 低高高高低低低低高低高高低高高高という組み合わせで表現されるのですが、 シフトJISでは表現できないのです。ですので、この文字はシフトJISでは 送ることができないし、Unicodeのような方法で送ったとしても、 相手側がUnicodeを処理できない(記号を字形に置き換えられない) 対応する文字形状データを持っていないなどの場合は表示することができない わけです。 あと、ケチをつけるようで申し訳ないのですが、No.1さんの > Microsoft社が、長年にわたってたくさんの文字を持つ他の言語を無視して > OSを作り続けてきたことです。その基本的な体質は今も変わっていません。 という非難は酷だと思います。Microsoft社を好きでないのは私も同じですが(?) この面では他のOSも同じですし、そんな意味で完全なOSなど作られたことは ないと思います。文字コード以前に乗り越えなければならない他の問題が 数多くあったわけで、少しずつ進歩してきた技術を、完全でないという理由で 非難することはできないと思います。

chikonojyo
質問者

お礼

モールス信号と似ているとはちょっとびっくりです。詳しい内容を教えてくださってありがとうございます!

その他の回答 (3)

  • ranx
  • ベストアンサー率24% (357/1463)
回答No.4

No.3です。 気がついたら、回答の冒頭が切れていました。 まあ、最初のパラグラフは余談みたいなものなので よいのですが、モールス信号の説明であることを 書きました。文字コードではありませんが、 記号というものの性質をモールス信号のアナロジーで 説明しています。

chikonojyo
質問者

お礼

なるほど、詳しく教えてくださってありがとうございました。

回答No.2

「焚」はJIS規格(JIS X 0208)でも規定されている漢字なのに対して、「火」偏に「主」の漢字はUnicode固有の漢字です。 Outlook ExpressはJIS以外にこのUnicodeでメールを送信する機能も搭載しており、メール本文中にUnicode文字が含まれていると、送信時に自動的に警告を出して、(JISコードではなく)Unicodeの設定で送信する仕様となっています。 受信側も(Windows98以降の)O.E.であれば、問題なく表示できますが、もし、受信側のメールソフトがUnicodeに対応していない場合は(この文字だけでなく)メール全体が文字化けしてしまいます。 ※Outlook Expressのほか、NetscapeやBecky Ver.2などがUnicodeに対応しています。 ですので、この文字を使う場合は事前に相手の環境やメールソフトを確認しておく必要があります。 文字コードを説明しているサイトは山ほどありますが、ひとつだけ例としてあげておきます。  

参考URL:
http://euc.jp/i18n/charcode.ja.html
chikonojyo
質問者

お礼

相手のメールソフトは確認できない(雑誌社なので)と思うのです。難しいですが、画像にしようかと検討中です!ありがとうございました!

回答No.1

「炷」←火偏に主。 JIS:なし シフトJIS:なし 区点:なし Unicode:70B7 「焚」 JIS:4A32 シフトJIS:95B0 区点:04218 Unicode:711A  早い話が、「焚」はJISで定義されており、『「炷」←火偏に主』はJISで定義されていません。Unicodeで定義されています。したがって、文字セットを切り替えないと表示できません。それで、別に文字として見えないだけで、他に障害が出るわけではありません。  文字コードの問題は、私にもよくわかりません。ただわかっていることは、Microsoft社が、長年にわたってたくさんの文字を持つ他の言語を無視してOSを作り続けてきたことです。その基本的な体質は今も変わっていません。  専門家に言わせれば、Unicode体系でも不十分です。それで、TRON上で動く「超漢字」がもてはやされています。

参考URL:
http://www.linux.or.jp/JF/JFdocs/Secure-Programs-HOWTO/character-encoding.html
chikonojyo
質問者

お礼

ありがとうございます。早速ページを確認してみます!本当にややこしいですね!!

関連するQ&A