ベストアンサー

HTMLソースの文字コードがutfの場合、文字化け回避のために や といったおまじないは意味なし？

2008/07/15 06:22

前提として、当方、文字コードについての文章を何度読んでも理解できていないのですが・・・＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝ http://blog.goo.ne.jp/ のHTMLソースにあるように、 EUCのソースでは、という文字列をページの銭湯のほうにおいて、UAによる文字化けのみすを防いでいるようです。 http://www.shtml.jp/mojibake/binew.html から引用しますと、＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝　　　　Shift_JISにおいては、２バイト文字の２バイト目は0x40～0x7E、0x80～0xFCの範囲にあります。　　　　したがって、0xFDや0xFEは使われていません。　　　　これらのコードを持つ文字がもし現れているのならば、　　　　ブラウザはShift_JISでないとすぐに判断できるはずですから、　　　　文字化けが発生しないという理屈です。　　　　では、EUC-JPにおいて２バイト目が0xFD及び0xFEを持つ文字とはどのような文字でしょうか？　　　　EUC-JPの存在領域から考えて、１バイト目は0xA1～0xFEになります。ここでプログラムで出力しますと　　　　（中略）＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝　　　　　。。。。ということで、　　　　　「龠」という文字は、２バイト文字目が0xFEとなるEUC-JPという理屈だそうです　　　（ちなみにYahoo!Japanは以前SJISを用いていたとき、同様の理屈からか「」というソースをページの先頭のほうにかいていました。　なお、Yahoo!Japanは今はutf8です。（Yahoo!の全サービスでそうなのかはわかりかねますが））・・・と思ったら、 http://earthproject.yahoo.co.jp/ のページではEUCで、 というHTMLソースがありました。そこで、質問なのですが、 HTMlファイルがUTF8の場合は、こういったコザイクは無意味というか無駄なのでしょうか？あるいはもし意味があるとすれば、どういった文字列をHTMLのコメントに書いておけばいいのでしょうか？文字コードの仕組みが分かっていれば、こういうしつもんもしないかもしれないですが。。。 === なお、どこかで、ApacheやPHPがいじれるのならば、httpヘッダを送る段階で、utf8だとUAに対して名言して出力してしまえば、このような問題は起こらない、というような内容の文章をどこかで見かけたような記憶もするのですが、とりあえず、それは不可能という前提で、教えていただければと思います。以上、よろしくお願いいたします。

daisuke_dm
お礼率81% (595/727)

HTML
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

pick52
ベストアンサー率35% (166/466)

2008/07/15 12:17 回答No.3

> （ちなみにYahoo!Japanは以前SJISを用いていたとき、同様の理屈からか「」というソースをページの先頭のほうにかいていました。 Yahoo! JAPANは以前はサービス全体でEUC-JPを使用していました。少なくてもトップページはEUC-JPでした(SJISではないですよ)。 Y!の  もやはり文字化け対策として入れられていたようですが本当に効果があったかどうかは定かじゃありません。そもそも、エンコードの機械判別は厳密には難しいでしょう。ページの先頭何文字かに含まれるエンコードとContent-typeに出力されたcharset及びmetaタグのcharsetやブラウザの言語コードなどから判別しようとするようですがこれが存在しなかったり間違っていたりする場合も多いです。 (IEは判別できなかったり間違っているとOSのデフォルトロケールを使用しようとする事があるみたいですが) なお、本当に適切なHTMLなら必ずtitleタグの前に文字コードを指定しておきましょう。完全に間違いがなくブラウザ側が判別できるエンコードなら通常、文字化けが起こることはないはずです(それでも確実とは言えませんが)。

ログインすると、全ての回答が全文表示されます。

その他の回答 (2)

神崎渉瑠（@taloo）
ベストアンサー率44% (1016/2280)

2008/07/15 10:35 回答No.2

> HTMlファイルがUTF8の場合は、こういったコザイクは無意味というか無駄なのでしょうか？ UTF-8でも文字化けの可能性はありますが、文字コードが指定されていれば、まともなブラウザであれば文字化けは起こりません。 httpヘッダの替わりに <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> というのがありますが、これは使えませんか？ > http://earthproject.yahoo.co.jp/ > のページではEUCで、 > というHTMLソースがありました。 <title>の前に入れないと意味はないと思います。 <meta>が最初に入ってるので文字化けはしませんが。

ログインすると、全ての回答が全文表示されます。

noname#66720

2008/07/15 10:29 回答No.1

意味はありますが、たまに起こる文字化けの中でEUCが最も頻度が高いようなのであまり使うことはないと思います。 macのsafariで起こる問題のようなので、実際に確認されてみてはどうでしょう？環境が手元に無い場合、スクリーンショットを取ってくれるサービス等もあるのでそちらを利用してみると良いかもしれません。

ログインすると、全ての回答が全文表示されます。