• ベストアンサー

UTF-8とは何ですか

今更ながらですが、日本語のサイトは全部SHIFT-JISだと思ってました。 ところが日本語のサイトでもUTF-8が多いよと聞きました。 冗談だろと思ったらOKWAVEが既にUTF-8・・・ ヤフーもgooも大手サイトはほとんどUTF-8でした。 日本語=SHIFT-JISだと思ってmetaか何かで指定していますが、 ひょっとしてこれは作り直した方がいいのでしょうか。 UTF-8で検索したら日本語などの2バイト圏を考慮してないとか そういうブログも見つかったのですが、 大手サイトでUTF-8を採用しているということは、このブログはガセなのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • salsberry
  • ベストアンサー率69% (495/711)
回答No.4

> できれば全部一括変換する方法があればいいのですが。 メモ帳とかサクラエディタと書かれているのでWindowsだと思って答えます。 http://www.vector.co.jp/vpack/filearea/win/util/text/conv/code/にあるようなツールを使えばファイルの文字コードは容易に変換できます。 ただし、metaタグのcharset指定まで連動して変わるわけではないので、そちらは別途書き換えてください。

noname#159617
質問者

お礼

いっぱいツールがあるんですね。 ちょっと見てみることにします。

その他の回答 (3)

  • salsberry
  • ベストアンサー率69% (495/711)
回答No.3

> なんぜ <html lang="ja">としているのに > shift-JISだのUTF-8だのが出てくるんでしょう。 日本語を表記するために使える文字コードは何種類もあるからです。表せる文字の数が違うとか、歴史的事情とかでいくつもの文字コード規格が存在しています。 > それさえ指定すれば出るのかと思ったら > フォントがないと出ないと言われグチャグチャです。 少し古い携帯電話とかだとUTF-8を扱えないものもありますが、今どきのPC(Windows, Mac, Linuxなど)だったら、フォントがなくてUTF-8を表示できないということはないはずです。そのような環境で正しく表示できないのであれば、指定方法が間違っていると思われます。 HTMLファイルを保存するときにきちんとUTF-8で保存していますか? metaでcharset指定しただけでは、UTF-8にはなりませんよ。

noname#159617
質問者

お礼

>HTMLファイルを保存するときにきちんとUTF-8で保存していますか? どうも有り難うございます。 今までそんなの意識したことがなかったのでバラバラです。 メモ帳でつくったものやサクラエディタでつくったもの。 できれば全部一括変換する方法があればいいのですが。

  • wormhole
  • ベストアンサー率28% (1626/5665)
回答No.2

>今更ながらですが、日本語のサイトは全部SHIFT-JISだと思ってました。 ただの思い込みです。 以前からEUC-JP,ISO-2022-JPで書かれてるサイトもありましたよ。 >日本語=SHIFT-JISだと思ってmetaか何かで指定していますが、 >ひょっとしてこれは作り直した方がいいのでしょうか。 「metaか何か」とよくわかってらっしゃらない所は気になりますが、 ちゃんと指定しているなら作り直す必要ないと思います。

noname#159617
質問者

お礼

ご回答有り難うございます。 metaというよりも実は文字コードそのものが分かっていません。 なんぜ <html lang="ja">としているのに shift-JISだのUTF-8だのが出てくるんでしょう。 それさえ指定すれば出るのかと思ったら フォントがないと出ないと言われグチャグチャです。 UTF-8で作った方が無難ということは理解できました。

  • t_ohta
  • ベストアンサー率38% (5292/13826)
回答No.1

UTF-8は日本語を含め多くの文字を1つのコード体系で扱えるようにしたものです。 1つの文章の中に異なる言語の文字(日本語とハングル 한국어 とか)を混在させて書く事も可能です。 今では多くのOSで扱えますし、UTF-8で書かれたHTMLなら日本語圏以外の環境でも日本語で表示させることができます。(フォントがあればですが) ShiftJISは日本語専用の文字コードですから、日本語しか扱えませんし日本語圏以外では文字化けしてしまいます。 日本語圏の人しか相手にしないホームページであればShiftJISでも問題ありませんが、多くの環境で正しく表示させたいならUTF-8の方がいいでしょう。 また、LinuxなどUnix系のOSはUTF-8で文字を扱う傾向にあるので、サーバサイドで何らかの処理をしているのであれば、UTF-8で全ての文字を扱う方がトラブルになりにくいのでいいでしょうね。

noname#159617
質問者

お礼

どうも有り難うございます。 なぜかハングルがあります。 ということはSHIFT-JISはアウトみたいですね。 今後のことも考えるとUTF-8の方がいいような気がしてきました。

関連するQ&A