- 締切済み
UTF-8で日本語を表示させるには
とても基本的な事かもしれませんが、文字セットをUTF-8に設定すると、ソースに日本語を使うと画面には?????と表示されますが、UTF-8の設定でも、以下の様な記述をすると、日本語が表示されています。 <meta charset=utf-8.......... ・ ・ <div class="editsection" style="float:right;margin-left:5px;">[<a href="/index.php?title=Nakagawa_Shoko&action=edit&section=1" title="Nakagawa Shoko">edit</a>]</div> <a name="Profile"></a><h2> Profile </h2> <ul><li><b>Name:</b> 荳ュ蟾晉ソ泌ュ・ </li><li><b>Name (romaji):</b> Nakagawa Shoko ちなみに「 荳ュ蟾晉ソ泌ュ・」この部分はweb上では、「中川翔子」となりますが、一体この記述方法は何なのでしょうか?何故、「 荳ュ蟾晉ソ泌ュ・」が中川翔子となるのか全く分かりません。 教えてgooもやはり日本語部分が、半角カタカナになってますが、どうすればこんな記述が可能なのでしょうか? どうすれば、UTF-8で日本語表示が可能になるのか教えて下さい。 文字変換ソフトとかあるのでしょうか? また初心者に参考になるサイトがありましたら教えて下さい。 ちなみにホームページ作成ソフトは持っていません。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- chie65536
- ベストアンサー率41% (2512/6032)
文字セットをUTF-8に設定すると、漢字は「すべてUTF-8でコード化」されます。 UTF-8でコード化された「中川翔子」は、16進数の文字コードで E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90 になります。 1文字づつ書けば E4 B8 AD 中 E5 B7 9D 川 E7 BF 94 翔 E5 AD 90 子 です。 このソースを「漢字は、シフトJISの筈」と思ってるメモ帖などで開くと E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90 は、シフトJISコードだと勘違いされ E4 B8 荳 AD ュ(半角カタカナ) E5 B7 蟾 9D E7 晉 BF ソ(半角カタカナ) 94 E5 泌 AD ュ(半角カタカナ) 90 ?? ・(90は2バイト文字の1つ目だが、2つ目が無くいので「・」になる) と解釈され、メモ帳の画面には 荳ュ蟾晉ソ泌ュ・ と表示されます。 なので、このソースを開く(表示する)には、 「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」 か、または 「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」 のどちらかの方法を取ります。 以下の2つのURLは、googleの検索URLです。 http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7%9D%E7%BF%94%E5%AD%90&ie=Shift-Jis http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7%9D%E7%BF%94%E5%AD%90&ie=utf-8 どちらも、検索文字列は「%E4%B8%AD%E5%B7%9D%E7%BF%94%E5%AD%90」であり、ある文字列を「16進コード」で指定してあります。 しかし、表示される結果は、前者は「荳ュ蟾晉ソ泌ュ・」が検索されるのに対し、後者は「中川翔子」が検索されます。 なぜ同じ文字列が指定されてるのに結果が違うかと言うと、URLの末尾の漢字コードの指定が異なるからです。 URLを良く見ると、前者は「ie=Shift-Jis」と、後者は「ie=utf-8」というように「漢字コードが何のコードでコード化してあるかの指定が異なっている」のです。 つまり「同じ文字の並びでも、コードに与える意味が変われば、表示も意味も変わってしまう」のです。 逆に言えば「本来の意味と違う意味に解釈して表示しちゃうと、文字が別の物に化ける」のです。これを「文字化け」と言います。
- sakusaker7
- ベストアンサー率62% (800/1280)
> 荳ュ蟾晉ソ泌ュ・」 UTF-8 の "中川翔子" を無理やりShiftJISで書かれたものとして みるとこんな結果になります。 どのような手段でみましたか? メモ帳で開いたとか、コマンドプロンプトでtypeしたとか。
補足
ここに表記したサイトはMediaWikiという英文のサイトですが、 ソースをメモ帳で開いて見ると、UTF-8の設定で、日本語の部分が「荳ュ蟾晉ソ泌ュ・」に表示されたので、metaタグでUTF-8に設定しても、日本語が表示出来る方法があるのかな・・・と思いまして。 今まではどうしても日本語が必要な時は、gif画像にして貼り付けていました。
- shimix
- ベストアンサー率54% (865/1590)
「UTF-8で」ということはソースの文字コードがUTF-8でないといけないのですが・・。エディタなどで文字コードをUTF-8に変えて保存すればいいと思います。参考URLのsakuraなどがお勧めですかねぇ・・。
お礼
返答が遅れて大変申し訳ありませんでした。 色々四方八方探索した結果、ベクターのサイトでTeraPadなるフリーソフトを見つけました。これを使うとutf-8の設定のサイトをメモ帳で開くと「荳ュ蟾晉ソ泌ュ・」こんなような記述のソースが、見事に日本語で表示されました。 メモ帳とかワードパッド以外と言われても、分からないまま途方に暮れていましたが、やっと「sakura」の意味が理解できて、TeraPadを使うようになって、問題は解決しました。 ありがとうございました。
- SAYKA
- ベストアンサー率34% (944/2776)
ああ、それ ソースの表示自体はUTFじゃ ないんだよ。 多分Shift_JISかISO-2022JPじゃないかな。 もしそれを見ているのがメモ帳とかだとしたらEUC-JPかもしれないね。 メモ帳ではそういう文字セットには対応してないからそうなるよ。
補足
自分のホームページを作る際にはメモ帳でソースを書いています。 metaタグのみ日本語で書いて、他は英文と画像を使用しています。 他のサイトを見るときは、メモ帳か、ワードパットですが、日本語の部分が判別不能です。
補足
なるほど。丁寧に説明していただき、ようやく仕組みが理解出来ました。 そこで再度質問なんですが、 >「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」 >か、または >「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」 変換ツールと言うのは、#2の方が言われているsakuraの事でしょうか? また「メモ帳」以外のソフトと言うのは具体的に何ですか? 初歩的でほんとにすいません。 よろしくお願いします。