• ベストアンサー

%BE%A4%8Bみたいな記号

こんにちは。 Windows2000とかとは直接関係ないのですが、どこで質問したらいいのかわからなかったのでここで質問しました。 よくgoogleで検索すると、アドレス欄に%BE%A4%8B...みたいな暗号のようなものが出てきますが、あの記号と、文字を対応させる規則はどうなっているんですか? %BE%A4で一文字ということと、中味が16進法になっている、ということくらいはわかるのですが、規則がわかりません。 知っている方がいたら教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.4

#1がいい加減な説明だったので、詳しく解説しているページを探してきました。 参考にしてください。

参考URL:
http://www.kinet.or.jp/hiromin/cgi_introduction/appendix/url_encode.html

その他の回答 (4)

noname#9515
noname#9515
回答No.5

すいません、寝てました。(夜起きてる方なので) #4さんの答えで正解です。 (#1の方が間違い問い訳ではありません、言葉が足りない感じがしたので書き込んだのですが、抽象的過ぎましたね、ゴメンンサイ) アスキーコード(正確にはアスキーIIコード)には日本語だけで凡そ8種類程の解釈の仕方があるので。 EUCは主に外国企業や国際色が強い場所で使われます。 (JIS/Shift-JIS=MS-JISに比べて日本語との兼ね合いに於いて文字化けしにくい) ECU-Jとは日本語対応版のこと。 他に他言語との互換を優先したUNICODE-7/-8等があります。<一部の記号が使えなくなりますが。 先に述べた自動変換はサーバーや利用ページのWebがどのアスキーコードで作成されているかを判断するブラウザの機能です。 ちなみにOEではJISタイプの最新版(というか統合版)のiso-2022-jpです。 なのでMacとメールのやり取りをするとデフォルトで化けたりします。w (Macは基本的に上記のShift-JISがデフォルトなので) IE(もカスタマイズ次第ですが)以外のブラウザだともっと色々なコードも示されるのですが、多機能な(WORD除く)テキストエディタだともっと沢山のコードが存在する事が理解できるかと思います。 こう云ったものは工業規格で国/国際毎に決められてます。 コピ&ペーストなどでたまに確認されるANSIなどはアメリカのです。 HTMLの記述はcharaset=**(当てるコード)という属性でHPの製作者により決定されています。 サーバによって文字化けするのはそのサーバのOSにより初期で登録されているコードが異なるからです。 同じ日本語解釈でもEUCとJISでは驚異的に化けます。 サーバにあわせて使用する事が大切な訳です。 HPを持たれてwebページをアプロードしたりすると、嫌でもこの辺りが引っかかってきます。 それで気づくんですけど(^_-)ネッ あと、webで送信されるコードと自分のPCが常に使用しているコードは必ずしも同一ではありせん。(情報送信の部分で触れた通り、その時利用したwebに依存しています)

  • sion_fs
  • ベストアンサー率36% (152/416)
回答No.3

Googleの場合はEUC-JPですね。 他にも、%83X 等と3桁で1文字を現すコード等もあります。UTF-8やShift_JISなどがありますね。 #1さんの回答と同様に、それぞれに割り当てられた文字コードで現した物です。

crooked_man
質問者

補足

ありがとうございます。 いろいろなのがあるんですね。 EUC-JPってことはJPでないのもあるんですね? どうもありがとうございました。

noname#9515
noname#9515
回答No.2

アスキー(文字)コードですよ。 下記のURLでアルファベットや一般的な記号の一覧が見れます。 ここには載ってませんが日本語一文字一文字にもコードが用意されています。(凡そ6000-7000文字) 例に挙げられているのがその良い例で、送信内容がステータスバー(Javaなど)に現れているのです。 (ちなみに%というのはプログラムなどの上で<終り>の意味です) ブラウザのメニューに「表示」の項目の中に「エンコード」というのがあるかと思います。 ここを開くとサブメニューがあり、多くは「自動選択(日本語)」という設定になっていますが、 更にあるサブメニューにも外国語含めて数十種類あるかと思います。 これはそのアスキーコードの解釈の仕方の種別だと思ってください。 「文字化け」と云われる現象はコレが誤認されたのが元で起きます。 共通規格として機能するのですが、OS(Win/Mac/Linax/Unix等)によってその登録内容が微妙に 異なる為、サーバー経由が原因で文字化けしたりもします。

参考URL:
http://e-words.jp/p/r-ascii.html
crooked_man
質問者

補足

いただいたページを見たのですが、アスキーは256文字で、欧米用なのでアルファベットとか数字しか表せない、というようなことが書いてありました。 #1さんの言われたEUCではないでしょうか?

  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.1

文字コードのうちASCIIコードで印刷できないタイプの文字を16進で表現したものに%を付けたものです。 例えば'召'はEUCでBEA4(16進)ですので%BE%A4で表します

crooked_man
質問者

補足

EUCで調べたところ、目的のコード表が見つかりました。 EUCだったんですね、文字コードのことがよくわからなかったので大変助かりました。ありがとうございました!

関連するQ&A