• ベストアンサー

文字コードの種類について

大変恥ずかしい質問ですが、文字コードの種類について疑問があります。 UTF-8、UTF-16、UTF-32という規格はどのような場合に使用するのでしょうか? Windowsのメモ帳で使用している(?)、Shift-JISという規格も全く解りません。 wikipediaで調べてみたものの、説明が理解できませんでした。 ・・・-xの数値がビットを表している、と言われてもピンときません。 符号空間?何それ?というレベルです。 大まかなイメージを掴みたいので、お知恵を拝借頂けると幸いです。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

> UTF-8、UTF-16、UTF-32という規格はどのような場合に使用するのでしょうか? wikipediaに書いてあったような。 http://ja.wikipedia.org/wiki/Unicode#.E3.82.A8.E3.83.B3.E3.82.B3.E3.83.BC.E3.83.87.E3.82.A3.E3.83.B3.E3.82.B0.EF.BC.88.E7.AC.A6.E5.8F.B7.E5.8C.96.E6.96.B9.E5.BC.8F.EF.BC.89 UTF-8(UTF-2、UTF-FSS) インターネットではもっとも一般的に利用されている。 ※ Linuxを含め最近のunix系のシステムではファイル名などにもUTF-8を使っている事が多いし、公開されているウェブページも非常に多くがUTF-8で書かれています。 UTF-16 Windows XPなどの近年のOSの内部では、UTF-16符号化形式が使われている。 Windowsのメモ帳で作成した「Unicodeテキスト」 UTF-32 (Unicode 3.1より) ただしすべてのUnicodeを扱う処理を行う場合には、すべての文字を単一の符号単位で表現したほうが処理に適するため、内部の処理ではUTF-32符号化形式(あるいはUCS-4)で扱うことも多い。 ※ソフト内部で使われている(メモリに読み込む時にこの形式で読み込み、書き出す時に保存形式に変換)場合は少なくないが扱えないソフトも多くファイルとして使われている事は非常に少ない。 > wikipediaで調べてみたものの、説明が理解できませんでした。 関連する解説いくつもあったように記憶してます。どのページが理解できなかったのかな。 上はほぼwikipediaに書かれていた事を写しただけです。(※は私の書いたコメント) > 符号空間?何それ?というレベルです。 例えば、ASCIIにおける大文字アルファベットだとA:65 B:66 ... Z:90ですし、小文字アルファベットだとa:97 b:98 ... z:123 数字だと 0:48 1:49 ... 9:57ですよね。 asciiにおける大文字アルファベットの符号空間は65-90だし、数字の符号空間は48-57という事になります。 ※asciiの体系全体では制御文字や記号などが加わり0-127という事になります。(32以降が印字可能文字) ※65を'A'として使いますっていうのが符号化。 符号化の団体が符号空間。(上に書いた数字の符号空間は48-57/大文字アルファベットの符号空間は65-90もその一例) 英語も日本語もはめ込んでいる符号空間は大きい。

tobochite
質問者

お礼

ご回答ありがとうございます。 私がwikipediaを上手く使えておりませんでした。 汗顔の至りです("Unicode"で検索していなかったです)。 ※のコメントも大変ありがたいです。 saijyo_739様と仕事ができる方々は幸せですね。 不勉強を反省し、精進いたします。 重ねて御礼申し上げます。

すると、全ての回答が全文表示されます。

関連するQ&A