- ベストアンサー
第1水準漢字の文字数など
(1)第1水準漢字、第2水準漢字、第3水準漢字、第4水準漢字と4種類ありますが、それぞれ何文字あるのでしょうか。 (2)半角英数字は上記のどの漢字に含まれるのでしょうか。 (3)(1)、(2)は、何という文書において決められているのでしょうか。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> JIS X 0201に半角英数字が示されていることは分かるのですが、 > JIS X 0201に示されている半角英数字はJIS X 0208とJIS X 0213 > には含まれていないのでしょうか。それとも、JIS X 0208と > JIS X 0213にも含まれているのでしょうか。 JIS X 0208 の規格名称は「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」, JIS X 0213 は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」です. したがって1バイト文字である半角英数字は含まれません. シフト JIS では JIS X 0201 と JIS X 0208 を併用します. Windows や Mac 版のシフト JIS では,さらに機種依存文字が追加されています. JIS X 0213 は現在普通に使用されているシフト JIS では扱えませんが, Shift_JIS-2004 や EUC-JIS-2004 には含まれているそうです. Shift JIS-2004 (Wikipedia) http://ja.wikipedia.org/wiki/Shift_JIS-2004 EUC-JIS-2004 (Wikipedia) http://ja.wikipedia.org/wiki/EUC-JIS-2004 > 第1水準~第4水準の文字数は、御教示のWebサイトの「JIS X 0213:2004」の > 表に示される文字数で全部でしょうか。例えば、『第4水準漢字は、全部でと > 言うことなら「JIS X 0213:2004」の表に示される以外にもある』というような > ことはないでしょうか。 私も JIS X 0213 はまだ勉強中なので断言はできませんが, 「2004年時点では」これで全部でしょう. しかし今後の JIS X 0213 の改定により,文字が追加されたり, 既存の文字の字形が変更されたりする可能性はあると思います. JIS X 0208 や JIS X 0213 では,2バイト文字を 94×94 の表 (「面」と呼ぶ) に配置します.前回挙げた URL にも書かれていますが,JIS X 0213 では第1面と 第2面があり,次のように使用されています. ・第1面 (JIS X 0208 の拡張) ・非漢字:1183文字 + 39文字分の未使用領域 ・第1水準漢字:2965文字 ・第2水準漢字:3390文字 ・第3水準漢字:1259文字 ・第2面 ・第4水準漢字:2436文字 ・未使用領域:6400文字分 したがって,第1~3水準にはこれ以上追加する余地はなさそうですが, 第4水準にはたっぷりあります.ただし今後追加する文字を第4水準と呼ぶのか, 第5水準と呼ぶのかはわかりませんが…. JIS X 0213 (Wikipedia) http://ja.wikipedia.org/wiki/JIS_X_0213 JIS X 0213:2004 第1面の文字表とエスケープシーケンス http://www.itscj.ipsj.or.jp/ISO-IR/233.pdf JIS X 0213:2000 第2面の文字表とエスケープシーケンス (2004年改正では2面には変更なし) http://www.itscj.ipsj.or.jp/ISO-IR/229.pdf > JIS X 0208が第1水準と第2水準の文字群が何であるかを定義する文書であり、 > JIS X 0213:2004が第3水準、第4水準の文字群が何であるかを定義する文書であり、 > かつ、第1水準と第2水準の文字群が何であるかを定義する文書は JIS X 0208以外 > にはなく、第3水準と第4水準の文字群が何であるかを定義する文書はJIS X 0213: > 2004以外にはないということでしょうか。 おおむねそう言えると思います.ただし「文字が何であるか」に例示字形まで含めて 考えると,JIS X 0208 の例示字形のうち,JIS X 0213:2000 で変更されたものも あるようです.したがって第1水準 (第2水準も?) は JIS X 0208 と JIS X 0213 では微妙に異なるということになります. 参考:Category:文字コード (Wikipedia) http://ja.wikipedia.org/wiki/Category:%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89
その他の回答 (1)
- noocyte
- ベストアンサー率58% (171/291)
> (1)第1水準漢字、第2水準漢字、第3水準漢字、第4水準漢字と > 4種類ありますが、それぞれ何文字あるのでしょうか。 JIS X 0213 の第三・第四水準漢字(2) http://blog.miraclelinux.com/asianpen/2007/01/jis_x_0213_2_f279.html 「"第4水準漢字" "文字数"」で検索 http://www.google.co.jp/search?q=%22%E7%AC%AC%EF%BC%94%E6%B0%B4%E6%BA%96%E6%BC%A2%E5%AD%97%22+%22%E6%96%87%E5%AD%97%E6%95%B0%22&sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-34,GGGL:ja > (2)半角英数字は上記のどの漢字に含まれるのでしょうか。 どれにも含まれていません. JIS X 0201 (7ビット及び8ビットの情報交換用符号化文字集合) という規格です. JIS X 0201 (Wikipedia) http://ja.wikipedia.org/wiki/JIS_X_0201 > (3)(1)、(2)は、何という文書において決められているのでしょうか。 規格名のことなら,(1) については最初の URL を参照してください.
補足
早速の御回答有り難うございます。 だいたい分かったような気がするのですが、少しだけ確認の意味でお尋ねさせていただいてよいでしょうか。 > JIS X 0213 の第三・第四水準漢字(2) > http://blog.miraclelinux.com/asianpen/2007/01/jis_x_0213_2_f279.html 第1水準~第4水準の文字数は、御教示のWebサイトの「JIS X 0213:2004」の表に示される文字数で全部でしょうか。例えば、『第4水準漢字は、全部でと言うことなら「JIS X 0213:2004」の表に示される以外にもある』というようなことはないでしょうか。 >どれにも含まれていません. >JIS X 0201 (7ビット及び8ビットの情報交換用符号化文字集合) という規格です. JIS X 0201に半角英数字が示されていることは分かるのですが、JIS X 0201に示されている半角英数字はJIS X 0208とJIS X 0213には含まれていないのでしょうか。それとも、JIS X 0208とJIS X 0213にも含まれているのでしょうか。 >規格名のことなら,(1) については最初の URL を参照してください. これはつまり、 JIS X 0208が第1水準と第2水準の文字群が何であるかを定義する文書であり、JIS X 0213:2004が第3水準、第4水準の文字群が何であるかを定義する文書であり、かつ、第1水準と第2水準の文字群が何であるかを定義する文書はJIS X 0208以外にはなく、第3水準と第4水準の文字群が何であるかを定義する文書はJIS X 0213:2004以外にはない ということでしょうか。
お礼
たいへん詳細かつ明確な御回答を頂き、御礼の申し上げようもありません。よく分かりました。 有り難うございました。