JIS水準外の漢字コードを知る方法

2006/11/08 22:13

このQ&Aのポイント

JIS水準外の漢字コードを知る方法はありますか？Windows2000を使用しており、プログラム処理中にJIS第1、第2水準外の漢字が表示されることがあります。特定の漢字の文字コードを知りたいですが、どのように調べれば良いでしょうか？
Windows2000でJIS水準外の漢字の文字コードを調べる方法はありますか？プログラム処理中にJIS第1、第2水準外の漢字が表示されることがあり、特定の漢字の文字コードを知りたいです。
Windows2000を使用している際にJIS水準外の漢字の文字コードを調べる方法を教えてください。プログラム処理中に表示されるJIS第1、第2水準外の漢字の文字コードを知りたいです。

supob
お礼率81% (49/60)

その他([技術者向] コンピューター)
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

garamond
ベストアンサー率53% (1119/2111)

2006/11/09 16:53 回答No.3

書籍 (“Unicode Standard, Version 5.0) は高額ですので、 http://www.amazon.co.jp/gp/product/0321480910/sr=8-7/qid=1163048164/ref=sr_1_7/250-4051004-7197837?ie=UTF8&s=english-books 多少手間はかかっても、インターネットで検索するのがいいと思います。今回お尋ねの字で説明します。お尋ねの字を[廣]+「心」と分析すれば、部首は「心」になります。お尋ねの字から[广]を取り除いたものは、一つのユニットを形成しない二個のパーツになりますから、「广」が部首である可能性は低いと言えますが、漢和辞典の配属ですら適切でないものがありますから、Unicodeの場合はなおさらで、「广」部に入れている可能性も排除はできません。また[黄]の部分の字形・画数に二通りあることも考慮する必要があります。 http://www.unicode.org/charts/unihan.html Unihan Database＞Unihan Radical-Stroke Index Strokes in Radicalの項で、「心」は４画なので４をクリック「心 heart」を選択、 Additional strokesの項で14画・15画両方の可能性を考慮し、 Minimum：14　Maximum：15 として、[Submit]ボタンをクリック少し待たされますが、15画の６番目に目的の字があります。 (字形は略字なのに、画数は正字で数えています。 MS明朝、MinLiU、New Gulimの字形は正字です。) この字をクリックすると＃１のと同じ画面になります。ここで U+61EC というUnicodeを知ることができます。 [余説] Unihan Database＞Unihan Grid Index ◇CJK Unified Ideographs Extension A (U+3400 through U+4DB5) ＝CJK統合漢字拡張Ａ領域「34」をクリックしてみましょう。ページ表示にちょっと時間がかかります。列は縦で左から右です。 [七]×３の「喜」の異体字はU+3402であって3420ではありません。 U+3427「第」の略字、U+34DB「功」の異体字などが見えますね。 XPか2000なら、この領域の文字すべて、New Gulimというフォントで表示可能です。＃１に書いた方法で、[ U ][ 3 ][ 4 ][ 0 ][ 2 ][ F5 ]、クリック、[Enter]で確定。もし文字が表示されなくても、ドラッグしてNew Gulimにすれば、変身します。 Word2002以降なら、半角で 3402[Alt]＋[X] と打ってちょっと待てばダイレクトに変換されます (フォントは上記と同様に)。 * 例に挙げた「喜」「功」の異体字は JIS X 0213 面区点：1-14-03, 1-14-59 (第三水準) に定義されたので、 Vista 搭載のMS書体には加えられています。「第」の略字は第三・第四水準に入らなかったので、加えられていません。 ◇CJK Unified Ideographs (U+4E00 through U+9FA5) ＝CJK統合漢字これは説明不要ですね。 New Gulimのほか、MingLiU、SimSun、SimHeiで全文字が表示・印刷できます。 MS(P)明朝、MS(P)ゴシックは、JIS第一・第二水準のほか、補助漢字を収録しています。 ◇CJK Compatibility Ideographs (U+F900 through U+FA2D) ＝CJK互換漢字文字が表示されないようなので、 http://www.unicode.org/charts/PDF/UF900.pdf で見てください。ここにはCJK統合漢字では「包摂」の概念により、中国・日本・韓国が一つのコードに別々の字を割り当てたけれども、やはり複数の字体を併存させたいという希望に対応したものです。たとえばCJK統合漢字U+6D77「海」は、中国・韓国では正字、日本では[母]を[毋]に変えた略字になっています。日本でも正字が使えるようにU+FA45にその字を定義したのです。中国・韓国では重複になります。その逆もあります。 ◇CJK Unified Ideographs Extension B (U+20000 through U+2A6D6) ＝CJK統合漢字拡張Ｂ領域この領域の文字を網羅したフォントはたぶんまだないと思います。 WindowsXP以降でなければ、対応できません。Ａ領域と同様、「弓巾」(一字) のように第三・第四水準に入った字はVistaで使えます。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=223ad [土]＋[口]の「吉」の異体字のような字はヒラギノ明朝 Pro W3 なら使えます。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=20bb7 [龍]×４の字は作字しないと使えません。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=2a6a5 ◇CJK Compatibility Ideographs Supplement (U+2F800 through U+2FA1D) ＝CJK互換漢字補遺前記同様表示されないので、 http://www.unicode.org/charts/PDF/U2F800.pdf で見てください。長々と書いてしまいました。お許しください。

参考URL：: http://www.unicode.org/charts/unihan.html

質問者

お礼 2006/11/09 20:11

懇切に解説してくださり、大変ありがとうございました。良い方にお会いできて光栄です。もともとやりたかったこともすべて達成できました。「Strokes in Radical」の中で、部首探しにセンスが必要そうでしたが、調べたかった各難解漢字を構成しているパーツを１つ１つ順に調べていけば、それほど時間は掛かりませんでした。他にも勉強になりましたし、本当にありがとうございました。（逆に、お礼が短文すぎて、恐縮の限りです・・・・）

その他の回答 (2)

garamond
ベストアンサー率53% (1119/2111)

2006/11/09 10:56 回答No.2

締め切らずに待っていただければ、責任をもって本日中に回答します。

質問者

お礼 2006/11/09 19:18

いま、No.3の回答を拝見しており、感動しているところです。通り一遍のことをやってみたいと思います。とりあえず、途中報告です。ありがとうございます。

garamond
ベストアンサー率53% (1119/2111)

2006/11/09 02:31 回答No.1

その文字はUnicode：U+61ECに定義されています。 MS明朝やMingLiUでは「黄」が旧字体 (「廣」に含まれるもの) ですが、SimSunなどの中文フォントでは常用漢字の「黄」と同じで画数が違いますね。 Unicode Standard の字体は後者です。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=61ec MS IME 全角[ あ ]モードで [ U ][ 6 ][ 1 ][ E ][ C ]のキーを押し、 (表示は　う６１えｃ　) 続けて[ F5 ]を押せば、文字一覧の当該字がポイントされていて、 Unicode：0x61ec と表示されるはずです。

質問者

補足 2006/11/09 08:52

ご回答ありがとうございます。 F5キーで部首変換とかするんですね！隠しコマンドみたいな...へぇ!?×５でした。ただ、問題は、そのコードが「Ｕ＋６１ＥＣ」であるということを知るためにどうするかがあります。（今回は、garamondさんに教えて頂けたので「コウ」の字が「Ｕ６１ＥＣ」であることが分かったのですが、他にも同様に調べたい文字がいくつかあるのです・・）教えて頂いた、「Unihan database」のページで、上手く探せませんでした。（テキストボックス内に該当文字を貼り付けて、LookUpボタンを押して探すのかと思いましたが、 "NULL"という文字コード0000のページが表示されます）