- ベストアンサー
JIS水準外の漢字コードを知る方法
- JIS水準外の漢字コードを知る方法はありますか?Windows2000を使用しており、プログラム処理中にJIS第1、第2水準外の漢字が表示されることがあります。特定の漢字の文字コードを知りたいですが、どのように調べれば良いでしょうか?
- Windows2000でJIS水準外の漢字の文字コードを調べる方法はありますか?プログラム処理中にJIS第1、第2水準外の漢字が表示されることがあり、特定の漢字の文字コードを知りたいです。
- Windows2000を使用している際にJIS水準外の漢字の文字コードを調べる方法を教えてください。プログラム処理中に表示されるJIS第1、第2水準外の漢字の文字コードを知りたいです。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
書籍 (“Unicode Standard, Version 5.0) は高額ですので、 http://www.amazon.co.jp/gp/product/0321480910/sr=8-7/qid=1163048164/ref=sr_1_7/250-4051004-7197837?ie=UTF8&s=english-books 多少手間はかかっても、インターネットで検索するのがいいと思います。 今回お尋ねの字で説明します。 お尋ねの字を[廣]+「心」と分析すれば、部首は「心」になります。 お尋ねの字から[广]を取り除いたものは、一つのユニットを形成しない二個のパーツになりますから、「广」が部首である可能性は低いと言えますが、 漢和辞典の配属ですら適切でないものがありますから、Unicodeの場合はなおさらで、「广」部に入れている可能性も排除はできません。 また[黄]の部分の字形・画数に二通りあることも考慮する必要があります。 http://www.unicode.org/charts/unihan.html Unihan Database>Unihan Radical-Stroke Index Strokes in Radicalの項で、「心」は4画なので4をクリック 「心 heart」を選択、 Additional strokesの項で14画・15画両方の可能性を考慮し、 Minimum:14 Maximum:15 として、[Submit]ボタンをクリック 少し待たされますが、15画の6番目に目的の字があります。 (字形は略字なのに、画数は正字で数えています。 MS明朝、MinLiU、New Gulimの字形は正字です。) この字をクリックすると#1のと同じ画面になります。 ここで U+61EC というUnicodeを知ることができます。 [余説] Unihan Database>Unihan Grid Index ◇CJK Unified Ideographs Extension A (U+3400 through U+4DB5) =CJK統合漢字拡張A領域 「34」をクリックしてみましょう。 ページ表示にちょっと時間がかかります。 列は縦で左から右です。 [七]×3の「喜」の異体字はU+3402であって3420ではありません。 U+3427「第」の略字、U+34DB「功」の異体字などが見えますね。 XPか2000なら、この領域の文字すべて、New Gulimというフォントで表示可能です。 #1に書いた方法で、[ U ][ 3 ][ 4 ][ 0 ][ 2 ][ F5 ]、クリック、[Enter]で確定。 もし文字が表示されなくても、ドラッグしてNew Gulimにすれば、変身します。 Word2002以降なら、半角で 3402[Alt]+[X] と打ってちょっと待てばダイレクトに変換されます (フォントは上記と同様に)。 * 例に挙げた「喜」「功」の異体字は JIS X 0213 面区点:1-14-03, 1-14-59 (第三水準) に定義されたので、 Vista 搭載のMS書体には加えられています。 「第」の略字は第三・第四水準に入らなかったので、加えられていません。 ◇CJK Unified Ideographs (U+4E00 through U+9FA5) =CJK統合漢字 これは説明不要ですね。 New Gulimのほか、MingLiU、SimSun、SimHeiで全文字が表示・印刷できます。 MS(P)明朝、MS(P)ゴシックは、JIS第一・第二水準のほか、補助漢字を収録しています。 ◇CJK Compatibility Ideographs (U+F900 through U+FA2D) =CJK互換漢字 文字が表示されないようなので、 http://www.unicode.org/charts/PDF/UF900.pdf で見てください。 ここにはCJK統合漢字では「包摂」の概念により、中国・日本・韓国が一つのコードに別々の字を割り当てたけれども、 やはり複数の字体を併存させたいという希望に対応したものです。 たとえばCJK統合漢字U+6D77「海」は、中国・韓国では正字、 日本では[母]を[毋]に変えた略字になっています。 日本でも正字が使えるようにU+FA45にその字を定義したのです。 中国・韓国では重複になります。 その逆もあります。 ◇CJK Unified Ideographs Extension B (U+20000 through U+2A6D6) =CJK統合漢字拡張B領域 この領域の文字を網羅したフォントはたぶんまだないと思います。 WindowsXP以降でなければ、対応できません。 A領域と同様、「弓巾」(一字) のように第三・第四水準に入った字はVistaで使えます。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=223ad [土]+[口]の「吉」の異体字のような字はヒラギノ明朝 Pro W3 なら使えます。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=20bb7 [龍]×4の字は作字しないと使えません。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=2a6a5 ◇CJK Compatibility Ideographs Supplement (U+2F800 through U+2FA1D) =CJK互換漢字補遺 前記同様表示されないので、 http://www.unicode.org/charts/PDF/U2F800.pdf で見てください。 長々と書いてしまいました。お許しください。
その他の回答 (2)
- garamond
- ベストアンサー率53% (1119/2111)
締め切らずに待っていただければ、責任をもって本日中に回答します。
お礼
いま、No.3の回答を拝見しており、感動しているところです。 通り一遍のことをやってみたいと思います。 とりあえず、途中報告です。ありがとうございます。
- garamond
- ベストアンサー率53% (1119/2111)
その文字はUnicode:U+61ECに定義されています。 MS明朝やMingLiUでは「黄」が旧字体 (「廣」に含まれるもの) ですが、SimSunなどの中文フォントでは常用漢字の「黄」と同じで画数が違いますね。 Unicode Standard の字体は後者です。 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=61ec MS IME 全角[ あ ]モードで [ U ][ 6 ][ 1 ][ E ][ C ]のキーを押し、 (表示は う61えc ) 続けて[ F5 ]を押せば、文字一覧の当該字がポイントされていて、 Unicode:0x61ec と表示されるはずです。
補足
ご回答ありがとうございます。 F5キーで部首変換とかするんですね!隠しコマンドみたいな...へぇ!?×5でした。 ただ、問題は、そのコードが「U+61EC」であるということを 知るためにどうするかがあります。 (今回は、garamondさんに教えて頂けたので「コウ」の字が「U61EC」であることが分かったのですが、 他にも同様に調べたい文字がいくつかあるのです・・) 教えて頂いた、「Unihan database」のページで、上手く探せませんでした。 (テキストボックス内に該当文字を貼り付けて、LookUpボタンを押して探すのかと思いましたが、 "NULL"という文字コード0000のページが表示されます)
お礼
懇切に解説してくださり、大変ありがとうございました。 良い方にお会いできて光栄です。 もともとやりたかったこともすべて達成できました。 「Strokes in Radical」の中で、部首探しにセンスが必要そうでしたが、 調べたかった各難解漢字を構成しているパーツを1つ1つ順に調べて いけば、それほど時間は掛かりませんでした。 他にも勉強になりましたし、本当にありがとうございました。 (逆に、お礼が短文すぎて、恐縮の限りです・・・・)