Unicode
先日は文字コードについて色々助言してくださりありがとうございました。
おかげさまでJIS,EUC,SJISの変換はできましたが、
Unicodeについて詰まっているところがあります。
SJIS→UnicodeはSJISにあったU+XXXXに変換し、
それを1~4バイトにさらに変換して文字表記されることで出来ます。
後者の1~4バイトにさらに変換するやり方は出来ているのですが、
前者のSJISにあったU+XXXXに変換するところで詰まっています。
##SJIS Unicode Name Note
0x00 U+0000 # <control>
0x01 U+0001 # <control>
0x02 U+0002 # <control>
0x03 U+0003 # <control>
0x04 U+0004 # <control>
0x05 U+0005 # <control>
0x06 U+0006 # <control>
0x07 U+0007 # <control>
:
:
こういった変換表(テキストファイル)があるのですが、
どのようにしたらこのファイルをプログラム上で操作?
できるのでしょうか?
例)SJISで0x07→U+0007→1~4バイト変換の
0x07→U+0007部分についてです。
また、逆に変換する際の0x07←U+0007についても
わからないでいます。
何かヒントをください。