• ベストアンサー

ユニコード(UTF-8)からJISコードへの変換

Turbolinux 10用Netscapeブックマークの日本語内容を読み取ることができません。 ユニコードのコード表等の情報をご存知の方.いらっしゃったらばお知らせください。 現在.開発環境がVisual Studio 6.0(Win95, 98)ですが.MS-Basic(PC-9801+MS-DOS6.2, 5.5A, 3.3D)も生きています。両者に共通な読み取り方法として.バイナリ入出力を予定しています。 マイクロソフト系専用入出力ルーチンは使用の予定がありません。

質問者が選んだベストアンサー

  • ベストアンサー
  • ara_ara
  • ベストアンサー率35% (124/348)
回答No.1
aramananto
質問者

お礼

お教え頂いたサイトの内容から, Windows95 以後サポートされている long file name のルーチンでの uni-code → Shift-Jis の変換ルーチン と同一であることがわかりましたが,UTF-8からUTF-16やUTF-4への変換方法がわからず若干苦労しました。 関係キーソラシスを上記サイトからさがし求め, http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm にて公開されている utf8.lzh に含まれる F. Yergeau, 陸野優樹訳 "UTF-8, ISO 10646 を変換したフォーマット", rfc2279-jp.txt を参考にして,UTF-8 ←→ Shift-JIS のルーチンが MS-Basic で完成しました。 現時点では,CP932 との整合性(約360個の不可逆変換)で迷っています。 これは別の問題と考えています。 コード表は次のアドレスに移動していました。 ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/ ftp://ftp.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/