Unicode上しか存在しない文字一覧を調べたい
Unicode上しか存在しない文字一覧を調べたい
というのも、画面上で「立方メートル(m^3)」を入力して保存後、画面を開きなおすと「㎥」という文字コードに文字化けを起こしてしまう事象が発生しました。
過去の質問などを調べたところ、以下のような動きになっていると認識しています。
(違ってたら補足お願いします;)
1.入力時:
クライアントはWindows+IEを使用しているため、入力時にはunicodeに存在する「m^3」が表示される
2.データ登録時(クライアント→サーバ):
クライアントからサーバ(Windows)上にデータを送信する際に、文字エンコードをwindows-31Jで指定しているため、文字コード「㎥」に化ける
(※ここでwindows-31Jに「立方メートル」が存在しないため文字化けを起こして登録される?)
3.データ表示時(サーバ→クライアント):
サーバからデータを送信する際にはshift-JISを指定しているため、文字コード「㎥」として送信される
※参考:http://okwave.jp/qa/q1676143.html
そこで知りたいのが、このようにデータを登録すると文字化けを起こしてしまう文字の一覧を知りたいと思っております。
つまりUnicodeにのみ存在する文字の一覧を調べたいと思っているのですが…。
自分で調べた限りでは、↓のように、unicode文字の一覧は見つかったのですが、「unicodeのみに存在する文字」(=文字化けして表示されてしまう)文字の一覧というものが調べられず。。。
http://nurucom-archives.hp.infoseek.co.jp/digital/unicode-table.html
http://d-toybox.com/studio/lib/romanNumerals.html#sample
もし紹介しているサイトをご存知の方いましたら教えていただけると幸いです。
もしくは自分で調べるための方法などをご教示していただけると助かります。
(さすがに画面に65535文字打ち込んで調べるのは骨が折れます。。)