utf16の記号のutf8へのエンコード(もしくはマッチ又は削除)がう
utf16の記号のutf8へのエンコード(もしくはマッチ又は削除)がうまくいきません。
お世話になります。
前々回、、、、
http://okwave.jp/qa/q6232556.html
でUTF-16をUTF-8に変換する方法を教えていただきました。
(その節は、ありがとうございました)
$name=~s/\\u([[:xdigit:]]{4})/chr eval "0x$1"/eg;
が、この方法だと、記号が変換されず、例えば、、、
●「~」 は 「\x{301c} 」 と表示され
●「・」 は 「\x{2022}」 と表示されてしまいます。
これらの記号のデコード方法が調べても分からなかったので、いっそ、削除しちゃえ!とばかりに、、、
「「x」から始まり「}」で終わる文字は根こそぎ削除!というプログラムを組み込んでみたのですが、まったく反応せず。
チェックの為に行った「x」だけの削除ですらマッチせず。。。。
(これでは反応しないはずですね。。。)
ということで、utf16の「記号」のutf8へのエンコード(もしくはマッチ又は削除)の方法について、アドバイスいただければ幸いです。
お礼
友人から以下の通りメッセージを受け取りました。 webではパーセント記号が中心ですね。 制御コードとの識別ということで納得いたしました。 ありがとうございます。 *わたしからもお礼いたします。