締切済み

UTF-8 の特定の文字について

2008/12/13 20:21

こちらのページで公開されている http://www.tatamilab.jp/rnd/archives/000390.html#i php版 - NgramConverter の５９～６１行に、 $string = mb_ereg_replace("^(\s|縲)+","",$string); $string = mb_ereg_replace("(\s|縲)+$","",$string); $str_array = preg_split("/(\s|縲)+/",$string); という処理があります。 \sの後の文字列（バイナリではE7B8B2、C280らしい）の意味がわかる方いらっしゃいますか

hoge1111

hoge1111
お礼率0% (0/2)

PHP
回答数2
ありがとう数0

みんなの回答 （2）
専門家の回答

みんなの回答

hrm_mmm

hrm_mmm
ベストアンサー率63% (292/459)

2008/12/14 16:30 回答No.2

utf8の全角ブランクをShift_JISとして表示しているからです。 utf8に対応したエディターを使って下さい。

osamuy

osamuy
ベストアンサー率42% (1231/2878)

2008/12/13 21:12 回答No.1

ngram_converter_0.1.tar.gzを取得してみたところ $string = mb_ereg_replace("(\s|　)+$","",$string); ――と空白文字を処理しているだけみたいです。

関連するQ&A

注目のQ&A

カテゴリ

[技術者向] コンピューター
- プログラミング・開発

カテゴリ一覧を見る

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

職業から探して質問する

専門家登録