ベストアンサー

日本語以外の除去

2005/12/02 13:54

お世話になります。フォームから送られてきたデータで、日本語以外のみ　× 半角英数字+日本語　○ 日本語のみ　○ というチェックを行いたいのですがなにかいい方法はないでしょうか？よろしくお願いします

SAY_MAN
お礼率61% (74/121)

PHP
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

BLUEPIXY

BLUEPIXY
ベストアンサー率50% (3003/5914)

2005/12/05 18:17 回答No.2

>韓国語や中国語は何バイト文字なんでしょうか？ unicodeを使うことになると思いますが、 unicodeの場合unicode16の場合全ての文字が２バイトだったと思います。あと、最初にエンディアンコードが付く場合があります。ＴＵＦ－８の場合、１バイト～３バイトだったと思います。 unicodeの場合単純にバイトサイズ数で判別するという風にはできません。

質問者

お礼 2005/12/12 17:28

遅くなってすいません。ありがとうございました

ログインすると、全ての回答が全文表示されます。

その他の回答 (1)

BLUEPIXY

BLUEPIXY
ベストアンサー率50% (3003/5914)

2005/12/02 18:59 回答No.1

単純には、 mb_detect_encoding で、検出したencodeがASCIIかどうか調べる * 扱う文字列を mb_convert_encoding で、まずはＳＨＩＦＴ_ＪＩＳにする。そうすると、半角１バイト全角２バイトだと期待できる。 mb_convert_kana を使って半角→全角にすると、 strlen(変換後の文字列)-strlen(変換前の文字列) で何文字半角文字が含まれていたかわかる。ちょうど倍になっていれば、すべてが半角文字列だったことがわかる。

質問者

お礼 2005/12/05 16:28

おそくなって申し訳ありません。バイト数で調べればいいわけですね。ありがとうございます。追加質問になって申し訳ないのですが韓国語や中国語は何バイト文字なんでしょうか？

ログインすると、全ての回答が全文表示されます。

関連するQ&A

注目のQ&A

カテゴリ

[技術者向] コンピューター
- プログラミング・開発

カテゴリ一覧を見る

OKWAVE コラム

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

職業から探して質問する

専門家登録