• 締切済み

日本語かどうかの判定

postで送られてくる文字列が日本語(全角)か含まれてくるかどうかか調べたい場合のスクリプトは作れないでしょうか。

みんなの回答

  • X-Terra
  • ベストアンサー率48% (25/52)
回答No.2

Perl以外の言語で(Perl互換の正規表現で)、「日本語がふくまれていないもの」をやったときは、 tr/[\xa1-\xfe]/[\xa1-\xfe]/ がtrueかfalseか、で判断したことがあったように思います。

  • MarrowG
  • ベストアンサー率53% (41/76)
回答No.1

Perlでそういったモジュールがあるかどうか分かりませんが…。 jcode.plを使ってShitJISに変換、ShiftJISなら漢字=2バイト確定ですから、比較的検索しやすいと思います。 1バイト目が特定範囲のコードなら2バイト目がこの範囲なら漢字(というか全角文字)という判定が出来ると思います。 今、手元に漢字コード表がないので正確にこの範囲の文字コードなら…と書けません。 中途半端な回答で申し訳ありません。