ベストアンサー

全角文字列から英数字のみ抜き出す方法は？

2005/12/28 10:52

Perl 文字コード sjis 以下のように、全角文字列の中から、全角英数字のみを抜き出したいのですが、良い方法はありますでしょうか。あア亜ＡＢＣ－１２３ ↓ ＡＢＣ－１２３宜しくお願い致します。

abiru
お礼率67% (37/55)

Perl
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

twinkleluz
ベストアンサー率52% (98/185)

2005/12/28 11:57 回答No.1

いったんUTF-8に変換して、s///g置換で英文字以外を削除する方法が一番楽だと思います。日本語処理するときは、いったんUTF-8に変換すると便利な場合が多々あります。 UTF-8の扱いについては、参考URLをどうぞ。 -------------------------------------------------- use Encode; # 検索対象の文字列をUTF-8に変換 my $str = 'あア亜ＡＢＣ－１２３'; my $utf_str = Encode::decode('shift-jis', $str); # 置換に使う条件文字列をUTF-8に変換 $trstr = '０-９Ａ-Ｚａ-ｚ－'; # ここは自由に変更してください my $utf_trstr = Encode::decode('shift-jis', $trstr); # UTF-8同士ならそのまま置換できる。 # $utf_trstrの中身以外の文字を削除 $utf_str =~ s/[^$utf_trstr]//g; # 出力するときにshift-jisに戻す print Encode::encode('shift-jis',$utf_str);