ベストアンサー

日本語のマッチング(正規表現)

2005/10/07 14:05

Perl5.8.7で日本語のマッチングを行おうとしてます．文字コードはEUCで，[ト]，[ユ]，[ャ]，[ュ]や[ョ] の後にある[ウ]を[ー(長音)]に変換しようとするものです．例．ヒャクトウバン→ヒャクトーバン自分の考えた正規表現では成功しませんでした． if($b[$i] =~ /[\xa5e6\xa5c9\xa5e3 　　　　　　　\xa5e5\xa5e7]\xa5a6/){ $b[$i] =~ s/\xa5a6/\xa1bd/; } 文字コードを直接書く方法しかないのか，日本語はマッチングできるのかなどわからないので，よろしくお願いいたします．

Achilles1993

Achilles1993
お礼率94% (18/19)

Perl
回答数2
ありがとう数3

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

Tacosan

Tacosan
ベストアンサー率23% (3656/15482)

2005/10/07 17:49 回答No.1

うろ覚えですが, use encoding 'euc-jp'; しておけば正規表現の中でもカタカナって使えませんでしたっけ?

Achilles1993

質問者

お礼 2005/10/09 17:12

キーワードで(use encoding 'euc-jp';)を調べたら、関連するページも出てきて、できそうです。ありがとうございました。

その他の回答 (1)

BLUEPIXY

BLUEPIXY
ベストアンサー率50% (3003/5914)

2005/10/07 20:33 回答No.2

#1もおっしゃってますけどencodingを指定しておけば、日本語のマッチングってできますよ。 use encoding 'euc-jp'; $data="ヒャクトウバン"; $data =~ s/([トユャュョ])ウ/$1ー/g; print $data;

Achilles1993

質問者

お礼 2005/10/09 17:15

基本形を示していただいてありがとうございます。３行目は勉強になりました。

注目のQ&A

カテゴリ

[技術者向] コンピューター
- プログラミング・開発

カテゴリ一覧を見る

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

職業から探して質問する

専門家登録