• ベストアンサー

文字コードの問題

検索ルーチンを作ってて問題が起きました。 EUCコードでの検索で".{4}庁"を正規表現で検索した時、"FDA"の部分がヒットしてしまったみたいで上手くいきません。調べた所、"庁"はEUCで"C4C3"、Dが"A3C4"、Aが"A3C1"でDAで"C4A3"が含まれてしまい失敗しているだろう事は分かりました。ただ、解決方法が分からりません。よろしければ良い手立てを教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • hrm_mmm
  • ベストアンサー率63% (292/459)
回答No.3

http://www.din.or.jp/~ohzaki/perl.htm#JP_Match ここが参考になりませんか?

参考URL:
http://www.din.or.jp/~ohzaki/perl.htm#JP_Match
jukimoto
質問者

お礼

返答が遅れて申し訳ありません。土日PCに触れなかったもので・・・。 参考URLの区切り文字を入れて検索するやり方で上手くいきました。本当は処理速度が速いと書かれている方でやりたかったのですが、上手く行かず、試行錯誤した結果、自分のプログラムに組み込めました。 本当にありがとうございました。

その他の回答 (2)

  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.2

encoding 指定をしてスクリプトを記述する ファイルからの読込もencoding 指定をして取り込む

jukimoto
質問者

お礼

返答いただきありがとうございました。無事解決しました。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

Unicode にするとか.

jukimoto
質問者

お礼

返答いただきありがとうございました。無事解決しました。

関連するQ&A