ベストアンサー

何度も出現する文字列AAのうち、3番目と4番目のAAの間にある文字列を得たい

2007/02/13 20:10

以下のようなHTMLから、 <tr><td>AAA<td>BBB<td>CCC<td>DDD<td>EEE<td></tr> CCC という文字列だけを取り出したいとき、Perl、または正規表現ではどのように記述したらよいのでしょうか？？ Index関数を使ってみたのですが、うまくいきませんでした。アドバイスをよろしくお願いします。

zuntata99

zuntata99
お礼率55% (20/36)

Perl
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

kumoz

kumoz
ベストアンサー率64% (120/185)

2007/02/13 21:38 回答No.1

文字列が $line に入っているものとして、 $line =~ /(<td>).+?\1.+?\1(.+?)\1/; print "$2\n"; これで、CCC が表示されるものと思います。

zuntata99

質問者

お礼 2007/02/14 16:23

ご回答ありがとうございます。 +?\1 を増やす事で範囲をずらす事もできました。

その他の回答 (1)

Tacosan

Tacosan
ベストアンサー率23% (3656/15482)

2007/02/13 22:15 回答No.2

できればもうちょっと「やりたいこと」を正確に書いてほしいなぁと思いつつ, /^(?:.*?<td>){3}(.*?)<td>/ でもいいかも. 時間かかっていいなら split 使ってもいいし.

zuntata99

質問者

お礼 2007/02/14 16:24

すみません、この問題以外の部分は出来上がっていたので、ポイントを絞った質問とさせて頂きました。ご回答ありがとうございます。

注目のQ&A

カテゴリ

[技術者向] コンピューター
- プログラミング・開発

カテゴリ一覧を見る

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

職業から探して質問する

専門家登録