- ベストアンサー
正規表現
http://www.***/ というHPで http://www.***/index.cgi?page=1 http://www.***/index.cgi?page=2 : : : : http://www.***/index.cgi?page=10 という風になっていて これをひとつにまとめる正規表現はどうやるのでしょうか?正規表現でDLできるソフトを使いたいのです また例として\.(htm|html|cgi|php)$ こんな風に書いてありました
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
>あと[0-9]のあとに付いている+というのは 秀丸では「直前の文字の1個以上の連続」っていう意味です。 先の例では、「数字([0-9])の並び」ってな感じで使っています。 この辺はソフトによって微妙に違ってくるところなんで、お使いのソフトのマニュアル等も見られたほうがベターかと思います。
その他の回答 (2)
- terra5
- ベストアンサー率34% (574/1662)
正規表現は細かいところはソフトによって違うので, 確実なところを知りたい場合はソフトを明記しないとだめですよ。 あと、ページも[0-9]+とした場合は、かなりマッチする範囲が広いですがいいのでしょうか? (0,000000等にもマッチする) 1~10だけにしたい場合は,例えば([1-9]|10)のようにする必要があります。
お礼
詳しい回答ありがとうございます! ソフトによっても違うんですね ちなみにソフトはBerryという画像収集ソフトです 今度から記入するようにいたします すいませんでした
- ARC
- ベストアンサー率46% (643/1383)
秀丸でしたら http://www\.XXX/index\.cgi\?page=[0-9]+ で出来ました。 「.」や「?」といった意味のある記号をエスケープ文字で打ち消す必要があるんですね。 どれがメタキャラクタか判らない場合は、 http[:][/][/]www[.]XXX[/]index[.]cgi[?]page[=][0-9]+ みたいな感じで、記号類を全部キャラクタクラス化してしまえばいけるんじゃないかと思います。
お礼
ご回答ありがとうございます! ?や.などは前に¥をつけるんですね あと[0-9]のあとに付いている+というのは なんでしょうか?
お礼
なるほど~一個以上ってことなんですね 再度のご回答本当にありがとうございました!!