不親切な解答をしたような気がするので、
簡単な例をあげてみたいと思います。
HTML:
<html><body><div class="main" id="main">
<p>なんとか</p>
<p><a href="2.html" class="next">次</a><p>
</div></body></html>
で、次のページへのリンクの XPATH は
/html/body/div/p/a[@class="next"]
とか
//a[contains(concat(" ", @class, " "), " next ")]
とか
//div[@class="main"]//a[contains(text(), "次")]
とか
id("main")//a[@class="next"]
とかと、できるだけ、唯一の要素になるように書きます。
実装によりますが、多分、一致した最初のものが使われると思います。
継ぎ足す要素も同じように
/html/body/div[@class="main"]
とか
//div[@class="main"]
とか
id("main")
とかと、これもできるだけ、唯一の要素になるように書きます。
こちらの場合は、一致した全ての要素を連結して継ぎ足すようです。
あとは対象にしたいサイトの URL を正規表現で書きます。
ただし、スラッシュはエスケープしなくても良いようです。
例えば http://www.example.jp/news/ をベースに 2013/09/29、2010/10/01
などがある場合、
^http://www\.example\.jp/news/.+
という感じで指定します。
アドオンなしでも、最近の Chrome、FireFox などでは、XPATHを簡単に
表示する開発ツールが、メニューからたどれるところにあるので、
対応したいサイトで、開発メニューを開いてみると良いと思います。
分かりにくいところがあれば、補足で指摘してください。
お礼
ありがとうございました。勉強になりました。