wgetのコマンドでは不可能?
はじめまして、こんにちは。
wgetでpdfをダウンロードしようと試しているのですが、上手くいかず困っている為質問させて頂きます。「ttp://www.***.jp」というサイトの中の「/yuho/」より下のディレクトリにあるpdfファイルをダウンロードしようとしています。
ttp://www.***.jp
↓
ttp://www.***.jp/list/s1000.htm
(s1000はs2000,s3000,,,s9000まである)
↓
ttp://www.***.jp/code/1301.htm
(1301は1000,1001,,,9999まである)
↓
ttp://www.***.jp/yuho/1301.htm
(1301は1000,1001,,,9999まである)
↓
ttp://www.***.jp/mark/20141114/S1003FL5.htm
(20141114とS1003FL5はそれぞれ変動、このページにpdfファイルへのリンクがある)
上記の様にリンクが繋がっていて、 ディレクトリ「list」「code」「yuho」「mark」を取得対象とすれば良いのだろうと考え、wgetで -I オプションでディレクトリを list/,code/,yuho/,mark/と指定してみたのですが、上手く働きませんでした。
これはやはり階層構造になっていない為でしょうか?
余計なページのpdfをダウンロードせず、ディレクトリ「yuho」以下の階層にあるpdfをダウンロードする場合はどのようなwgetのコードを書けば良いのでしょうか?
wgetでは不可能なのでしょうか?
Irvineというダウンローダーで ttp://www.***.jp/yuho/1301.htm の「1301」の部分を1000から9999にして、ダウンロードする拡張子をpdfに指定、階層を2にして実行しましたがこれも失敗でした。
現在も色々調べておりますが、知恵が足りず大変困っております。
こういった分野に造詣が深い方がいらっしゃいましたら、どうかご教授下さい。
宜しくお願い致します。
補足
上記のサイトをソースを除いたのですが、 :hover、:active、:focusのみではなく .entry-content ol li { line-height:1.7;} .entry-content ul li { line-height:1.7;} li a { -moz-transition: all .8s; -webkit-transition: all .8s; -o-transition: all .8s; } li a:hover { -moz-transition: all .05s; -webkit-transition: all .05s; -o-transition: all .05s; } ul.qd_list { list-style: none; padding:0;} ul.qd_list li { position: relative; padding-left: 20px;} と、いうCSSに加え、何かjqueryのような物で動作しているのですが、 その辺の仕組みの理解に苦しんでいます。