締切済み

大量にウェブ上の情報を収集するおススメのウェブ巡回・ダウンローダありますか？

2008/11/16 00:33

ウェブ上の情報をマイニング（解析等）する研究を行う上でまず必要なのは、必要なデータをどれだけ多く、素早く、的確に集めることが出来るかだと思います。現在「巡集」と呼ばれるフリーソフトで情報をちまちま集めているのですが、キーワードが含まれているか否かのフィルタリングが行えなかったり、画像保存に失敗することによるタイムロスが相当数あるなど、ちょっと満足できるものではありません。そこで、皆さんがおススメするWeb巡回ソフト、ダウンローダはありますでしょうか。基本的な用途は、いくつかある種URLからリンクを辿っていくこと。読み込んだページ、画像などを保存していくこと（オフライン閲覧できるように）や、 URLやキーワードによるフィルタリングが可能であること、並列ダウンロードなどを駆使して高速に巡回を行ってくれることなどです。なお、一応の候補に以下を挙げておきます。それぞれの良し悪しを教えて下さるだけでも大変助かります。 1.ダウンロードSpider4 DX（ジャングル） 2.ダウンロードNinja4 マッハ（イーフロンティア） 3.Download & Search Bee （クロノスクラウン）どうぞよろしくお願い致します。

driscoll
お礼率40% (2/5)

その他(ソフトウェア)
回答数1
ありがとう数3

みんなの回答 （1）
専門家の回答

みんなの回答

kata_san
ベストアンサー率33% (423/1261)

2008/11/16 01:26 回答No.1

IE6.0までなら「i.j IE5 Web Rebuilder」が階層構造や表示などでローカルファイルに保存できて便利です。パスワードなどが必要ないものは、幽霊ファイルとしてダウンロードもできます。もちろんフリーでよいソフトです。ローカルではリンクを作成して閲覧可能にする機能もありかつて、通信費用が高価だった頃にはずいぶん重宝しました。ファイルのサーバの日時がわかるのでそういったメリットもありもちろん現在も、更新の有無の確認に使用しています。難点は、JAVAに非対応です。作者がもう開発を終了しました。動作については、Win2000ではほとんど問題が無いのですが、 WinXPの場合には、キャッシュ保存完了時にエラーがでます。まれにキャッシュ出来ないサイトも多くなりました。定期的に閲覧するような個所は、download.lstファイルを作成しておくことで更新がわかります。古いファイルを残すことも出来ます。作者のページは、もうありません。ベクターかLRCにあります。 http://www.vector.co.jp/vpack/filearea/win95/net/www/cache/ http://www2.lint.ne.jp/~lrc/in_cache.htm

質問者