- 締切済み
GetHTMLWと巡集について
os XPsp2、IE6.0でGetHTMLW7.14.0と巡集 ver1.59.2を使用しています。 gethtmlw.txtやFAQ, 問答集などを読んでも、全然わか らないので困っています。 1.IE6.0でGetHTMLWのProxy Mode 1、Proxy Mode 2の機能を使うためには、GetHTMLWの設定を どのようにしたらいいのでしょうか。 2.GetHTMLWで画像ファイルや音声ファイルや圧縮フ ァイルなどをHPと一緒に取得するためには、設定を どのようにしたらいいのでしょうか。 3.GetHTMLWや巡集でひとつの画面で、画面の半分は 取得できたけれども、もう半分はテキストファイルみ たいになっている場合は、どうすればよいのでしょう か? <html><head><title>ソフトウェア関連質問スレ用FAQ</title> <meta name="robots" content="index,follow"> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="Content-Style-Type" content="text/css" /> いくらやり直してもこのようにうまくいきません。 4.GetHTMLWで、取得できないものとして、 (Shockwave-Flash 内の追跡は対応しましたが、Java, JavaScript,その他純粋な HTML でないページには対 応していません) と書いてあるのですが、具体的にはどのようなことを さすのでしょうか。 もし、そういったものを取得したい場合は、どのよう に対処すればよいのでしょうか。 5.巡集でHPをダウンロードすると、ダウンロード したフォルダ名やファイル名が文字化けしていて、そ のファイルを開くと、中身も文字化けしています。 その場合、どうやったら、きちんとダウンロードでき るのでしょうか。 6.巡集の設定で「HTMLのタグを読まないとUR Lの%を変換しない」は、どういう時にチェックをす ればよいのでしょうか。 どうか宜しくお願いします。
- みんなの回答 (3)
- 専門家の回答
補足
>0.拡張子/文字列フィルターを使う >のレ印を消せばすべてのファイル識別子のファィル >がDLの対象となります それが、一番楽な方法だけれども、そうすると、 あっというまに、ファイルが増えてしまって 収拾がつかなくなる自分が目に見える。 2.拡張子/文字列フィルタの書式に、正規表現とい うものがあって、この説明がもう難しすぎます。 自分で調べてみても全然解からない。だめだこりゃ。 ヘルプに >取得レベルが 2 の場合、 >次にかかれた拡張子(文字列)のある URL のデータ >が、許された URL 階層外であっても >取得を許します。 「許された URL 階層外であっても」 って、どういうこと? とほほ氏のサイトの説明も >Windows.open(URL)ですから直接URLを見つけること >は可能です。 >しかし関数の場合.引数をみて判断する必要があるの >でGetHTmlでは解釈できません。 用語も用語の説明も、難しくてお手上げです。 >IEで受信したファイルが見える状態手にしてくださ >い とはどういう意味ですか? >(これでかなり説明がカット。 説明を省略されると、非常につらいです。 >勝手に起動するソフトを起動しないように変更する >と.「ファイルを保存しますか」の表示が出ます。 >これて保存してください(GetHtmlのディレクトリに >保存されない場合があります)。 具体的にGetHTMLWのどの機能や設定のことをさしてい るのでしょうか。