• 締切済み

GetHTMLWと巡集について

os XPsp2、IE6.0でGetHTMLW7.14.0と巡集 ver1.59.2を使用しています。 gethtmlw.txtやFAQ, 問答集などを読んでも、全然わか らないので困っています。 1.IE6.0でGetHTMLWのProxy Mode 1、Proxy Mode 2の機能を使うためには、GetHTMLWの設定を どのようにしたらいいのでしょうか。 2.GetHTMLWで画像ファイルや音声ファイルや圧縮フ ァイルなどをHPと一緒に取得するためには、設定を どのようにしたらいいのでしょうか。 3.GetHTMLWや巡集でひとつの画面で、画面の半分は 取得できたけれども、もう半分はテキストファイルみ たいになっている場合は、どうすればよいのでしょう か? <html><head><title>ソフトウェア関連質問スレ用FAQ</title> <meta name="robots" content="index,follow"> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="Content-Style-Type" content="text/css" /> いくらやり直してもこのようにうまくいきません。 4.GetHTMLWで、取得できないものとして、 (Shockwave-Flash 内の追跡は対応しましたが、Java, JavaScript,その他純粋な HTML でないページには対 応していません) と書いてあるのですが、具体的にはどのようなことを さすのでしょうか。 もし、そういったものを取得したい場合は、どのよう に対処すればよいのでしょうか。 5.巡集でHPをダウンロードすると、ダウンロード したフォルダ名やファイル名が文字化けしていて、そ のファイルを開くと、中身も文字化けしています。 その場合、どうやったら、きちんとダウンロードでき るのでしょうか。 6.巡集の設定で「HTMLのタグを読まないとUR Lの%を変換しない」は、どういう時にチェックをす ればよいのでしょうか。 どうか宜しくお願いします。

みんなの回答

noname#21649
noname#21649
回答No.3

>拡張子/文字列フィルタの書式に、正規表現とい 著者によって内容が多少異なるので「正規表現」の言葉の意味は回答富農。 >って、どういうこと? 「階層内」とは4.と5.の間の「(選択値)階層まで取得」の「階層」。第一階層は.取得支持をした頁。第二階層は.取得支持した頁の<A><IMG>タグ等で参照している頁(ファイルを含む)。第三階層は第二階層の頁で<A><IMG>タグ等で参照している頁(ファイルを含む)。以下略。 この指定によりGethtmlwが取得・保存されるアドレスの範囲が決まる(実際には他の指定もありますが)。 これら指定に依存せず.実際に受信した(IEがキャッシュとして保存している内容を含まないの意味)ファィルをGetHtmlが保存するのがProxy mode 2。本来のプロキシサーバーとして機能します。 >どういう意味ですか? http://oshiete1.goo.ne.jp/kotaeru.php3?q=1283552 >説明を省略されると、非常につらいです。 説明が省略できないと時間的に非常につらいです。 12月まで待っていただければ比較的時間も取れるのですが。 >さしているのでしょうか。 IEの設定であり.GetHTMLwの設定では有りません。

すると、全ての回答が全文表示されます。
noname#21649
noname#21649
回答No.2

>ダウンロードされています。 >ヘルプが難しくて理解できません。 よりバージョンの違いで私の走査との違いがなければ 0.拡張子/文字列フィルターを使う のレ印を消せばすべてのファイル識別子のファィルがDLの対象となります。 識別子とその意味については.どなたかの回答を参考にしてください。 >の意味がわかりません。 とほほ氏のサイトの説明から http://www.tohoho-web.com/js/window.htm http://www.tohoho-web.com/js/function.htm Windows.open(URL)ですから直接URLを見つけることは可能です。しかし関数の場合.引数をみて判断する必要があるのでGetHTmlでは解釈できません。 >ProxyMode 2の機能を使うためには、GetHTML 1.GetrHtmlWを起動して.IEで受信したファイルが見える状態手にしてください(これでかなり説明がカット。ただしマニュアルでProxyサーバーの設定(Localhost 18080)をしてあるとして)。 2.IEをいったん終了し.ローカルファイルを何か表示させるようにして実行 3.GetHtml画面右上{X}マークの下に「Local....」という部分をクリック.{ProxyMode 2}等の表示が出たら「ProxyMode 2」をクリック。 4.IEのアドレス欄に受信したいURLを手入力。 JAVAの解釈をしてくれるので.HTTP受信の内容が保存されます。ただし.一部httpの規格に適合しない内容(WMP・アクロバット等が起動する場合等)では受信できません。 勝手に起動するソフトを起動しないように変更すると.「ファイルを保存しますか」の表示が出ます。これて保存してください(GetHtmlのディレクトリに保存されない場合があります)。

hmnjtp
質問者

補足

>0.拡張子/文字列フィルターを使う >のレ印を消せばすべてのファイル識別子のファィル >がDLの対象となります それが、一番楽な方法だけれども、そうすると、 あっというまに、ファイルが増えてしまって 収拾がつかなくなる自分が目に見える。 2.拡張子/文字列フィルタの書式に、正規表現とい うものがあって、この説明がもう難しすぎます。 自分で調べてみても全然解からない。だめだこりゃ。 ヘルプに >取得レベルが 2 の場合、 >次にかかれた拡張子(文字列)のある URL のデータ >が、許された URL 階層外であっても >取得を許します。 「許された URL 階層外であっても」 って、どういうこと? とほほ氏のサイトの説明も >Windows.open(URL)ですから直接URLを見つけること >は可能です。 >しかし関数の場合.引数をみて判断する必要があるの >でGetHTmlでは解釈できません。 用語も用語の説明も、難しくてお手上げです。 >IEで受信したファイルが見える状態手にしてくださ >い とはどういう意味ですか? >(これでかなり説明がカット。 説明を省略されると、非常につらいです。 >勝手に起動するソフトを起動しないように変更する >と.「ファイルを保存しますか」の表示が出ます。 >これて保存してください(GetHtmlのディレクトリに >保存されない場合があります)。 具体的にGetHTMLWのどの機能や設定のことをさしてい るのでしょうか。

すると、全ての回答が全文表示されます。
noname#21649
noname#21649
回答No.1

OS画異なるのでOSの違いよる部分はご自身で調べてください(当方Win98)。巡集をしらないのでこちらは回答富農。 1.2.Gethtml単体での取得に成功していますか?。お知らせください(回答を書くのが面倒)。 単体での取得と.Proxymode2での取得では方法が異なりますから 3.経験なく回答富農。 4.単体で取得する場合に.Windows.openは解釈できるようです。しかし.関数で複雑回帰になっている場合には.解釈できません。取得したい場合にはProxymode2を使います。

hmnjtp
質問者

補足

>1.2.Gethtml単体での取得に成功していますか?。 お知らせください(回答を書くのが面倒)。 1. WebPage データの取得 「動作(A)」→「WebPage取得(W)」で 取得するURLを入力しますという表示が出るので 保存するHPのURLを入力すると、ダウンロード されています。 2.メニューの「設定(C)」→「取得条件設定(G)」 ・[拡張子/文字列フィルタを使う] の部分を変更すればいいと思うのですが、 ヘルプが難しくて理解できません。 >4.単体で取得する場合に.Windows.openは >解釈できるようです。しかし.関数で複雑 >回帰になっている場合には.解釈できませ >ん。 「Windows.open」、「関数で複雑回帰に なっている場合には.解釈できません。」 の意味がわかりません。

すると、全ての回答が全文表示されます。

関連するQ&A