締切済み

GetHTMLWと巡集について

2005/05/21 23:20

os ＸＰｓｐ2、ＩＥ６．０でGetHTMLW7.14.0と巡集 ver1.59.2を使用しています。 gethtmlw.txtやFAQ, 問答集などを読んでも、全然わからないので困っています。１．ＩＥ６．０でGetHTMLWのProxy Mode 1、Proxy Mode 2の機能を使うためには、GetHTMLWの設定をどのようにしたらいいのでしょうか。２．GetHTMLWで画像ファイルや音声ファイルや圧縮ファイルなどをＨＰと一緒に取得するためには、設定をどのようにしたらいいのでしょうか。３．GetHTMLWや巡集でひとつの画面で、画面の半分は取得できたけれども、もう半分はテキストファイルみたいになっている場合は、どうすればよいのでしょうか？ <html><head><title>ソフトウェア関連質問スレ用FAQ</title> <meta name="robots" content="index,follow"> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="Content-Style-Type" content="text/css" /> いくらやり直してもこのようにうまくいきません。４．GetHTMLWで、取得できないものとして、 (Shockwave-Flash 内の追跡は対応しましたが、Java, JavaScript,その他純粋な HTML でないページには対応していません) と書いてあるのですが、具体的にはどのようなことをさすのでしょうか。もし、そういったものを取得したい場合は、どのように対処すればよいのでしょうか。５．巡集でＨＰをダウンロードすると、ダウンロードしたフォルダ名やファイル名が文字化けしていて、そのファイルを開くと、中身も文字化けしています。その場合、どうやったら、きちんとダウンロードできるのでしょうか。６．巡集の設定で「ＨＴＭＬのタグを読まないとＵＲＬの％を変換しない」は、どういう時にチェックをすればよいのでしょうか。どうか宜しくお願いします。

hmnjtp
お礼率77% (111/143)

フリーウェア・フリーソフト
回答数3
ありがとう数1

みんなの回答 （3）
専門家の回答

みんなの回答

noname#21649

2005/05/25 02:41 回答No.3

＞拡張子/文字列フィルタの書式に、正規表現とい著者によって内容が多少異なるので「正規表現」の言葉の意味は回答富農。＞って、どういうこと？「階層内」とは4.と5.の間の「(選択値)階層まで取得」の「階層」。第一階層は.取得支持をした頁。第二階層は.取得支持した頁の<A><IMG>タグ等で参照している頁(ファイルを含む)。第三階層は第二階層の頁で<A><IMG>タグ等で参照している頁(ファイルを含む)。以下略。この指定によりGethtmlwが取得・保存されるアドレスの範囲が決まる(実際には他の指定もありますが)。これら指定に依存せず.実際に受信した(IEがキャッシュとして保存している内容を含まないの意味)ファィルをGetHtmlが保存するのがProxy　mode 2。本来のプロキシサーバーとして機能します。＞どういう意味ですか？ http://oshiete1.goo.ne.jp/kotaeru.php3?q=1283552 ＞説明を省略されると、非常につらいです。説明が省略できないと時間的に非常につらいです。１２月まで待っていただければ比較的時間も取れるのですが。＞さしているのでしょうか。 IEの設定であり.GetHTMLwの設定では有りません。

ログインすると、全ての回答が全文表示されます。

noname#21649

2005/05/23 02:41 回答No.2

＞ダウンロードされています。＞ヘルプが難しくて理解できません。よりバージョンの違いで私の走査との違いがなければ 0.拡張子/文字列フィルターを使うのレ印を消せばすべてのファイル識別子のファィルがDLの対象となります。識別子とその意味については.どなたかの回答を参考にしてください。＞の意味がわかりません。とほほ氏のサイトの説明から http://www.tohoho-web.com/js/window.htm http://www.tohoho-web.com/js/function.htm Windows.open(URL)ですから直接URLを見つけることは可能です。しかし関数の場合.引数をみて判断する必要があるのでGetHTmlでは解釈できません。＞ProxyMode 2の機能を使うためには、GetHTML 1.GetrHtmlWを起動して.IEで受信したファイルが見える状態手にしてください(これでかなり説明がカット。ただしマニュアルでProxyサーバーの設定(Localhost 18080)をしてあるとして)。 2.IEをいったん終了し.ローカルファイルを何か表示させるようにして実行 3.GetHtml画面右上{X}マークの下に「Local....」という部分をクリック.{ProxyMode 2}等の表示が出たら「ProxyMode 2」をクリック。 4.IEのアドレス欄に受信したいURLを手入力。 JAVAの解釈をしてくれるので.HTTP受信の内容が保存されます。ただし.一部httpの規格に適合しない内容(WMP・アクロバット等が起動する場合等)では受信できません。勝手に起動するソフトを起動しないように変更すると.「ファイルを保存しますか」の表示が出ます。これて保存してください(GetHtmlのディレクトリに保存されない場合があります)。

質問者

補足 2005/05/24 22:21

＞0.拡張子/文字列フィルターを使う＞のレ印を消せばすべてのファイル識別子のファィル＞がDLの対象となりますそれが、一番楽な方法だけれども、そうすると、あっというまに、ファイルが増えてしまって収拾がつかなくなる自分が目に見える。２．拡張子/文字列フィルタの書式に、正規表現というものがあって、この説明がもう難しすぎます。自分で調べてみても全然解からない。だめだこりゃ。ヘルプに＞取得レベルが 2 の場合、＞次にかかれた拡張子(文字列)のある URL のデータ＞が、許された URL 階層外であっても＞取得を許します。「許された URL 階層外であっても」って、どういうこと？とほほ氏のサイトの説明も＞Windows.open(URL)ですから直接URLを見つけること＞は可能です。＞しかし関数の場合.引数をみて判断する必要があるの＞でGetHTmlでは解釈できません。用語も用語の説明も、難しくてお手上げです。＞IEで受信したファイルが見える状態手にしてくださ >いとはどういう意味ですか？＞(これでかなり説明がカット。説明を省略されると、非常につらいです。＞勝手に起動するソフトを起動しないように変更する＞と.「ファイルを保存しますか」の表示が出ます。＞これて保存してください(GetHtmlのディレクトリに＞保存されない場合があります)。具体的にGetHTMLWのどの機能や設定のことをさしているのでしょうか。

ログインすると、全ての回答が全文表示されます。

noname#21649

2005/05/22 03:29 回答No.1

ＯＳ画異なるのでOSの違いよる部分はご自身で調べてください(当方Win98)。巡集をしらないのでこちらは回答富農。 1.2.Gethtml単体での取得に成功していますか?。お知らせください(回答を書くのが面倒)。単体での取得と.Proxymode2での取得では方法が異なりますから 3.経験なく回答富農。 4.単体で取得する場合に.Windows.openは解釈できるようです。しかし.関数で複雑回帰になっている場合には.解釈できません。取得したい場合にはProxymode2を使います。

質問者

補足 2005/05/22 21:52

＞1.2.Gethtml単体での取得に成功していますか?。お知らせください(回答を書くのが面倒)。１． WebPage データの取得「動作(A)」→「WebPage取得(W)」で取得するＵＲＬを入力しますという表示が出るので保存するＨＰのＵＲＬを入力すると、ダウンロードされています。２．メニューの「設定(C)」→「取得条件設定(G)」・[拡張子/文字列フィルタを使う] の部分を変更すればいいと思うのですが、ヘルプが難しくて理解できません。＞4.単体で取得する場合に.Windows.openは＞解釈できるようです。しかし.関数で複雑＞回帰になっている場合には.解釈できませ＞ん。「Windows.open」、「関数で複雑回帰になっている場合には.解釈できません。」の意味がわかりません。

ログインすると、全ての回答が全文表示されます。