- ベストアンサー
htmlファイルをtxtで保存する方法
- htmlファイルをtxt形式で保存する方法について調査しました。
- 過去ログを参照し、wgetコマンドやファイルの保存方法について確認しました。
- 結果として、wgetコマンドにはtxt形式で保存するオプションがないため、htmlファイルをtxt形式で保存するには別の方法が必要です。バッチファイルを作成する方法もあります。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
>OSはWin98です。宜しくお願いいたします。 98系の場合for文や環境変数の加工のコマンドが少ないため、 yy-mm-dd の形式なら本日日付のファイル名を作成することができます。 日付時刻を取得する方法は参考URLに記載されています。 この方法を加工します。 wget.exe 収集するサイトのhtml REM Win95/98系で日付を取得する。 echo set date=%%3>$tmp.bat dir | find "$tmp">timeset.bat call timeset.bat del $tmp.bat del timeset.bat HtoX32c.exe 収集するサイトのhtml > txt\%date%.txt del 収集するサイトのhtml exit
その他の回答 (3)
- pita-gora
- ベストアンサー率70% (102/145)
>>重ねて教えていただきたいのですが。。。 >>テキストファイルに変換したものの名前(変換した.txt)を、自動的に日付を取得して日付.txtにしたいと思いますが、どのように記述したら良いでしょうか? >>終了時にこのDOS窓を閉じるにはどのようにすれば良いでしょうか? DOS窓とのことですが、OSは何ですか? 2000/XPなら現在日付は%date%で参照できます。また、exitでコマンドプロンプトが閉じます。 wget.exe 収集するサイトのhtml set fname=%date:~-10% set fname=%fname:/=% HtoX32c.exe 収集するサイトのhtml > txt\%fname%.txt del 収集するサイトのhtml exit 98系の場合は別途方法がありますので補足に記載してください。
補足
> 98系の場合は別途方法がありますので補足に記載してください。 ご親切に感謝いたします。 OSはWin98です。宜しくお願いいたします。
- pita-gora
- ベストアンサー率70% (102/145)
引っ越しされたhttp://okweb.jp/kotaeru.php3?q=1472090の No.1さんが かかれている、 >HTMLをテキストに変換するツール >http://win32lab.com/fsw/htox.html >というものがあります。一度試してみてはいかがでしょうか のなかに、Windows95/98/NT4.0(Console)版 (HtoX32c Ver.1.73 2004/08/11) というのがバッチで使える形式です。 このファイルのReadmeにあるように (例3: カレントディレクトリの拡張子 .htm のファイルをテキストファイル に変換したい) c:\>HtoX32c *.htm とありますので、バッチで wget 収集するサイト htox32c *.html と続けて記述すれば、すべてのhtmlファイルがtxt形式に変換されるでしょう。具体的な記述がわからなければ現在のバッチを補足に記載してみてください。
補足
有り難うございます。ご指導のように。。。 wget.exe 収集するサイトのhtml HtoX32c.exe 収集するサイトのhtml > txt\変換した.txt del 収集するサイトのhtml で、このBATをタスクに登録することで目的を達成することが出来ました。 重ねて教えていただきたいのですが。。。 テキストファイルに変換したものの名前(変換した.txt)を、自動的に日付を取得して日付.txtにしたいと思いますが、どのように記述したら良いでしょうか? 終了時にこのDOS窓を閉じるにはどのようにすれば良いでしょうか? 以上、宜しくお願いします。m(_ _)m
- WillDesignWorks
- ベストアンサー率36% (1407/3901)
htmlファイルなら中身はテキスト形式ですから、*.htmlを*.txtに強制的にリネームするだけでいいんじゃ?。 そういう意図の質問でなければごめんなさい。
お礼
有り難うございます。 保存したファイルのファイル名や拡張子だけの問題では無いのです。 「手作業ではhtmlを保存する際に、ファイルの種類を (*.html)や(*.txt)を選択できます」 にて、(*.txt)を選択して保存するとタグがないテキストが保存されます。
お礼
有り難うございました。希望通りのバッチを作成できました。