• 締切済み

HTMLファイルをエクセルなどで一覧にする方法

HTMLファイルが、約3000個あり、その<body> から <body/>の間のソースのみを抽出し、エクセルで一覧にしたいと考えています。エクセル以外に、アクセスやテキストエディタでも構いません。 一覧というのは、1つのHTMLファイルのソースを1行に表示。 できれば、ファイル名も別の列で表示できれば理想です。 ファイル名  ソース A100000   <CENTER><TABLE ~~ A100001   <CENTER><TABLE ~~ A100002   <CENTER><TABLE ~~ A100003   <CENTER><TABLE ~~  ↓ いろいろ考えましたが、断念してしまいました。 <body> から <body/>内だけの抽出はできました。 そのHTMLファイルをどうにかして、まとめられればと考えています。 最悪、ファイル名部分は表示できなくてもかまいません。中身のソースが一覧でまとめられればOKです。 そのような方法、ソフトもあるのでしょうか? 続けての質問ですみませんが、よろしくお願いします。

みんなの回答

noname#182251
noname#182251
回答No.1

以前インターネット上のユーザーが監視するURLのユーザー指定箇所が変化するのを監視するアプリケーションを作成したことがあります。その際に 1.改行の削除(<BR>以外) 2.コメントの削除 などを行いました。同じような処理の繰り返しでできそうですが、そんなアプリケーションに一般的な利用価値があるのでしょうか? それと結果はかなり長大な一行になると思いますが、エクセルのセルに格納できるのでしょうか?

oyaoya2006
質問者

補足

確かに一般的な利用価値はないかもしれませんで。個人的にはかなりの価値があるのですが。 また、長大な一行になるのも理解しています。 Excelでなく、テキストエディタでも構わないのですが。。

関連するQ&A