- 締切済み
HTMLファイルをエクセルなどで一覧にする方法
HTMLファイルが、約3000個あり、その<body> から <body/>の間のソースのみを抽出し、エクセルで一覧にしたいと考えています。エクセル以外に、アクセスやテキストエディタでも構いません。 一覧というのは、1つのHTMLファイルのソースを1行に表示。 できれば、ファイル名も別の列で表示できれば理想です。 ファイル名 ソース A100000 <CENTER><TABLE ~~ A100001 <CENTER><TABLE ~~ A100002 <CENTER><TABLE ~~ A100003 <CENTER><TABLE ~~ ↓ いろいろ考えましたが、断念してしまいました。 <body> から <body/>内だけの抽出はできました。 そのHTMLファイルをどうにかして、まとめられればと考えています。 最悪、ファイル名部分は表示できなくてもかまいません。中身のソースが一覧でまとめられればOKです。 そのような方法、ソフトもあるのでしょうか? 続けての質問ですみませんが、よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
noname#182251
回答No.1
以前インターネット上のユーザーが監視するURLのユーザー指定箇所が変化するのを監視するアプリケーションを作成したことがあります。その際に 1.改行の削除(<BR>以外) 2.コメントの削除 などを行いました。同じような処理の繰り返しでできそうですが、そんなアプリケーションに一般的な利用価値があるのでしょうか? それと結果はかなり長大な一行になると思いますが、エクセルのセルに格納できるのでしょうか?
補足
確かに一般的な利用価値はないかもしれませんで。個人的にはかなりの価値があるのですが。 また、長大な一行になるのも理解しています。 Excelでなく、テキストエディタでも構わないのですが。。