• 締切済み

HTMLファイルをCSVファイルへ

はじめまして。 HTMLファイルのタグ以外のデータを最終的にCSVファイル(カンマ区切り)に 落としたいのですが、このプログラムをPerlで書かなければなりません。 ツリー構造を利用?して書くと言われましたが、良くわかりません。 Perlも始めたばかりなので、わかる方は教えてください。

みんなの回答

回答No.2

アンケートフォームにユーザが入力したデータが、どうして html になっているのかがよくわからないのですが。よくあるのは、アンケートフォームの各入力項目を cgi プログラムにわたしてしまうやりかたですが、それを perl で作ったとしても、html を解析するという事態は起きません。 なにか、あまり一般的でないようなことをしようとしているように読めてしまいますが、もうすこし問題を分析した方がいいでしょうね。

yuumoga
質問者

お礼

色々と有難うございました

yuumoga
質問者

補足

本当に説明不足ですいません。 過去、アンケートを取ったものをソース(HTMLファイル)として、とってあります。それが、500件ほどあります。そのソースはもちろん<HTML><HEAD><TITLE>アンケート</TITLE>.....となっています。この「アンケート」という部分を抜き出し、CSVファイルとして保存し直したいという事です。 最終的にこのCSVファイルからMSAccessへ移し、DB管理していきたいのが狙いです。 500件という膨大な量がありますし、秀丸マクロと手作業でも構いませんが、 出来ればPerlスクリプトで実行したいのです。

回答No.1

例えば、どんな html ファイルを、どんな csv ファイルに変換するのでしょう? html の文書は、基本的には階層構造をしています。ですから、一般の html の文書を csv の行列の形に一意に変換できるとは思えないのですが。html 文書に何らかの制約があるとか、その内の特定の構造の部分だけ抜き出すというわけでもないのですか? あと、一般の html 文書を解析するには perl の HTML::Parser (と HTML::Tagset ?)というモジュールを、どこかから入手する方がいいでしょう。しかし、これもかなり複雑で、html の解析のことや、perl をだいぶ知ってないと使えないような気がします(私は使ったことないですが)。日本語を対象にするには、日本語対応の perl の方がいいでしょうし。 いずれにしても、まずは、何をしたいのかを明確にすることですね。

yuumoga
質問者

補足

例えば、アンケートフォームなどユーザが入力した文章をCSVファイルに落としたいということです。 説明がうまくいかなくてすいません。

関連するQ&A