- ベストアンサー
C言語を使ってhtmlファイルのタグの部分から情報を切り出す方法
- C言語を使用して、htmlファイルのタグで挟まれた部分の情報を抽出するプログラムを作成したいです。
- 具体的には、気象庁のデータ(八王子の2008年5月1日の1時間ごとの値)のhtmlソースを解析し、表の中のデータを整理して保存したいです。
- サンプルプログラムやアドバイスをいただけると助かります。C言語のプログラミングに詳しい方、よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
こんにちは。 直接の回答でなくてすみません。 Excelをお持ちでしたら、という前提で、 ご質問のリンク先のデータを保存するのでしたら、 1)ブラウザ上でデータ範囲をマウスで選択する。 ・選択範囲が反転表示された状態になります。 2)マウスの右クリックメニューよりコピーする 3)Excelを起動する。 ・シートが新規作成された状態にします。 ・かつ、A1セルが選択された状態にします。 4)Excelの「編集」メニューより「貼り付け」を行う。 ・シートにデータが貼り付けられます。 5)必要ならデータを加工する。 6)ExcelでデータをCSV形式ファイルで保存する。 ※また、リンク先サイトのページを保存する際は、ブラウザ上で 「ファイル」メニューより「名前を付けて保存」を選択し、 ファイルの種類を「HTMLのみ」にして保存した方が楽かもしれ ません。 ※ローカルに保存したHTMLファイルをブラウザで開いてから、 上記の作業を行うという方法もあります。 という作業でデータをCSV形式のテキストファイルにしてからの方が、 C/C++のプログラムから扱い易いと思いますが如何でしょうか? CSV形式ならカンマ区切りのみでデータを抜き出していけば良いので、 html形式のデータを扱うよりも処理が楽になるかと思います。 宜しければ検討してみては如何でしょう? まあ、Excelを使うなら、C/C++のプログラムを使わずに、Excelだけで 処理を行うという方法も考えられますが。。。
その他の回答 (2)
- titokani
- ベストアンサー率19% (341/1726)
環境がかかれてないけど、DOMを使うという方法もありそう。 VSの場合、C++からだとちょっと面倒かも。 C#とかからのほうが簡単。
- Tacosan
- ベストアンサー率23% (3656/15482)
「ど~しても C じゃないとダメ」というのでなければ (かつデータ量が膨大なものでなければ) 「テキスト処理に強い言語を使う」というのを選択肢に入れるべきだと思う. awk とか Perl とか. 今だと Ruby とかもあり?
補足
回答ありがとうございます。 「どうしても」というわけではありませんが、Tacosanさんの回答の中から選ぶとすれば、Rubyです。 よろしくお願いします。
補足
回答ありがとうございます。 環境はwindows xpで、Borland C++ 5.5というものを使おうと思っています。 よろしくお願いします。