- 締切済み
WebページHTMLをテキストファイルとして取得する方法
今、WebページのHTMLで 例えば、ADDと言う文字があれば、削除するような 処理をしようと考えているのですが、 C/C++なら文字検索を行い、削除することはできるのですが、 WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 (1) C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか? (2) HTMLソースをテキストファイルにして文字検索後削除という処理を考えていますが、もっと簡単な方法はありますか? よろしくお願い致します。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- PROMETHEUS
- ベストアンサー率58% (31/53)
> C/C++なら文字検索を行い、削除することはできるのですが C/C++でなら出来て、今は出来ていないということは C/C++ではない?? 状況がよくわかりませんが、とりあえず、 > WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 ブラウザから取得ということは一端ローカルに手動で保存してから、処理をするということですね。 A.1 > C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか これはネットから直接取得するということでしょうか? それともローカルに保存した htmlを取得する、ということでしょうか。 どちらにしても環境がわからないとちょっと・・・。 前者で且つ Windows環境なら http://nienie.com/~masapico/api_InternetOpen.html が参考になるかと。 A.2 > もっと簡単な方法はありますか? 直接ネット上の htmlにアクセスして、メモリに入れてから検索・削除して、ファイル出力という流れでいいのではないでしょうか。
補足
申し訳ございません。処理の流れは、直接ネット上の htmlにアクセスして、メモリに入れてから検索・削除して、ファイル出力という流れです。 どのようにして実現するかわかりません。