• ベストアンサー

VB.net で Webbrowserコントロールで表示しているテキスト全体を取得したい

VB.net で Webbrowserコントロールで特定のURLを読み込んでいます。 表示されているのはHTMLタグも含まずXMLでもなく ただの文字列です。 この文字列全体を取得するにはどうすればよろしいでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • redfox63
  • ベストアンサー率71% (1325/1856)
回答No.1

WebBrowserのDocuemntStreamからデータを引き出して 適切なエンコーディングをかけてやればVBが理解できる文字列になりますよ dim strm as System.IO.StreamReader dim enc as System.Text.Encoding dim sb as System.Text.StringBuilder enc = System.Text.Encoding.GetEncoding("shift-jis) strm = new System.IO.StreamReader( WebBrowser1.DocumentStream, enc) do until strm.EndOfStream   sb.AppendLIne( strm.ReadLine ) Loop strm.Close TextBox1.Text = sb.ToString() といった具合です enc = System.Text.Encoding.GetEncoding("shift-jis) などは適宜修正してください 単純なテキストですと <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"> <HTML><HEAD> <META http-equiv=Content-Type content="text/html; charset=shift_jis"></HEAD> <BODY><PRE>ここに表示されている ファイルの内容があるはずです </PRE></BODY></HTML> といった具合で取得できるので PREタグで囲まれた範囲を抽出すればいいでしょう

tomoporo
質問者

お礼

今回は上記方法では解決できませんでしたが いろいろと参考になりましたありがとうございました

関連するQ&A