• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:複数タグ指定してHTMLを取得したい)

VBAで複数のタグを指定してHTMLを取得する方法

このQ&Aのポイント
  • VBAのMSHTML.HTMLDocumentを使用してWEB上から指定した複数のタグ内のテキストを取得する方法について調査しています。
  • getElementsByTagNameメソッドでは一つのタグしか指定できず、個別に取得すると関連がバラバラになってしまうため、複数タグを指定する方法を模索しています。
  • ループ処理を使用して、h1のタグを見つけてその内部のテキストとtdタグのテキストを取得し、再びh1タグを見つけるまで繰り返す方法を考えています。自作する以外に解決策はありませんか?

質問者が選んだベストアンサー

  • ベストアンサー
  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.2

>getElementsByTagName(tag)だと、一つしかタグを指定きず getElementsByTagName('*')とか?

ipyodora
質問者

お礼

回答ありがとうございます。 昨日、getElementsByTagName('*')が出来ると言う情報を見て、試してみましたが、あまりに重かったので断念しました。2つや3つぐらい指定できると良いなぁと思っていたら、Selectors APIと言うもので、document.querySelectorAll('span, strong');とすれば取れる事が分かりました。 ただ、仕様が分からずです・・・。 VBAでのサンプルがあれば助かると思いつつ調べ中です。

その他の回答 (1)

  • SAYKA
  • ベストアンサー率34% (944/2776)
回答No.1

そうだねぇ 親tagを getElementsByTagName で持ってきて解析 が最も速いだろうね。 ただ、最初の1回をxpath指定をして取り出す方法があるからそれを使うのも有りかな。 速度的には親を持ってきて解析が速いと思うけど・・・ xpathのはなんてメソドだかはちょっと忘れちゃった。調べる時間が無いので参考ってことで。

ipyodora
質問者

補足

回答ありがとうございます。私の説明不足でした、すいません。 (その他htmlが続く) <h1>エイチ1</h1> <p>ピー1</p> <p>ピー2</p> (その他htmlが続く) <h1>エイチ2</h1> <p>ピー3</p> <p>ピー4</p> <p>ピー5</p> (その他htmlが続く) エイチ1~ピー1までと、エイチ2~ピー5までを取得したいと思っています。 親tagとなるdivなどを発見する度に・・・と言う処理なら objDiv = doc.getElementsByTagName("div") objDiv.getElementsByTagName("p").item(i).innerText と言う感じで取れました。

関連するQ&A