• ベストアンサー

このようなテキストの抽出は・・・。

次のようなテキストを抽出するにばどうすればいいのでしょうか。 次の条件の文字列変数theVarにおいて、*の部分を抽出したいです。 <i>*</i> <i>と</i>はないかもしれません。 「*」はワイルドカート、「<」と「>」はメタキャラではなくただの文字。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#20964
noname#20964
回答No.2

単純にiタグが有ったらそれを取り除きたいってことでしょうか。 それならこれではどうでしょうか。 <html> <head> <meta HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=SHIFT_JIS"> <title>\\\\</title> </head> <script type="text/javascript"> <!-- function dd(){ theVar = document.body.innerHTML; a=theVar.replace(/<i>|<\/i>/gi,""); alert(a); } //--> </script> <body onload="dd()"> <i>aaaaaa</i> </body> </html>

KanjiTalk
質問者

お礼

なるほど、取り除きたい文字列が決まっていればわざわざ正規表現を使わなくてもいいんですね。ありがとうございます。

その他の回答 (1)

  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.1

いまいちうまく状況が把握できませんが、 こういうことですか? <i>あああ</i> <i>いいい</i> <i>ううう</i> <input type=button onClick="searchItalic()" value="イタリックを探す"> <script language=javascript> function searchItalic(){ var tags=document.getElementsByTagName("i"); for(var i=0;i<tags.length;i++){ alert(tags[i].innerHTML); } } </script>

KanjiTalk
質問者

お礼

いろいろと参考になりました。ありがとうございます。

KanjiTalk
質問者

補足

あるタグ(イタリックタグを含むかも知れないし含まないかも知れない)内のHTMLを取得したときに、イタリックを含むなら「<i>」や「</i>」の記号を省いた部分を抽出したいので、「<i>」や「</i>」はタグの文字としてではなく、ただのテキストとして見て頂きたいのですが。

関連するQ&A