• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ExcelでRegExp)

ExcelでRegExp:HTMLから特定の文字列を抽出する方法

このQ&Aのポイント
  • エクセルで、HTMLを読み出して、RegExpである文字列を抽出する方法について教えてください。
  • 特定のキーワードを含む文字列を抽出するための正規表現パターンを教えてください。
  • HTMLの一部のみを抽出し、特定の条件が満たされた箇所から特定の文字列を抽出したいです。どのような方法がありますか?

質問者が選んだベストアンサー

  • ベストアンサー
  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.1

こんばんは。 それと、「+」の意味は分かりますか?意味が分からないで使っているような気がします。 「<b>座右の銘</B></FONT><br>頑固一徹<br>」の場合には、 "(座右の銘</B>).+<br>([^<]+)" こういうパターンにはなるものの、こんなに簡単なものは出てきませんね。 実際は、自分で考えるしかありませんね。 たとえば、その間に漢字がない場合は、 "(座右の銘</B>)[^一-龝]+([一-龝]+)" などと工夫が必要です。 抽出は、$2 もしくは、SubMatches(1) です。 RegExp では、表現力が弱いので、InStr やInstrRev などを使わないといけないかもしれません。代用に、Basp21 のタイプライブラリを利用すると良いかもしれません。 http://www.hi-ho.ne.jp/babaq/basp21.html

vba_minarai
質問者

お礼

こんばんわ!! いつもお世話になっております。 正規表現の本を3冊ぐらい買って勉強中です。仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。 今回、やろうとしているのは、特定のULRなので、汎用的でなくともかまわないので・・・!! basp21については、追々勉強していきたいと思います。 ありがとうございました。 今後ともよろしくお願いいたします。

その他の回答 (1)

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.2

こんばんは。 >仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。 私も、切り出しはInStrで抽出しています。 ここらへんが、Perl との差かなって思います。RegExp は、前置きが長すぎて、Pattern の文字列を、For Each ~ In で、文字列配列をループさせるのですが、それでも、大げさになってしまうような気がします。

vba_minarai
質問者

お礼

本当にありがとうございます。

関連するQ&A