- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ExcelでRegExp)
ExcelでRegExp:HTMLから特定の文字列を抽出する方法
このQ&Aのポイント
- エクセルで、HTMLを読み出して、RegExpである文字列を抽出する方法について教えてください。
- 特定のキーワードを含む文字列を抽出するための正規表現パターンを教えてください。
- HTMLの一部のみを抽出し、特定の条件が満たされた箇所から特定の文字列を抽出したいです。どのような方法がありますか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
こんばんは。 それと、「+」の意味は分かりますか?意味が分からないで使っているような気がします。 「<b>座右の銘</B></FONT><br>頑固一徹<br>」の場合には、 "(座右の銘</B>).+<br>([^<]+)" こういうパターンにはなるものの、こんなに簡単なものは出てきませんね。 実際は、自分で考えるしかありませんね。 たとえば、その間に漢字がない場合は、 "(座右の銘</B>)[^一-龝]+([一-龝]+)" などと工夫が必要です。 抽出は、$2 もしくは、SubMatches(1) です。 RegExp では、表現力が弱いので、InStr やInstrRev などを使わないといけないかもしれません。代用に、Basp21 のタイプライブラリを利用すると良いかもしれません。 http://www.hi-ho.ne.jp/babaq/basp21.html
その他の回答 (1)
- Wendy02
- ベストアンサー率57% (3570/6232)
回答No.2
こんばんは。 >仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。 私も、切り出しはInStrで抽出しています。 ここらへんが、Perl との差かなって思います。RegExp は、前置きが長すぎて、Pattern の文字列を、For Each ~ In で、文字列配列をループさせるのですが、それでも、大げさになってしまうような気がします。
質問者
お礼
本当にありがとうございます。
お礼
こんばんわ!! いつもお世話になっております。 正規表現の本を3冊ぐらい買って勉強中です。仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。 今回、やろうとしているのは、特定のULRなので、汎用的でなくともかまわないので・・・!! basp21については、追々勉強していきたいと思います。 ありがとうございました。 今後ともよろしくお願いいたします。