※ ChatGPTを利用し、要約された質問です(原文:ExcelでRegExp)
ExcelでRegExp:HTMLから特定の文字列を抽出する方法
このQ&Aのポイント
エクセルで、HTMLを読み出して、RegExpである文字列を抽出する方法について教えてください。
特定のキーワードを含む文字列を抽出するための正規表現パターンを教えてください。
HTMLの一部のみを抽出し、特定の条件が満たされた箇所から特定の文字列を抽出したいです。どのような方法がありますか?
エクセルで、HTMLを読み出して、RegExpである文字列を抽出する方法に途方にくれています。"座右の銘"をキーワードにして、"頑固一徹"を抽出したいのですが、私の知識では、太刀打ちできそうにありません。
どなたか詳しい方がいらっしゃいましたらパターンを教えて頂けないでしょうか?
(HTMLの一部のみ抽出で、必ず、</B></FONT><br>が間に挟まれるという条件)
<b>座右の銘</B></FONT><br>頑固一徹<br>
抽出文字の長さは不定で、空白(全角、半角)を含みます。但し、制御コードは含まれません。
"(座右の銘</B></FONT><)+"でキーワードにヒットすることは出来たのですが、"(座右の銘</B></FONT><b)+"と一文字範囲を広げるとマッチしません。なぜでしょうか?
宜しくお願い致します。
お礼
こんばんわ!! いつもお世話になっております。 正規表現の本を3冊ぐらい買って勉強中です。仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。 今回、やろうとしているのは、特定のULRなので、汎用的でなくともかまわないので・・・!! basp21については、追々勉強していきたいと思います。 ありがとうございました。 今後ともよろしくお願いいたします。