ExcelでRegExp：HTMLから特定の文字列を抽出する方法

2007/04/14 17:21

このQ&Aのポイント

エクセルで、HTMLを読み出して、RegExpである文字列を抽出する方法について教えてください。
特定のキーワードを含む文字列を抽出するための正規表現パターンを教えてください。
HTMLの一部のみを抽出し、特定の条件が満たされた箇所から特定の文字列を抽出したいです。どのような方法がありますか？

vba_minarai
お礼率28% (68/237)

オフィス系ソフト
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

Wendy02
ベストアンサー率57% (3570/6232)

2007/04/14 22:04 回答No.1

こんばんは。それと、「+」の意味は分かりますか？意味が分からないで使っているような気がします。「座右の銘 頑固一徹 」の場合には、 "(座右の銘).+ ([^<]+)" こういうパターンにはなるものの、こんなに簡単なものは出てきませんね。実際は、自分で考えるしかありませんね。たとえば、その間に漢字がない場合は、 "(座右の銘)[^一-龝]+([一-龝]+)" などと工夫が必要です。抽出は、$2 もしくは、SubMatches(1) です。 RegExp では、表現力が弱いので、InStr やInstrRev などを使わないといけないかもしれません。代用に、Basp21 のタイプライブラリを利用すると良いかもしれません。 http://www.hi-ho.ne.jp/babaq/basp21.html

質問者

お礼 2007/04/14 23:23

こんばんわ！！いつもお世話になっております。正規表現の本を３冊ぐらい買って勉強中です。仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。今回、やろうとしているのは、特定のULRなので、汎用的でなくともかまわないので・・・！！ basp21については、追々勉強していきたいと思います。ありがとうございました。今後ともよろしくお願いいたします。

ログインすると、全ての回答が全文表示されます。

その他の回答 (1)

Wendy02
ベストアンサー率57% (3570/6232)

2007/04/15 00:11 回答No.2

こんばんは。 >仰る通り無理をして正規表現に固執するのはやめて、InStrでの抽出とします。私も、切り出しはInStrで抽出しています。ここらへんが、Perl との差かなって思います。RegExp は、前置きが長すぎて、Pattern の文字列を、For Each ～ In で、文字列配列をループさせるのですが、それでも、大げさになってしまうような気がします。

質問者