• ベストアンサー

秀丸の正規表現を使って<FONT color="#ff0000">~~~</FONT>を消したい

こんにちは。質問させていただきます。 タイトルの通りなのですが、何千行にも渡る文章中のほとんどに 下記の様なタグがふってあるとします。 <FONT color="#ff0000">の部分は当然様々な色を使ってますし<FONT face="Osaka,MS ゴシック">や <FONT color="#ff0000" FONT face="Osaka,MS ゴシック">もあります。 <FONT color="#ff0000">~様々な文章1~</FONT><BR> <FONT color="#ff0022">~様々な文章2~</FONT><BR> <FONT color="#ff0033">~様々な文章3~</FONT><BR>     ↓ ~様々な文章1~<BR> ~様々な文章2~<BR> ~様々な文章3~<BR> それを上記のように文章のみを残して開始タグと閉じタグだけを削除したいのですが、 効率のよい方法ってありますでしょうか? 全てを消すのではなく部分的に消したいため困っております。 例えば、最初にフォントの開始タグだけを消してしまうと、 </FONT>タグは他の必要なタグと混ざってしまい消せなくなってしまいます。 正規表現がまだ全然未熟なもので…。どうかご指導お願いします┏○

質問者が選んだベストアンサー

  • ベストアンサー
  • masa6272
  • ベストアンサー率66% (93/140)
回答No.4

FONTが入れ子になってなければ、 <FONT .*?>(.*?)</FONT> を \1 で置き換えます。

その他の回答 (4)

  • masa6272
  • ベストアンサー率66% (93/140)
回答No.5

ちょっと、捕捉・・・ 秀丸の正規表現は複数行の場合うまくいかないことが多いので、様々な文章が、複数行だと動きません。 もし、複数行になっているなら、\nをありえない文字列(正規表現で意味を持たないほうが楽 ###### とか)に一度置換して、さっきの変換を行って、もう一度ありえない文字列を\nに戻してください。

hirobow_ok
質問者

お礼

上記の方法で上手く動きました。 親切にありがとうございました。

回答No.3

Q4217556でポイント連続ゲットの目論見が崩れたので 色々駄弁ってみる ======================================= メモ: #「font要素の子のfont要素」、ってな環境にもきちんと対応できてますか? #最長一致して内側が処理されないとか #http://oshiete1.goo.ne.jp/qa2697683.html みたいに先の終了タグで閉じたと思われたりとかしませんかね? #テキストエディタや正規表現でなくてよく,Firefoxのパーサーに依存してよく, 元と書式上異なるもの(HTMLでは要素名および属性名で大文字と小文字を区別しないため,使うと小文字が大文字になる)等が我慢できるなら, DOM InspectorとXSLTプロセッサを使って一気にやるんだけどなあ・・・

  • furaijin
  • ベストアンサー率54% (12/22)
回答No.2

http://www.shuiren.org/chuden/teach/hidemaru/seiki/index-j.html#moji ここと http://www.shuiren.org/chuden/teach/hidemaru/seiki/02.htm ここが参考になると思います。 <FONT color="#ff0000">~様々な文章1~</FONT><BR> <FONT color="#ff0022">~様々な文章2~</FONT><BR> <FONT color="#ff0033">~様々な文章3~</FONT><BR>     ↓ ~様々な文章1~<BR> ~様々な文章2~<BR> ~様々な文章3~<BR> みたいな事をしたいのなら 検索キーワード:<FONT color="#ff00..">\f.+\f</FONT> 置換キーワード:\1 のような感じでいけるんじゃないですか? 秀丸持ってないんで確信はもてませんが。

hirobow_ok
質問者

お礼

上記の表現ではいけませんでしたが、 何か得られたような気がします! ありがとうございました。

回答No.1

なにか 他のソフトから おとしているのでしょうか? これは web形式でしょうか? 秀丸に読み込む前に 形式を選べないですか? もしくは 秀丸に読み込む前に 他のソフトでテキスト形式に変えてから よんでみては??

hirobow_ok
質問者

補足

文書は初めから用意されたものでテキスト形式です。 文書のみのテキストにタグを入れたものです。 タグは全て手打ちで入力したものです。

関連するQ&A