※ ChatGPTを利用し、要約された質問です(原文:C# htmlファイルを、preタグを残して加工)
C#でHTMLファイルをpreタグを残して加工する方法
このQ&Aのポイント
C#でhtmlファイルのタグを解析するプログラムを作成している際、preタグがある場合にその場所を回避し、解析や置換を行いたい場合、正規表現を使用する方法があります。
普通に改行を取り除くとpreタグの中も一列になってしまうため、preタグの中以外のみ改行を取り除くようにします。
上記のようなファイルがあった場合、正規表現を使用してpreタグ以外の改行を取り除き、preタグの中の改行を維持することができます。
お世話になります。
C#で、htmlファイルのタグを解析するプログラムを
組んでいるのですが、preタグがあった場合のに、その場所を
回避して、解析やら置換やらをしたいと思っています。
例でいうと
----------------
<div>
<h1>こんにちは。</h1>
<p>
今日も暑いですね。
</p>
<p>本日のサンプルプログラムです。</p>
<code>
<pre>
public void aaa()
{
// 文字列を表示する
Console.Writeline("Hello World!");
}
</pre>
</code>
</div>
----------------
上記のようなファイルがあった場合、普通に
改行を取り除くと、preの中も一列に繋がってしまいますが、
これをpreタグの中以外のみ改行を取り除きたい。
----------------
<div><h1>こんにちは。</h1><p>今日も暑いですね。</p><p>本日のサンプルプログラムです。</p><code>
<pre>
public void aaa()
{
// 文字列を表示する
Console.Writeline("Hello World!");
}
</pre>
</code></div>
----------------
こうなってもらいたいのです。
正規表現などを使用するのだと思いますが、よくわかりませんでした。
この部分のサンプルなどをお教えいただけないでしょうか。
よろしくお願いいたします。
お礼
度々すみませんでした。 いただいた内容では、どこも変わっていないようですが…。 ただ、処理自体は合っていたようです。誤解をし、 申し訳ありませんでした。 いただいた回答をもとに、再度勉強させていただきます。 ありがとうございました。