- 締切済み
テキストをHTMLに変換するソフトを探しています
小説をHTMLに変換するのに、以下の動作が可能なソフトを探しています。当方の環境はwin7/XPです。 あああああああああ 「せりふせりふせりふ」 あああああああ××× あああああああああ 上記のテキストを (複数行のhtml) あああああああああ<br> 「せりふせりふせりふ」<br> あああああああ<span class="abc">○○○</span><br> あああああああああ<br> (複数行のhtml) と変換できるものです。 具体的には、 1.「と(以外で始まる行頭に全角空白を挿入 2.文末の改行を改行+<br>に置換 3.文章の前後に複数行のHTMLを挿入 4.特定の文字列を複数行のhtmlに置換 現在は1→手作業、2→nami2000の整形機能、3→手作業でコピペ、4→置換ソフトで変換しています。これらの変換が一度にできるようなソフトがあれば教えてください。 「勝手にHTML変換」と「小説整形 HTML Putter」の二つは試しましたが当方の希望とは違うようです。 今使っているエディタはnami2000とMeryです。 基本的に(できれば)フリーソフトでおねがいします。 よろしくお願いいたします。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- humu01jp
- ベストアンサー率28% (4/14)
エスケープ記号が?に変わった? ?nは?n
- humu01jp
- ベストアンサー率28% (4/14)
面倒、か。 何でも人任せなんですね。 因にフリーのエディタでは貴方がやりたいことは出来ないです。 やはりperlを使うべきです。こんなの簡単です。ファイルを読み込んで置換するだけなんですからね。下記にサンプルを掲載しますが、1と2以外は自分でなんとかして下さい。努力が大事です。 #!/usr/local/bin/perl print "Content-type:text/html?n?n"; open(IN,"<ファイル名"); @in = <IN>; foreach (@in) { unless($_ =~ /^「|^(/){$space = " ";} $_ =~ s"?n"<br>?n"; print "$space$_"; } close(IN);
- qaqa013
- ベストアンサー率27% (17/62)
テキストエディタの置換機能を使って改行(\r\n)を改行+<br />にすればいい。
お礼
質問を読みましたか? だから今エディタの置換でやってんだってば! 上記の4つの過程を「一発で」やりたいって言ってるんですよ?
- humu01jp
- ベストアンサー率28% (4/14)
perlでプログラム組め
お礼
めんどうだからイヤ
- ORUKA1951
- ベストアンサー率45% (5062/11036)
そもそも、それじゃHTMLになりません。きちんと、HTMLのタグはともかく、HTMLは理解しておきましょう。 「私は小説ではありませんが、紙用に書かれた大量の原稿をHTMLに変換しますが、それは当然HTMLの仕様に即したものになります。」 だとすると、下記操作は誤りとなります。 1.「と(以外で始まる行頭に全角空白を挿入 行頭に全角スペースは入れてはなりません。ブラウザは視覚ブラウザだけではありません。 段落の視覚的レンダリング ( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/struct/text.html#h-9.3.5 ) 2.文末の改行を改行+<br>に置換 <BR>は一つの文内での強制改行で「段落の区切りではあ」りません。 段落は<p></p>で括るべきです。 段落: P要素 ( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/struct/text.html#edef-P ) 行区切りの強制: BR要素 ( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/struct/text.html#edef-BR ) ・・・BRを使うとすれば、住所など一つの段落でありながら、改行したいなど極めて特殊な場合だけです。通常のHTMLでは基本的に存在しえない要素です。 3.文章の前後に複数行のHTMLを挿入 これは意味不明です。HTMLとは( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html401j/intro/intro.html#h-2.2 ) 4.特定の文字列を複数行のhtmlに置換 3.4.は、特段の要素集合を追加したいということかな??? ☆私が行っている作業 \n(改行)があれば</p>\n<p>に置換する。 ☆章区切りがあれば、それなりに変換する。 ☆「」・・会話文に対しては、それが段落として独立しているなら<quote>、文内にあれば<q>でマークアップすればよいかと思います。 ^「(.*)」 ―(置換)→ <blockquote>\n\t\1\n<blockquote> ([^\^])「(.*)」 ―(置換)→ \1<q>\2</q> スタイルシートで、日本語の記事に合うようにデザインする。 p{ text-indent:1em; /* 行頭で一文字字下げ */ margin:0.2em 1em;・・段落の隙間を少なくする。 } とか・・・ 私が、使用しているのは、EmEditor Pro ( http://jp.emeditor.com/ )ですが、この程度の作業ならEmEditor - EmEditor Free ( http://jp.emeditor.com/modules/download2/rewrite/tc_5.html )でも十分可能でしょう。 具体的な方法は、興味があれば、また後刻にでも・・・
お礼
>「私は小説ではありませんが、紙用に書かれた大量の原稿をHTMLに変換しますが、それは当然HTMLの仕様に即したものになります。」 日本語でOK。私は当然小説じゃなくて人間です。 1.2.のつっこみに関して 普段小説大賞とかに応募するときは全角空白を文頭に入れるのでそう書きました。 W3C信者じゃないですし、小説をサイトで発表するのにHTMLに凝る(マークアップに時間かける)のは本末転倒だと思うのででその辺はスルーしてます。 下記のサイトの主張がとても私の考えに近いので張っておきますね http://adankadan.blog47.fc2.com/blog-entry-332.html http://htmldwarf.seesaa.net/article/9363948.html 3.に関しては、例えばテキストの前に <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html lang="ja"> <head> <meta http-equiv="Content-Type" CONTENT="text/html; charset=SHIFT_JIS"> <meta http-equiv="Content-Style-Type" content="text/css"> <link rel="stylesheet" media="all" type="text/css" href="style.css"> <title>タイトル</title> </head><body> <div id="wrapper"> を挿入するというのを「複数行のHTML」と言いたかったんですが 正しくは複数行のタグですね。すみません。 4.はお遊び的にRPGのような選択式の小説を書くことがあるのでそのときに使うものです 上記の機能を<「全部一発で」>できるソフトがあればいいなあと思って質問したのですが… やっぱりこつこつ置換するしかないですか…… レスしてくださってどうもありがとうございました。
お礼
別に人任せにはしてないですよ。むしろこんなに見当外れな回答ばかりでどう人任せにすればいいのか教えて欲しい。。。 「めんどう」と書いたのは「自分でプログラムを組むというある種力任せ的な手段ではなくてあくまで既存のソフトはありませんか」という意味です。 フリーと言ったのは秀○のマクロでは実行可能なのがわかっていたからです。 Repl-Aceという変換ソフトが自分の要求にあっていたのでそちらを使っています。 レスありがとうございました。