• ベストアンサー

英語でのテキストファイル

http://www.gutenberg.org/ にあるテキストファイルのことですが、 THE STORY OF ADAM AND EVE The first man's name was Adam and his wife he called Eve. They lived in a beautiful Garden away in the East Country which was called Eden, filled with beautiful trees and flowers of all kinds. But they did not live in Eden long for they did not obey God's command, but ate the fruit of a tree which had been forbidden them. They were driven forth by an angel and had to give up their beautiful home. とこんなふうに、hey lived in / called Eden, / they did not ・・・の後で改行が入っています。また、行頭なのにスペースも入れてません。一般にこのようにしてテキストファイルを発表する、または作るものなのでしょうか? また、強制改行することのメリットはあるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • puni2
  • ベストアンサー率57% (1002/1731)
回答No.2

わりと一般的なやりかただと思います。 まず,もし改行を入れてないと,読む側の環境によってはずっと右の方までスクロールしていかないと読めない可能性があります。 でも,そしたら変なところで改行されてかえって読みにくい場合もあるじゃないか,と思われるかも知れません。 そんなときのために,こういったフォーマットのテキストを読むためのソフトがあります。 一般に文書整形ソフトと呼ばれるもので,roff(ロフ)とかTeX(テフ)などが昔から有名です。 これらのソフトでは,「1個だけの改行は無視して表示」「改行2個連続は段落替えと見なす」というルールで文書を表示します。 行頭のスペースも,一種のレイアウトの問題です。 もし入れたければ,表示する際に「段落が変わったら,最初の行の頭は何ミリ(とか何文字分とか)空ける」という設定をすれば済む話です。 (Wordで段落の書式を設定するとき,そのような項目がありますね) もしこれを,実際に空白文字を段落の頭に入れてしまうと,表示設定を変えたいときにかえって不便になります。 場合によっては,最初の行を左側に突き出させるようなフォーマットにしたいことだってあるかも知れません。 そんなとき,2行目以降の冒頭に空白文字をいちいち入れるのでは無理がありますし,手間もバカにならないですよね。 要するに,「表示したり印刷したりする際に,好みで変えることができる部分は,その時に設定すればよい」ということにしておいて,テキストファイル自体にはなるべく余計な情報を含ませない,という発想で作っていると言えるでしょう。 なお,グーテンベルク・プロジェクトにおけるテキストのフォーマットについては,こちらのFAQのV.83以降にも解説がありますのでご覧ください。 http://www.gutenberg.org/faq/

参考URL:
http://www.gutenberg.org/faq/
genkigan
質問者

お礼

回答、ありがとうございました。かなり納得いきました。HTMLではあまり見栄えを記述しないで、見栄えはCSSで、という発想と同じですね。PGのFAQも少しずつ読んでみます。ただ、今ひとつ納得できないのは、たとえば、lived inで改行があって、その次の行にスペースもおかないで、the city などと来ていることです。だから、#3さんのように改行をとるだけでは読みにくく、正規表現の置き換えで改行を半角スペースにしなければいけないことです。

その他の回答 (2)

  • moguyan
  • ベストアンサー率56% (106/189)
回答No.3

 私もこれには困りました。GutenbergからフリーテキストをダウンロードしてCASIOの電子辞書にあるテキストビューアで読もうとしたら変なところで改行されていて読みにくくて困りました。  回答ではありませんが,このような改行を自動的に取ってくれるツールがありますので便利です。「取れたぬ君」という変わった名前のソフトですがよくできています。

参考URL:
http://www.vector.co.jp/soft/win95/util/se046041.html
genkigan
質問者

お礼

おもしろいソフトを紹介していただきありがとうございました。今までは秀丸エディターでやっていましたが、本来の改行コード(行末に自動的に挿入したものではなく、そこで改行したいから入れたもの……という意味)とそうではない改行の区別はできませんでした。一度、試してみます。

noname#15634
noname#15634
回答No.1

第一としてまずは見やすいように 長ったらしいとスクロールしないといけないので また、改行の部分も別におかしくはありません 日本語で言うところの読点の部分で区切ってると思ってよいと思います

genkigan
質問者

お礼

回答、ありがとうございました。 >長ったらしいとスクロールしないといけないので しかし、エディターで見ると、スクロールの必要はありません。 また、日本語で言うところの読点で区切ってあるとのことですが、そうは思えません。テキストを見てみると、決まった文字数で切って、ただし単語の途中では切らないようにしてあるのだと思います。 やはりこのように切ってあると二次的に利用するときに不便だと思うのですが。