※ ChatGPTを利用し、要約された質問です(原文:テキストデータから文字列を取り出したい)
記事のテキストデータから文字列を抽出する方法
このQ&Aのポイント
昔使っていたブログのデータをまとめたテキストファイルから、必要な文字列を取り出す方法をご紹介します。
Javascriptを使って、記事ごとに必要な文字列のみを取り出し、CSV形式に整形することができます。
改行部分はHTMLのタグである<br>に置き換えることで、テキストファイルの改行を反映させることもできます。
昔使っていたブログのデータをまとめたテキストファイル(決まった体裁にはなっています)があります。
そこから記事ごとに必要な文字列のみを取り出し、CSVにしたいです。
例えばtextareaなどにテキストを全て貼り付け、Javascriptを使い、必要な文字列のみを出力させたいのですが、どういうコードにすればいいか教えて下さい。
(改行部分のみ<br>に置き換え希望)
<現在の文字列 ここから>
--------
AUTHOR: hogehoge
TITLE: 記事A
STATUS: Publish
ALLOW COMMENTS: 0
CONVERT BREAKS: __default__
ALLOW PINGS: 0
PRIMARY CATEGORY: news
CATEGORY: news
DATE: 02/08/2014 06:17:55 AM
-----
BODY:
記事一個目。
ほげほげ
-----
EXTENDED BODY:
-----
EXCERPT:
-----
KEYWORDS:
-----
--------
AUTHOR: hogehoge
TITLE: 記事B
STATUS: Publish
ALLOW COMMENTS: 0
CONVERT BREAKS: __default__
ALLOW PINGS: 0
PRIMARY CATEGORY: nikki
CATEGORY: nikki
DATE: 02/09/2014 07:45:04 PM
-----
BODY:
記事2個目。
<img src="hoge.jpg">
ほげほげ
-----
EXTENDED BODY:
-----
EXCERPT:
-----
KEYWORDS:
-----
--------
AUTHOR: hogehoge
TITLE: 記事C
STATUS: Publish
ALLOW COMMENTS: 0
CONVERT BREAKS: __default__
ALLOW PINGS: 0
PRIMARY CATEGORY: news
CATEGORY: news
DATE: 02/09/2014 07:51:34 PM
-----
BODY:
記事3個目。ほげほげ
-----
EXTENDED BODY:
-----
EXCERPT:
-----
KEYWORDS:
-----
<文字列ここまで>
<上記から抽出し、出力したい内容(カンマ区切りのcsvにするため) ここから>
記事A,news,02/08/2014 06:17:55 AM,記事一個目。<br>ほげほげ
記事B,nikki,02/09/2014 07:45:04 PM,記事2個目。<br><img src="hoge.jpg"><br>ほげほげ
記事C,news,02/09/2014 07:51:34 PM,記事3個目。ほげほげ
<内容ここまで>
よろしくお願いいたします。
お礼
遅くなり、申し訳ございませんでした。ありがとうございました!