- ベストアンサー
HTMLタグのみ削除したいのです。
HTMLタグのみ削除したいのです。 **/**/**(DATE=日付)と日本語のみ残して 置換実施したいのですが すばやい方法がわかりません 膨大な量のため地道に削除するのは困難なので サクリと出来たら好ましいです。 TooolSoftは Word/notepad/他にもエディタ類も所持してますので どうかご教授下さい。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
#2です。 例示いただきたかったのは、日付を含まない部分が何か?だったのですが・・・。 「名前を付けて保存」したテキストファイルを、コマンドプロンプトでFINDを使用して "/"(スラッシュ)を含む行のみ抽出し、リダイレクトで別テキストにするのが簡単でしょうね。 検索対象(この場合、「名前を付けて保存」したテキストファイル)は、複数指定可能なので、 リダイレクトで作成する別テキスト一本にすべて表示できます。
その他の回答 (2)
- bin-chan
- ベストアンサー率33% (1403/4213)
#1さんの方法でダメ、ということは IEの「名前を付けて保存」で「テキストのみ」で保存もダメですか? 表示されている文書・条件をわかりやすく例示してみてください。 --画面イメージここから------------------------------------------------- 「ヘッダー」 発生日付 内容 yy/mm/dd 事故発生 yy/mm/dd 速報発出 yy/mm/dd 詳報報告 「原因」 ここには原因が記述されている 「対策」 ここには対策が記述されている --画面イメージここまで------------------------------------------------- のうちの発生日付、内容の部分 yy/mm/dd 事故発生 yy/mm/dd 速報発出 yy/mm/dd 詳報報告 のみを取り出したい、みたいな。
状況が良く分からないので、確実な答えはできないのですが。Winですよね? すべてのhtmlタグを消してテキストを残したい場合、ブラウザで表示した後、ctrl+A(編集の「すべて選択」)、ctrl+c(編集の「コピー」)してからメモ帳などのテキストエディタに貼り付けると、(絶対ではありませんが)純粋なテキストのみが取り出せると思います。 ある特定のタグのパターンのみを消したい場合は、(メモ帳は貧弱ですが)テキストエディタには普通、置換機能があるので、htmlファイルをテキストエディタで開いて一括置換とかできないでしょうか? htmlエディタの類をお持ちの場合は、もっときめ細かな方法があると思いますけど。
補足
プラットフォームOSはWindows 7 しかしHTML構文はOSの依存性はまったく関係/関係性ないので 上記手法は試行済みです。 肝心なhtmlエディタなのでもっときめ細かな方法なのです。 日本語とDate(日付)のみ抽出したいのです。 Sort(ソート)では並べ替えだけなので困ります。 折角の回答ですが当てはまりません。
補足
間違いなくその通り法吉なのですが 手法が…行き着かなくて 参ってます、 yy/mm/dd 事故発生 yy/mm/dd 速報発出 yy/mm/dd 詳報報告 なぜに必要か? 報告書提出するのです。