締切済み

複雑なテキストファイルのソート方法

2017/09/28 10:26

ＵＮＩＸ上で以下の様なテキストファイルがあります。 1 subckt　keyword１ 2 ： 3 ends　keyword1 4 subckt　keyword2 5 ： 6 ends　keyword2 7 subckt　keyword3 8 ： 9 ends　keyword3 10 Ｍ０（net1　net2　net3　net4）　keyword4 11 Ｍ1（net5　net6　net7　net8）　keyword5 subckt～endsはひとつのブロックです。（よって、1～3、4～6、7～9はひとつのブロックとしてあつかいます。）ブロックとしての記述と１０、１１行目のように１行で記述されたものが混在しているファイルです。この様なフォーマットのファイルをサンプルのテキストファイルで記述されているkeywordでソートしたいのですがいい方法はないでしょうか？ブロックとして記述されている部分をばらけさせると意味がないのでブロックで記述されている部分はブロック毎ソートしないと意味がありません。スクリプトのようなものを組むしかないようにも思うのですが、いい方法が思いつきません。どなたか御指南お願いします。

Kasaoka-Taroh
お礼率34% (79/229)

Linux系OS
回答数3
ありがとう数0

みんなの回答 （3）
専門家の回答

みんなの回答

Wap58
ベストアンサー率33% (29/87)

2017/09/29 13:44 回答No.3

perlです、keywordの目印が何かわからないけど番号で配列に書き込めばいいんでないの連番じゃないと警告でます、#use warningsにして keywaord0にはつかえないし全角数字もダメ use strict; use warnings; my $count; my @an; $an[0] =''; my $i; open KK,'fukuzatu.txt'; while(<KK>){ $count = 3 if $_ =~ m[^\d+subckt.+keyword(.+)]; $i = $1 if $1; if($count){ $an[$i] .= $_; $count--; next; } $an[$1] = $_ if $_ =~m[keyword(.+)]; } close KK; print"@an";

trapezium
ベストアンサー率62% (276/442)

2017/09/28 12:57 回答No.2

こうですかね。#1 さんのほぼそのまま実装してみました。GNU sed 前提です。 sed -E '/^[0-9]+subckt\>/{:1;N;/\n[0-9]+ends\>/!b1}; h;s/^.*[ \t　]+//;G;y/\n/\v/;' textfile | sort | sed 's/^[^\v]*\v//; y/\v/\n/;'

M_Sato
ベストアンサー率54% (550/1003)

2017/09/28 11:09 回答No.1

わたしはUNIXは使ったことがないのですが、 sed（ストリーム・エディタ）とsortコマンドを組み合わせれば可能なのではないでしょうか。１行の中の項目の区切りがどのようになっているか（タブ区切り？）わからないので、あいまいな説明になりますが（１）行の連結（sedで） subckt～endsまでをつなげてひとつの行にする。その際、行の区切りにデータ中には出現しないコード（たとえばエスケープコード\eとする）を入れて目印にし、行末のkeywordを行頭にコピーする（２）１行だけのデータは行末のkeywordを行頭にコピーする（３）sortコマンドでソートを実行（４）行頭のキーワードを削除し、エスケープコード\eを改行コード\nに置換する（sedで）