ベストアンサー

ファイルの比較

2002/06/27 17:23

ファイルの比較ツールを作りたいのですが変更行の認識の仕方がわかりません。どなたか知っている方がいらっしゃいましたら教えて下さい。

Ruyama
お礼率33% (2/6)

Visual Basic
回答数4
ありがとう数2

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

imogasi
ベストアンサー率27% (4737/17070)

2002/06/28 11:07 回答No.4

#3の者です。補足を頂きお手数をお掛けしました。プログラムソースであれば、（１）コボル等のようにソース・シーケンス番号が振ってあれば、それをキーとして比較できます。既にソート済みのはずです。挿入は下の桁の１０（１００）ずつスキップした番号の間を使って振っているはずです。（２）新たに振りなおしてしまっていると難しい。（３）シーケンス番号が振ってないときは、下記はどうですか。まず変更前と変更後の両者の各行にシーケンス番号を独立に振る。変更前の一行のソースを１語と見たてて、変更後のソースをメモリーに大量に読みこみをして、文章中から指定語を検索する要領で、探す。スペースに付いてはメモリー上では取り除く等の工夫が良いかもしれない。見つかれば対比をディスクに書き出し見つかったサイン（ｆ）をセットする。またそのソースを変更前も変更後もメモリーから消し詰めて、最後に変更前に残ったソースが抹消（ｄ）された分、変更後に残った分が追加（ａ）された分でサイン（ｄ，ａ）をセットし，ディスクに書き出す。（ｆ＝Found,ｄ＝Delete,ａ＝Addのつもり）それぞれアウトプットファイルをシーケンス番号でソートし、サイン（ｆ，ｄ，ａ）とともに印刷する。左右対比表に作るなら見やすいでしょう。検索アルゴリズムとして色々定石があります。使ったことないですがボイヤー・ムーア法なんていうのもあるようです。調べてみてください。以上荒削りのロジックですが、出来そうな気がしてきました。頑張ってください。

質問者

お礼 2002/07/02 11:36

色々とありがとうございました。

その他の回答 (3)

imogasi
ベストアンサー率27% (4737/17070)

2002/06/27 18:58 回答No.3

昔の時代（画像が記録しづらかった一昔前）の文字・数字・記号をデータとしている時代は、（特に文系ビジネスデータには）そのデータレコードには、キー（データの主体、何についてデータを採ったか）がありました。そしてフィールドが位置固定されていることが多かった。その場合は２つのファイル（File1が先に出来たファイル）をキーでソートして比較し、File1=File2の時内容を比較。全く同じ時以外は変更があり。File1＜File2の時削除あり。File1>File2の時は追加されたと判別しました。時刻ぐらいしか手がかりのない画像データ・ビット列ならビット列のパターンマッチングのロジックが確立しないとトータルに比べて変わったと言うことだけ判っても、それ以上どこで変わったとか、変更か削除か割り出せないのではと思います。問題にしているファイルはどう言う内容ですか。

質問者

補足 2002/06/28 08:52

すいません、説明不足でした。比較対象ファイルは、プログラムソースファイルです。ちなみに、最初にコメントと空白行を取り除きます。

sha-girl
ベストアンサー率52% (430/816)

2002/06/27 18:03 回答No.2

まず最初にそのファイルに改行が何個あるのかをカウントするのがいいと思います。次に比較ですが、より厳密に比較するためにはBinaryで読み込んではどうでしょうか？その行が削除されたのか変更されたのかの判定ですが相当難しいロジックになると思います。人間からみても、全3行のファイルが2行削除されて 1行追加された場合どう判定していいのか苦しむと思います。それは1行削除されて、1行変更が加わったともみることが可能だからです。

質問者