重複データの削除
お世話になります。
現在、仕事でお客様のデータ(5万件くらい)を扱っています。
しかしデータをエクセルに取り込むシステムに難があり、同じお客様のデータを重複して取り込んでしまうことがあります。
そこで質問ですが、約5万件あるデータの中から効率よく重複データを削除する方法はありますか?
懸念事項は、同姓同名の方は削除してはいけないという点です。
データ項目は「名前」「住所」「生年月日」「性別」とあるので、
同姓同名でも生年月日や住所で判定することができます。
ちなみに私の考えは、
A列に名前、B列に生年月日とすると・・・
1)ソート:優先順位はA列⇒B列
2)C列にIF(A1=A2,"重複","OK")として行方向へコピー
D列にIF(B1=B2,"重複","OK")として行方向へコピー
E列にIF(AND(IF(C1="重複",D1="重複")=TRUE,"重複","OK")として行方向へコピー
3)E列で"重複"でフィルタリングし、フィルタされた行の削除
スマートではないですが、私の知識では精一杯です。
何かスマートな方法はないものでしょうか?
よろしくお願いいたします。
お礼
ありがとうございました!