重複データの削除
お世話になります。
現在、仕事でお客様のデータ(5万件くらい)を扱っています。
しかしデータをエクセルに取り込むシステムに難があり、同じお客様のデータを重複して取り込んでしまうことがあります。
そこで質問ですが、約5万件あるデータの中から効率よく重複データを削除する方法はありますか?
懸念事項は、同姓同名の方は削除してはいけないという点です。
データ項目は「名前」「住所」「生年月日」「性別」とあるので、
同姓同名でも生年月日や住所で判定することができます。
ちなみに私の考えは、
A列に名前、B列に生年月日とすると・・・
1)ソート:優先順位はA列⇒B列
2)C列にIF(A1=A2,"重複","OK")として行方向へコピー
D列にIF(B1=B2,"重複","OK")として行方向へコピー
E列にIF(AND(IF(C1="重複",D1="重複")=TRUE,"重複","OK")として行方向へコピー
3)E列で"重複"でフィルタリングし、フィルタされた行の削除
スマートではないですが、私の知識では精一杯です。
何かスマートな方法はないものでしょうか?
よろしくお願いいたします。
お礼
皆様 有り難うございました。 回答の内容はお三方様共納得行く回答を頂けて感謝 しています。 ----------------------- 私の見た儘を・・ 左上の「最新の質問」を開いてそのページの最後の三行が次ページの頭三行に表示され.3.4.5ページと開いても同じ状態が 続き念の為に前のページへ戻って見ても矢張り同じでした。 暫く時間を置いてから開くと、左に振られている番号が変わり 重複して居たタイトルは消えていました。 (8.9.10のタイトルが次ページの11.12.13にも)に表示し、時間が経過すると1ページ目に有ったタイトルが消えて2ページにのみみに成る。 --------------------- その他 http://www.okweb.ne.jp/kotaeru.php3?qid=353231 ↑ http://www.okweb.ne.jp/kotaeru.php3?qid=353070 ↑ の回答No#の順序がおかしいのですが、もしかしたら 時間経過と共に正常に入れ替わるのかも知れませんが。 別にあら探しをして居る訳では有りませんので不思議 だなと感じて質問をさせて頂いた次第です。 今後ともご指導の程よろしく お願い致します。