- ベストアンサー
重複データの削除
お世話になります。 現在、仕事でお客様のデータ(5万件くらい)を扱っています。 しかしデータをエクセルに取り込むシステムに難があり、同じお客様のデータを重複して取り込んでしまうことがあります。 そこで質問ですが、約5万件あるデータの中から効率よく重複データを削除する方法はありますか? 懸念事項は、同姓同名の方は削除してはいけないという点です。 データ項目は「名前」「住所」「生年月日」「性別」とあるので、 同姓同名でも生年月日や住所で判定することができます。 ちなみに私の考えは、 A列に名前、B列に生年月日とすると・・・ 1)ソート:優先順位はA列⇒B列 2)C列にIF(A1=A2,"重複","OK")として行方向へコピー D列にIF(B1=B2,"重複","OK")として行方向へコピー E列にIF(AND(IF(C1="重複",D1="重複")=TRUE,"重複","OK")として行方向へコピー 3)E列で"重複"でフィルタリングし、フィルタされた行の削除 スマートではないですが、私の知識では精一杯です。 何かスマートな方法はないものでしょうか? よろしくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
> 懸念事項は、同姓同名の方は削除してはいけないという点です。 > データ項目は「名前」「住所」「生年月日」「性別」とあるので、 > 同姓同名でも生年月日や住所で判定することができます。 COUNTIF 関数を使えば、重複のチェックはできますね。 Excel COUNTIF関数 重複チェックも出来ます! IF関数も使うけど ^^; - パソってますか? - 楽天ブログ(Blog) http://plaza.rakuten.co.jp/pasodairy/diary/200411250000/ 住所とかでは、入力の仕方が一致していないと思いますので、作業用として、名前と生年月日を結合して、その列でチェックしてやればいいですね。
その他の回答 (1)
「フィルターオプションの設定」はご存知でしょうか。 「名前」「住所」「生年月日」「性別」を「太字」か下線を引いて、 A列、B列、C列、D列をアクティブにして、 「データ」-「フィルターオプションの設定」-「抽出先」で(重複するレコードは無視する」にチェックを入れる。 これで、重複した『行は折りたたまれます』。 ここで、「すべてを選択」して、新しいシートにコピーします。
お礼
有難うございます。 フィルタだけで重複チェックできるんですね。 知りませんでした。
お礼
回答、有難うございます。 確かに住所でマッチングは危険ですね。 参考になりました!