• ベストアンサー

カナ氏名、漢字氏名が含まれる大量テスト用CSVないですか?

大量(数十万件)の顧客マスタを作ろうとしています。 カナ氏名、漢字氏名が個人情報を含まない(歴史上の人物とか)で構成されたデータベース(できればCSV形式がうれしい)がどこかにないか探しています。 コツコツデータベースを作っていくのが大変なので;; 世の中のどこかにはそういうのがありそうな気がするので 質問です。どなたか知りませんでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

自社の社員名簿を使うのが手っ取り早いでしょうか。 実名 → 仮名への変更は、姓と名を1レコードずつずらして結合することで実現しました。 (姓と名の間がスペースで区切られていることを利用) 必要に応じて、住所、e-mailアドレス等も加工して架空の内容に変更します。 件数が足りなければ、必要な回数だけループしてレコードを増やします。(同姓同名の人がN人いることにする) 元のレコードが数100件程度あれば、レコードのカーディナリティはじゅうぶんに実用的だと思います。

その他の回答 (2)

noname#13214
noname#13214
回答No.2

CSVではありませんが、「文字を打込まずに検索するためのサイト」に機械的に考えられる男性名称、女性名称を列挙してあります。これを元に機械的にテストデータを作成することができそうです。ただし、実名とはヒットするので、外部にデータ出力するようなテストケースの場合には、テスト方法を問題のないようにご考慮ください。また、当HPの利用規定がみつからず、利用目的違反にあたるのかが判明していません。そのあたりもご考慮ください。 芸能人名は生年月日もあるので個人情報として抵触するかもしれないので、使用しないほうが賢明と思われます。

参考URL:
http://www.rock.sannet.ne.jp/mmmm/index.html
回答No.1

テストならば架空の氏名で十分では? 例えば「テスト1 太郎1」として、数値の部分のみを変更するとか。 VBAなどで簡単に作れますが。 (まさか手入力でやろうとは思ってないですよね?)

SEAMOON
質問者

お礼

ありがとうございます。 それでも良いと言えばいいのですが (今まではそうやってました) どうもいまいち・・なので。