SIRAP2005のプロフィール

@SIRAP2005 SIRAP2005
ありがとう数0
質問数1
回答数1
ベストアンサー数
1
ベストアンサー率
100%
お礼率
100%

  • 登録日2005/05/27
  • CSVファイル中の文字列項目の中に混じった

    CSVファイルからRDBへのロードで悩んでいます。 以下の様なCSVファイルがあり (よくあることかもしれませんが)データの中に " が混じっているため、正常にデータをロードできません。 文字列データ中の " を削除するか、代替文字に置換したいのですが、 なにかいい知恵は無いでしょうか? 例: $ cat DATA.csv 10,"0010","教育","キョウイク",2300 20,"0110","美容&健康","ヒ"ヨウ&ケンコウ",2300   ←ビ ではなく ヒ" 30,"1010","趣味","シュミ",2312 40,"0030","マネー","マネー",3300 ただし、 ・CSVを作成するプログラムの関係で、   CSVファイル中の ,区切り "括りルールは変更できない ・ファイルは可変長 ・誤った " は上記以外にも無数に予想されること   レコード件数が多いこと から、   sedなど自動化された方式が望ましい ・OS は Solaris8 ・RDB は Oracle9i ・シェアウェアなどのオンラインソフトの使用は不可 ・文字列データ中の " はすべて誤った文字と見なして良い  (もちろん括り文字 " は生かすこと) 正規表現を用いてsedでなんとかならんか?といろいろ試行錯誤してみたのですが、 イマイチうまくいきません。 どうかよろしくお願いします。

    • chaff
    • 回答数3