• ベストアンサー

Python-Pandas でcsvを読み込んだ時

csv の中に"0"から始まりすべてが数字の文字コードがあります。 これを「文字列」として読み込む方法を、どなたかご存じありませんか?

質問者が選んだベストアンサー

  • ベストアンサー
  • _kappe_
  • ベストアンサー率68% (1581/2304)
回答No.2

CSVファイル内のデータを文字列として読み込みたいなら、read_csv()の際に必要な列にdtype=strを指定すればいいでしょう。具体的な方法は「Pandas CSV dtype」などでネット検索してみてください。 なお、「文字コード」という用語を勘違いしていらっしゃると思われます。普通、"014987081108753"を「"0"から始まりすべてが数字の文字コード」とは言いません。

kaznhi
質問者

お礼

ありがとうございます。やっと見つけました。 「文字列として扱う数値の列」であるコードのことは、なんと表現すればよいのか悩みます? 確かにこの世界での「文字コード」は、ord("a")ですよね。 DOSの時代にModula-2 で書いていた以来の言語習得中です。苦労してます。

その他の回答 (1)

  • _kappe_
  • ベストアンサー率68% (1581/2304)
回答No.1

どんなデータを処理したいのか、具体的な例を示してもらえませんか。 たとえば 0,26085,26412,35486 という行があったら「日本語」という文字列に変換する感じでしょうか。 使用する文字コードの種類は何ですか(UTF-8,UTF-16,Shift_JISなど)。

kaznhi
質問者

補足

例えば、"014987081108753" というコードをDFに読み込むと、Int64のデータになってしまい、文字列としての扱いができないのです。これを文字列として読み込む方法はないのか、ということなのですが。文字コードについては、当然UTF-8になっています。