- ベストアンサー
Python-Pandas でcsvを読み込んだ時
csv の中に"0"から始まりすべてが数字の文字コードがあります。 これを「文字列」として読み込む方法を、どなたかご存じありませんか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
CSVファイル内のデータを文字列として読み込みたいなら、read_csv()の際に必要な列にdtype=strを指定すればいいでしょう。具体的な方法は「Pandas CSV dtype」などでネット検索してみてください。 なお、「文字コード」という用語を勘違いしていらっしゃると思われます。普通、"014987081108753"を「"0"から始まりすべてが数字の文字コード」とは言いません。
その他の回答 (1)
- _kappe_
- ベストアンサー率68% (1581/2304)
回答No.1
どんなデータを処理したいのか、具体的な例を示してもらえませんか。 たとえば 0,26085,26412,35486 という行があったら「日本語」という文字列に変換する感じでしょうか。 使用する文字コードの種類は何ですか(UTF-8,UTF-16,Shift_JISなど)。
質問者
補足
例えば、"014987081108753" というコードをDFに読み込むと、Int64のデータになってしまい、文字列としての扱いができないのです。これを文字列として読み込む方法はないのか、ということなのですが。文字コードについては、当然UTF-8になっています。
お礼
ありがとうございます。やっと見つけました。 「文字列として扱う数値の列」であるコードのことは、なんと表現すればよいのか悩みます? 確かにこの世界での「文字コード」は、ord("a")ですよね。 DOSの時代にModula-2 で書いていた以来の言語習得中です。苦労してます。