微客导航 » 文章资讯 » 解决pandas使用read_csv()读取文件遇到的问题

解决pandas使用read_csv()读取文件遇到的问题

2023-09-11 12:34:05 427

如下：

数据文件：

上海机场(sh600009) 24.11 3.58 东风汽车(sh600006) 74.25 1.74 中国国贸(sh600007) 26.38 2.66 包钢股份(sh600010) 61.01 2.35 武钢股份(sh600005) 75.85 1.3 浦发银行(sh600000) 6.65 0.96

在使用read_csv()API读取CSV文件时求取某一列数据比较大小时，

df=pd.read_csv(output_file,encoding='gb2312',names=['a','b','c'])
df.b>20

报错

TypeError:'>'notsupportedbetweeninstancesof'str'and'int'

从返回的错误信息可知应该是数据类型错误，读回来的是‘str'

in:df.dtypes
out:
aobject
bobject
cobject
dtype:object

由此可知df.b类型是object

查阅read_csv()文档配置：

dtype:Typenameordictofcolumn->type,defaultNone
Datatypefordataorcolumns.E.g.{'a':np.float64,'b':np.int32}(unsupportedwithengine='python').Usestrorobjecttopreserveandnotinterpretdtype.

Newinversion0.20.0:supportforthePythonparser.

可知默认使用‘str'或‘object'保存

因此在读取时只需要修改'dtype'配置就可以

df=pd.read_csv(output_file,encoding='gb2312',names=['a','b','c']，dtype={'b':np.folat64})

以上这篇解决pandas使用read_csv()读取文件遇到的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

返回顶部
3162201930
czq8825@qq.com

解决pandas使用read_csv()读取文件遇到的问题

热门推荐

随机推荐