解决pandas使用read_csv()读取文件遇到的问题
如下:
上海机场(sh600009)
在使用read_csv()API读取CSV文件时求取某一列数据比较大小时,
df=pd.read_csv(output_file,encoding='gb2312',names=['a','b','c']) df.b>20
报错
TypeError:'>'notsupportedbetweeninstancesof'str'and'int'
从返回的错误信息可知应该是数据类型错误,读回来的是‘str'
in:df.dtypes out: aobject bobject cobject dtype:object
由此可知df.b类型是object
查阅read_csv()文档配置:
dtype:Typenameordictofcolumn->type,defaultNone Datatypefordataorcolumns.E.g.{'a':np.float64,'b':np.int32}(unsupportedwithengine='python').Usestrorobjecttopreserveandnotinterpretdtype. Newinversion0.20.0:supportforthePythonparser.
可知默认使用‘str'或‘object'保存
因此在读取时只需要修改'dtype'配置就可以
df=pd.read_csv(output_file,encoding='gb2312',names=['a','b','c'],dtype={'b':np.folat64})
以上这篇解决pandas使用read_csv()读取文件遇到的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。