Python pandas DataFrame操作的实现代码
1.从字典创建Dataframe
>>>importpandasaspd
>>>dict1={'col1':[1,2,5,7],'col2':['a','b','c','d']}
>>>df=pd.DataFrame(dict1)
>>>df
col1col2
01a
12b
25c
37d
2.从列表创建Dataframe(先把列表转化为字典,再把字典转化为DataFrame)
>>>lista=[1,2,5,7]
>>>listb=['a','b','c','d']
>>>df=pd.DataFrame({'col1':lista,'col2':listb})
>>>df
col1col2
01a
12b
25c
37d
3.从列表创建DataFrame,指定data和columns
>>>a=['001','zhangsan','M'] >>>b=['002','lisi','F'] >>>c=['003','wangwu','M'] >>>df=pandas.DataFrame(data=[a,b,c],columns=['id','name','sex']) >>>df idnamesex 0001zhangsanM 1002lisiF 2003wangwuM
4.修改列名,从['id','name','sex']修改为['Id','Name','Sex']
>>>df.columns=['Id','Name','Sex'] >>>df IdNameSex 0001zhangsanM 1002lisiF 2003wangwuM
5.调整DataFrame列顺序、调整列编号从1开始
https://www.nhooo.com/article/163644.htm
6.DataFrame随机生成10行4列int型数据
>>>importpandas
>>>importnumpy
>>>df=pandas.DataFrame(numpy.random.randint(0,100,size=(10,4)),columns=list('ABCD'))#0,100指定随机数为0到100之间(包括0,不包括100),size=(10,4)指定数据为10行4列,column指定列名
>>>df
ABCD
067283766
121274337
273549885
34078493
499606316
548462461
659526228
720743664
814134660
918447036
7.用时间序列做index名
>>>df#原本index为自动生成的0~9
ABCD
031254567
162126188
279362097
326575044
42412501
54619962
640475227
78366714
858592562
93881608
>>>importpandas
>>>dates=pandas.date_range('20180121',periods=10)
>>>dates#从20180121开始,共10天
DatetimeIndex(['2018-01-21','2018-01-22','2018-01-23','2018-01-24',
'2018-01-25','2018-01-26','2018-01-27','2018-01-28',
'2018-01-29','2018-01-30'],
dtype='datetime64[ns]',freq='D')
>>>df.index=dates#将dates赋值给index
>>>df
ABCD
2018-01-2131254567
2018-01-2262126188
2018-01-2379362097
2018-01-2426575044
2018-01-252412501
2018-01-264619962
2018-01-2740475227
2018-01-288366714
2018-01-2958592562
2018-01-303881608
8.dataframe实现类SQL操作
pandas官方文档ComparisonwithSQL
https://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。