pandas的相关系数与协方差实例
1、输出百分比变化以及前后指定的行数
a=np.arange(1,13).reshape(6,2) data=DataFrame(a) #计算列的百分比变化,如果想计算行设置axis=1 print(data.pct_change()) ''' 01 0NaNNaN 12.0000001.000000 20.6666670.500000 30.4000000.333333 40.2857140.250000 50.2222220.200000 ''' #输出前五行,默认是5,可以通过设置n参数来设置输出的行数 print(data.head()) ''' 01 012 134 256 378 4910 ''' #输出最后五行 print(data.tail()) ''' 01 134 256 378 4910 51112 '''
2、计算DataFrame列与列的相关系数和协方差
a=np.arange(1,10).reshape(3,3) data=DataFrame(a,index=["a","b","c"],columns=["one","two","three"]) print(data) ''' onetwothree a123 b456 c789 ''' #计算第一列和第二列的相关系数 print(data.one.corr(data.two)) #1.0 #返回一个相关系数矩阵 print(data.corr()) ''' onetwothree one1.01.01.0 two1.01.01.0 three1.01.01.0 ''' #计算第一列和第二列的协方差 print(data.one.cov(data.two)) #9.0 #返回一个协方差矩阵 print(data.cov()) ''' onetwothree one9.09.09.0 two9.09.09.0 three9.09.09.0 '''
3、计算DataFrame与列或者Series的相关系数
a=np.arange(1,10).reshape(3,3) data=DataFrame(a,index=["a","b","c"],columns=["one","two","three"]) print(data) ''' onetwothree a123 b456 c789 ''' #计算data与第三列的相关系数 print(data.corrwith(data.three)) ''' one1.0 two1.0 three1.0 ''' #计算data与Series的相关系数 #在定义Series的时候,索引一定要去DataFrame的索引一样 s=Series([5,3,1],index=["a","b","c"]) print(data.corrwith(s)) ''' one-1.0 two-1.0 three-1.0 '''
注意:在使用DataFrame或Series在计算相关系数或者协方差的时候,都会计算索引重叠的、非NA的、按照索引对齐原则,对于无法对齐的索引会使用NA值进行填充。在使用DataFrame与指定的行或列或Series计算协方差和相关系数的时候,默认都是与DataFrame的列进行计算,如果想要计算行,设置axis参数为1即可。
以上这篇pandas的相关系数与协方差实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。