pandas统计重复值次数的方法实现
本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:
frompandasimportDataFrame
df=DataFrame({'key1':['a','a','b','b','a','a'],
'key2':['one','two','one','two','one','one'],
'data1':[1,2,3,2,1,1],
#'data2':np.random.randn(5)
})
#打印数据框
print(df)
#data1key1key2
#01aone
#12atwo
#23bone
#32btwo
#41aone
#51aone
#重复项
print(df[df.duplicated()])
#data1key1key2
#41aone
#51aone
#统计重复值
dup=df[df.duplicated()].count()
print(dup)#最后两项重复
#data12
#key12
#key22
#去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#data1key1key2
#01aone
#12atwo
#23bone
#32btwo
pandas中dataframe重复元素个数的获取
方法有二:
1.在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True
count=0 foriinusers_info['user_id'].duplicated(): ifi==True: count=count+1 count
【注1】users_info为一个dataframe框,user_id为其中一列
【注2】duplicated()方法只会把重复的元素标记为True,而不会标记被重复的元素
2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素
users_info.shape[0]-users_info.drop_duplicates(['user_id']).shape[0]
【注】shape[0]为获取行数
到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
热门推荐
10 小红书平安祝福语简短
11 生日祝福语大全女孩简短
12 收生日红包祝福语 简短
13 领证幽默祝福语简短
14 法考面试祝福语简短
15 老哥出门祝福语简短语
16 送灯祝福语简短独特
17 幼儿狗年祝福语大全简短
18 好听的元旦简短祝福语