pandas取出重复数据的方法
drop_duplicates为我们提供了数据去重的方法,那怎么得到哪些数据有重复呢?
实现步骤:
1、采用drop_duplicates对数据去两次重,一次将重复数据全部去除(keep=False)记为data1,另一次将重复数据保留一个(keep='first)记为data2;
2、求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=False)
以上这篇pandas取出重复数据的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。