Python Pandas – 从多列中查找唯一值
要从多个列中查找唯一值,请使用unique()方法。假设您的PandasDataFrame中有带有“EmpName”和“Zone”的员工记录。名称和区域可以重复,因为两个员工可以有相似的名字,而一个区域可以有多个员工。在这种情况下,如果您想要唯一的员工姓名,请使用unique()forDataFrame。
首先,导入所需的库。在这里,我们将pd设置为别名-
import pandas as pd
首先,创建一个DataFrame。在这里,我们有两列-
dataFrame = pd.DataFrame(
{
"EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North']
}
)从DataFrame列“EmpName”和“Zone”中获取唯一的员工姓名和区域-
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}示例
以下是完整的代码-
import pandas as pd
#CreateDataFrame
dataFrame = pd.DataFrame(
{
"EmpName": ['John', 'Ted', 'Jacob', 'Scarlett', 'Ami', 'Ted', 'Scarlett'],"Zone": ['North', 'South', 'South', 'East', 'West', 'East', 'North']
}
)
print("DataFrame ...\n",dataFrame)
#Fetchuniquevaluesfrommultiplecolumns
print(f"\nFetching unique Values from the two columns and concatenate them:\n \
{pd.concat([dataFrame['EmpName'],dataFrame['Zone']]).unique()}")输出结果这将产生以下输出-
DataFrame ...
EmpName Zone
0 John North
1 Ted South
2 Jacob South
3 Scarlett East
4 Ami West
5 Ted East
6 Scarlett North
Fetching unique Values from the two columns and concatenate them:
['John' 'Ted' 'Jacob' 'Scarlett' 'Ami' 'North' 'South' 'East' 'West']