在 Python Pandas 中计算每个组的唯一值
要计算PythonPandas中每个组的唯一值,我们可以使用df.groupby('column_name')。count().
步骤
创建二维、大小可变、潜在异构的表格数据df。
打印输入数据帧df。
使用df.groupby('rank')['id']。count()查找每组唯一值的计数并将其存储在变量“count”中。
打印步骤3中的计数。
示例
import pandas as pd
df = pd.DataFrame(
{
"id": [1, 2, 1, 3, 5, 1, 4, 3, 6, 7],
'rank': [1, 4, 1, 2, 1, 4, 6, 1, 5, 3]
}
)
print"Input DataFrame 1 is:\n", df
count = df.groupby('rank')['id'].count()
print"Frequency of ranks:\n", count输出结果Input DataFrame 1 is: id rank 0 1 1 1 2 4 2 1 1 3 3 2 4 5 1 5 1 4 6 4 6 7 3 1 8 6 5 9 7 3 Frequency of ranks: rank 1 4 2 1 3 1 4 2 5 1 6 1 Name: id, dtype: int64