如果重复行在 R 数据框中大于 n,如何找到它们的计数?
要查找R数据框中大于n的重复行数,我们可以按照以下步骤操作-
首先,创建一个数据框。
然后,使用dplyr包的group_by_all、count和filter函数计算大于某个数量的重复行。
创建数据框
让我们创建一个数据框,如下所示-
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) df
执行时,上述脚本生成以下内容output(thisoutputwillvaryonyoursystemduetorandomization)-
x y 1 1 3 2 0 2 3 0 2 4 0 2 5 2 1 6 1 0 7 0 0 8 1 2 9 1 2 10 2 1 11 0 3 12 1 1 13 1 1 14 0 0 15 0 0 16 0 1 17 0 0 18 0 1 19 0 1 20 2 0 21 1 2 22 3 1 23 1 0 24 1 0 25 1 3 26 1 0 27 1 1 28 2 1 29 1 2 30 0 4
如果重复行大于某个数字,则计算它们
加载dplyr包并使用group_by_all、count和filter函数来查找大于2的重复行数-
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) library(dplyr) df%>%group_by_all()%>%count()%>%filter(n>2)
输出
# A tibble: 7 x 3 # Groups: x, y [7] x y n1 0 0 4 2 0 1 3 3 0 2 3 4 1 0 4 5 1 1 3 6 1 2 4 7 2 1 3