微客导航 » 文章资讯 » 如何根据R数据框中的另一列对包含最大值的行进行子集化？

如何根据R数据框中的另一列对包含最大值的行进行子集化？

2023-06-20 18:07:05 455

要根据R数据框中的另一列对包含最大值的行进行子集化，我们可以按照以下步骤操作-

首先，创建一个包含一个数字列和一个分类列的数据框。

然后，使用带有max函数的tapply函数来查找基于另一列的数值列中包含最大值的行。

示例1

创建数据框

让我们创建一个数据框，如下所示-

x<-rnorm(20)
factor1<-sample(LETTERS[1:4],20,replace=TRUE)
df1<-data.frame(x,factor1)
df1

执行时，上述脚本生成以下内容output(thisoutputwillvaryonyoursystemduetorandomization)-

输出结果

      x    factor1
1 -1.21231516 A
2 -0.01576519 B
3 0.59032593 D
4 -0.41583339 C
5 -0.38508102 A
6 -0.61177209 C
7 -0.52961795 C
8 0.30561837 A
9 -0.58067776 A
10 0.62246173 C
11 -0.58479709 C
12 0.09817433 B
13 1.11240042 C
14 0.29007306 B
15 -0.66345792 B
16 -1.80789902 A
17 0.33419804 C
18 -0.15665767 A
19 1.56775923 C
20 1.49345799 B

根据另一列查找包含最大值的行

例子

使用tapply函数根据df1中的factor1列查找x列中的最大行数-

x<-rnorm(20)
factor1<-sample(LETTERS[1:4],20,replace=TRUE)
df1<-data.frame(x,factor1)
tapply(df1$x,df1$factor1,max)

输出

      A          B       C       D
0.3056184 1.4934580 1.5677592 0.5903259

示例2

创建数据框

让我们创建一个数据框，如下所示-

y<-sample(1:50,20)
factor2<-sample(c("Low","Medium","High"),20,replace=TRUE)
df2<-data.frame(y,factor2)
df2

执行时，上述脚本生成以下内容output(thisoutputwillvaryonyoursystemduetorandomization)-

输出

y factor2
1 45 Low
2 2 Medium
3 5 High
4 33 Low
5 28 High
6 37 Medium
7 7 High
8 21 High
9 48 Low
10 18 High
11 15 High
12 38 High
13 20 Medium
14 4 Low
15 22 Medium
16 34 Low
17 32 Low
18 29 Low
19 24 High
20 17 Medium

根据另一列查找包含最大值的行

例子

使用tapply函数根据df2中的factor2列查找y列中的最大行数-

tapply(df2$y,df2$factor2,max)

输出

High Low Medium
38 48 37

返回顶部
3162201930
czq8825@qq.com

如何根据R数据框中的另一列对包含最大值的行进行子集化？

示例1

根据另一列查找包含最大值的行

例子

输出

示例2

输出

根据另一列查找包含最大值的行

例子

输出

热门推荐

随机推荐