详解partition by和group by对比
今天大概弄懂了partitionby和groupby的区别联系。
1.groupby是分组函数,partitionby是分析函数(然后像sum()等是聚合函数);
2.在执行顺序上,
以下是常用sql关键字的优先级
from>where>groupby>having>orderby
而partitionby应用在以上关键字之后,实际上就是在执行完select之后,在所得结果集之上进行partition。
3.partitionby相比较于groupby,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel中的操作),而groupby则只保留参与分组的字段和聚合函数的结果(类似excel中的pivot)。
partitionby
groupby
4.如果在partition结果上聚合,千万注意聚合函数是逐条累计运行结果的!而在groupby后的结果集上使用聚合函数,会作用在分组下的所有记录上。
数据如下,
SQL1
selecta.cc,a.item,sum(a.num) fromtable_tempa groupbya.cc,a.item
Result1
11条记录经groupby后为10条,其中cc='cn'anditem='8.1.1'对应的两条记录的num汇总成值3.
SQL2
selecta.cc,a.num,min(a.num)over(partitionbya.ccorderbya.numasc)asamount fromtable_tempa groupbya.cc,a.num; selecta.cc,a.num,min(a.num)over(partitionbya.ccorderbya.numdesc)asamount fromtable_tempa groupbya.cc,a.num;
Result2
两个sql的唯一区别在于a.num的排序上,但从结果红框中的数据对比可以看到amount值并不相同,且第二个结果集amount并不都是最小值1。
在这里就是要注意将聚合函数用在partition后的结果集上时,聚合函数是逐条累积计算值的!
其实partitionby常同row_number()over一起使用,
selecta.*,row_number()over(partitionbya.cc,a.itemorderbya.numdesc)asseq fromtable_tempa
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。