JAVA mongodb 聚合几种查询方式详解
一、BasicDBObject
整个聚合查询是统计用户的各种状态下的用户数量为场景:
1.筛选条件:
date为查询日期:
BasicDBObjectQuery=newBasicDBObject();
Query.put("time",newBasicDBObject("$gte",date+"00:00:00")
.append("$lte",date+"23:59:59"));
如果有多个条件:直接加Query.put("status",0);
如果有OR筛选:
BasicDBListvalues=newBasicDBList();
values.add(newBasicDBObject("status",newBasicDBObject("$exists",false)));
values.add(newBasicDBObject("status",0));
Query.put("$or",values);
其中newBasicDBObject("$exists",false))就是“status”不存在(mongodb文档可不等于实体的字段)
2.拼接match
DBObjectMatch=newBasicDBObject("$match",Query);
将上一步的Query放入macth筛选中
3.拼接分组条件
此步相当于SQL的GroupBy
BasicDBObjectGroupBy=newBasicDBObject();//分组条件
GroupBy.put("userId","$userId");//根据用户ID来分组
同第一步的筛选一样,如果有多个分组可直接添加在后面:GroupBy.put("status","$status");
4.分组后查询
首先把分组拼接上:
DBObjectSelect=newBasicDBObject("_id",GroupBy);
如果我们要对分组后的数据进行操作:(这里是用户的统计数量)
Select.put("count",newBasicDBObject("$sum",1));
5.拼接$group
DBObjectGroup=newBasicDBObject("$group",Select);
至此。我们拼接,mongodb的语句到此结束
下面我们开始查询操作:
importcom.mongodb.AggregationOutput;
importorg.springframework.data.mongodb.core.MongoTemplate;
AggregationOutputOutput=mongoTemplate.getCollection("这里是mongodb的数据表名")
.aggregate(Match,Group);
读取查询结果:
Iterablemap=Output.results(); //遍历map for(DBObjectdbObject:map){ //这里读取到的map为{"_id":{"userId":1,"status"0}}... Map resultMap=(Map )dbObject.get("_id"); //这里截取掉.0 IntegeruserId=Integer.parseInt(CommUtil.toString(ausgMap.get("userId")).replace(".0","")); //在这里我们就可以对我们的数据进行操作了; Integercount=Integer.parseInt(CommUtil.toString(dbObject.get("count"))); }
二、DBObject
不多说,如果大家觉得第一种方法特别长篇大论,那么下面我给大家带来一种代码更简洁的聚合查询:
直接上代码吧。
1.注意导入的包:
importcom.mongodb.DBObject;importcom.mongodb.util.JSON;
2.$macth:
(beginDay-查询开始日期;endDay-查询结束日期)
DBObjectmatch=(DBObject)JSON.parse("{$match:{'status':'1','time':
{$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");
3.$group:
(以userId分组,统计用户数量,累加amout字段值,取amout字段最大值)
DBObjectgroup=(DBObject)JSON.parse("{$group:{_id:'$userId',
count:{$sum:1},total:{$sum:'$amount'},maxSigle:{$max:'$amount'}}}");
条件拼接完,开始查询:
Listlist=newArrayList (); list.add(match);list.add(group); AggregationOutputOutput=mongoTemplate.getCollection("表名").aggregate(list);
遍历结果就不用在说了。上面已经详细描述了
第二种方法是不是比一种方式简单多了。但是比较考验自身对mongodb语句熟悉性。
【扩展】
接着上面的方法进行扩展
//status为0或者为1;type不为11;time在beginDay~endDay时间段内
DBObjectmatch=(DBObject)JSON.parse("{$match:{'status':{$in:['0','1']},
type:{$ne:11},'time':{$gte:'"+beginDay+"',$lte:'"+endDay+"'}}}");
//以用户Id分组,统计查询次数,取最后一次time的时间
DBObjectgroup=(DBObject)JSON.parse("{$group:{_id:'$userId',
count:{$sum:1},lastTime:{$max:'$time'}}}");
//在上一步统计出的结果中筛选次数大于100的数据
DBObjectgroupMatch=(DBObject)JSON.parse("{$match:{count:{$gte:100}}}");
//$project----查询结果中需要显示哪些字段,显示则设置为1。如下需要不显示_id域(字段),则需如下指定:
//db.集合名.aggregate([{$project:{_id:0,count:1,lastSuccTime:1}}])
DBObjectproject=(DBObject)JSON.parse("{$project:{_id:1,count:1,lastSuccTime:1}}");
DBObjectsort=(DBObject)JSON.parse("{$sort:{'count':-1}}");//排序
Listlist=newArrayList();
list.add(match);
list.add(group);
list.add(groupMatch);
list.add(project);
list.add(sort);
AggregationOutputcatchOutPut=mongoTemplate.getCollection("表名")
.aggregate(list);//查询结果
三、BasicDBObject+脚本语句
BasicDBObjectgroupIndex=newBasicDBObject();
BasicDBObjectdistinctQuery=newBasicDBObject();
distinctQuery.put("userId",newBasicDBObject("$in",userIds));//UserIds数组
BasicDBObjectinitIndex=newBasicDBObject();
initIndex.put("count",0);//给count赋初值
//脚本(doc代表数据库的数据.prev代表查询结果//prev.count这里的count就是上一步initIndex的count)
Stringreduce="function(doc,prev){if(doc.status==0){prev.count+=1;};}";
List
最后循环遍历List即可得到结果【PS:group这种聚合方式有个限制条件--->超过20000数据就会报错】
以上就是我在普通业务处理中用到mongodb聚合处理。如果有更好的方法或是有需要改进的地方,欢迎大家给我留言~