MongoDB教程之聚合(count、distinct和group)
1.count:
--在空集合中,count返回的数量为0。
>db.test.count()
0
--测试插入一个文档后count的返回值。
>db.test.insert({"test":1})
>db.test.count()
1
>db.test.insert({"test":2})
>db.test.count()
2
--count和find一样,也接受条件。从结果可以看出,只有符合条件的文档参与了计算。
>db.test.count({"test":1})
1
2.distinct:
distinct用来找出给定键的所有不同的值。使用时也必须指定集合和键。
--为了便于后面的测试,先清空测试集合。
>db.test.remove()
>db.test.count()
0
--插入4条测试数据。请留意Age字段。
>db.test.insert({"name":"Ada","age":20})
>db.test.insert({"name":"Fred","age":35})
>db.test.insert({"name":"Andy","age":35})
>db.test.insert({"name":"Susan","age":60})
--distinct命令必须指定集合名称,如test,以及需要区分的字段,如:age。
--下面的命令将基于test集合中的age字段执行distinct命令。
>db.runCommand({"distinct":"test","key":"age"})
{
"values":[
20,
35,
60
],
"stats":{
"n":4,
"nscanned":4,
"nscannedObjects":4,
"timems":0,
"cursor":"BasicCursor"
},
"ok":1
}
3.group:
group做的聚合有些复杂。先选定分组所依据的键,此后MongoDB就会将集合依据选定键值的不同分成若干组。然后可以通过聚合每一组内的文档,产生一个结果文档。
--这里是准备的测试数据
>db.test.remove()
>db.test.insert({"day":"2012-08-20","time":"2012-08-2003:20:40","price":4.23})
>db.test.insert({"day":"2012-08-21","time":"2012-08-2111:28:00","price":4.27})
>db.test.insert({"day":"2012-08-20","time":"2012-08-2005:00:00","price":4.10})
>db.test.insert({"day":"2012-08-22","time":"2012-08-2205:26:00","price":4.30})
>db.test.insert({"day":"2012-08-21","time":"2012-08-2108:34:00","price":4.01})
--这里将用day作为group的分组键,然后取出time键值为最新时间戳的文档,同时也取出该文档的price键值。
>db.test.group({
..."key":{"day":true}, --如果是多个字段,可以为{"f1":true,"f2":true}
..."initial":{"time":"0"}, --initial表示$reduce函数参数prev的初始值。每个组都有一份该初始值。
..."$reduce":function(doc,prev){ --reduce函数接受两个参数,doc表示正在迭代的当前文档,prev表示累加器文档。
... if(doc.time>prev.time){
... prev.day=doc.day
... prev.price=doc.price;
... prev.time=doc.time;
... }
...}})
[
{
"day":"2012-08-20",
"time":"2012-08-2005:00:00",
"price":4.1
},
{
"day":"2012-08-21",
"time":"2012-08-2111:28:00",
"price":4.27
},
{
"day":"2012-08-22",
"time":"2012-08-2205:26:00",
"price":4.3
}
]
--下面的例子是统计每个分组内文档的数量。
>db.test.group({
...key:{day:true},
...initial:{count:0},
...reduce:function(obj,prev){prev.count++;},
...})
[
{
"day":"2012-08-20",
"count":2
},
{
"day":"2012-08-21",
"count":2
},
{
"day":"2012-08-22",
"count":1
}
]
--最后一个是通过完成器修改reduce结果的例子。
>db.test.group({
...key:{day:true},
...initial:{count:0},
...reduce:function(obj,prev){prev.count++;},
...finalize:function(out){out.scaledCount=out.count*10}--在结果文档中新增一个键。
...})
[
{
"day":"2012-08-20",
"count":2,
"scaledCount":20
},
{
"day":"2012-08-21",
"count":2,
"scaledCount":20
},
{
"day":"2012-08-22",
"count":1,
"scaledCount":10
}
]