我想找到Mongo文档中嵌套字段的所有唯一值的频率计数器。你知道吗
更具体地说,如果我的收藏说db['sample'],由以下文件组成-
{'a' : 1, 'b' : {'c' : 25, 'd' : "x", 'e' : 36}},
{'a' : 2, 'b' : {'c' : 5, 'd' : "xx", 'e' : 36}},
{'a' : 33, 'b' : {'c' : 25, 'd' : "xx", 'e' : 36}},
{'a' : 17, 'b' : {'c' : 25, 'd' : "xxx", 'e' : 36}},
如何获取字段“d”的所有唯一值的频率计数器?i、 我的输出应该是{d':{“xx”:2,“x”:1,“xxx”:1}}
这有可能吗?谢谢你的帮助。非常感谢。你知道吗
我查阅了聚合和objectToArray转换的文档以将映射转换为数组,并在Pymango中尝试了以下操作
(一)
db['sample'].aggregate([ { "$addFields" : { "b" : {"$objectToArray" : "$b"}}},\
{"$unwind" : "$b"},\
{"$group" : { "_id" : "$b.k",\
"count" : {"$sum" : "$b.v"}}} ])
这将给出每个字段的累计计数,例如“c”:25+5+25+25。你知道吗
(二)
db['sample'].aggregate([ { "$addFields" : { "b" : {"$objectToArray" : "$b"}}},\
{"$unwind" : "$b"}, \
{"$group" : { "_id" : "$b.k", \
"count" : {"$sum" : 1 }}} ])
这将给出字段出现在文档中的总次数-“c”:4,“d”:4等
你基本上走错了路。您有一个到
"b.d"
的清晰路径,作为要在其上聚合的键,无需将其转换为数组:退货
但这实际上有些过分,因为实际上所有的工作都是在最初的^{} 语句中完成的。您真正需要做的就是运行它并获取结果,然后将它们合并到一个字典中作为所需的输出:
结果完全一样:
此外,它这样做没有添加其他聚合阶段和操作符所需的体操,并且您没有更改真正从服务器返回的内容,因为最初的^{} 响应基本上是:
因此,这里真正的教训是,虽然您可以在聚合管道中执行花哨的操作,但您真正应该考虑的是,如果替代方法是更干净、可读性更高的代码,您可能不应该这样做。你知道吗
作为参考,尽管所发生的只是额外的^{} 使用^{} 来创建一个带有} 从上一阶段创建的数组中获取^{} 的输出,并基本上将其转换为对象/字典。你知道吗
k
和v
键的数组,正如在下一个管道阶段所期望的那样。下一阶段使用^{相比之下,
reduce
做着完全相同的事情。基本上,我们将光标结果放入list
中,这样python函数就可以对该列表进行操作。然后只需遍历列表中的doucments,这些doucments总是以_id
作为键,另一个命名属性作为“counted”输出(这里我们使用count
),然后简单地将它们转换为键和值对,作为最终的字典输出。你知道吗只是为了好玩,基于你最初的尝试的东西可能是:
它将返回:
同样,如果不使用额外的管道阶段进行转换,同样的结果来自于对python使用
map
和reduce
:相关问题 更多 >
编程相关推荐