MongoDB+K表示集群

2条回答

网友

1楼 · 编辑于 2024-09-24 06:33:46

有效的方法是使用聚合框架，使用服务器端操作创建“_id”和“tag data”列表。这也减少了通过网络发送的数据量，以及用于在客户端解码文档的时间和内存。在

您需要^{}文档并使用^{}累加器运算符返回_id列表和{}列表。当然，^{}方法提供了对聚合管道的访问。在

cursor = collection.aggregate([{
    '$group': {
        '_id': None, 
        'ids': {'$push': '$_id'}, 
        'tags': {'$push': '$tag-data'}
    }
}])

然后使用^{}上的^{}方法检索数据，因为我们按None分组，因此光标只保存一个元素。在

^{pr2}$

之后，只需调用函数并^{}结果。在

clusters = cluster_text(data['tags'])
doc_clusters = zip(data['ids'], clusters)

网友

2楼 · 编辑于 2024-09-24 06:33:46

您需要为文档提供一些标识符。在查询中包含_id字段可能是个好主意，这样您就有了一个唯一的文档标识符。然后可以创建ids和{}的并行列表。在

docs = collection.find({}, {'tag_data': 1, '_id': 1})
ids = [doc['_id'] for doc in docs]
tags = [doc['tag_data'] for doc in docs]

然后对标记数据调用cluster函数。在

^{pr2}$

并且zip结果返回ids。在

doc_clusters = zip(ids, clusters)

从这里开始，您已经构建了(_id, cluster)的元组，这样就可以更新mongo文档上的集群标签。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

MongoDB+K表示集群

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >