在Python中增加大量值的最有效方法是什么？

children = {"child_1" : 0, ... , "child_10": 0} gp1 = ["child_3", "child_7", "child_10"] #children who selected the box 1 ... gp5 = ["child_2", "child_5", "child_8", "child_10"] boxes = [(0,gp1), (0,gp2), (1,gp3), (1,gp4), (0,gp5)] for box in boxes: if box[0] == 1: #something inside for child in box[1]: children[child] += 1

3条回答

网友

1楼 · 编辑于 2024-10-03 11:24:29

我能想到的唯一的加速是使用numpy数组和流式处理sum操作。在

children[child] += np.ones(len(children[child]))

您应该对操作进行基准测试，看看这对于您的业务案例是否太慢。在

网友

2楼 · 编辑于 2024-10-03 11:24:29

我会做什么

在gpX列表中，不保存“子项的名称”（例如"child_10"），而是保存对子项点数的引用。在

如何做到这一点

利用列表是python中的对象这一事实，您可以：

将子dict更改为：children = {"child_0": [0], "child_1": [0], ...}等。在
当您指定给组时，不要指定键，而是指定值（例如gp1.append(children["child_0"])）。在
循环应该看起来像：for child in box[1]: child[0]+=1。这将更新childrendict

编辑：

为什么更快：因为您省略了搜索children[child]的部分，这可能会很昂贵。在

这种技术之所以有效，是因为通过以可变类型存储总计，并将这些值附加到组列表中，dict值和每个框的列表值都将指向相同的列表项，更改其中一个将更改另一个。在

网友

3楼 · 编辑于 2024-10-03 11:24:29

将子级表示为数组中的索引，而不是字符串：

childrenScores = [0] * 10
gp1 = [2,6,9] # children who selected box 1
...
gp5 = [1,4,7,9]

boxes = [(0,gp1), (0,gp2), (1,gp3), (1,gp4), (0,gp5)]

然后，可以将childrenScores存储为NumPy数组并使用高级索引：
^{pr2}$
这仍然涉及到某个地方的一个循环，但是这个循环在NumPy的内部很深，这应该可以提供一个有意义的加速。

相关问题更多 >

编程相关推荐

热门问题

热门文章