了解使用高级索引时NumPy的复制行为

2024-09-28 03:19:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在努力使用高级索引在NumPy中编写整洁的代码

arr = np.arange(100).reshape(10,10) # array I want to manipulate
sl1 = arr[:,-1] # basic indexing
# Do stuff with sl1...
sl1[:] = -1
# arr has been changed as well
sl2 = arr[arr >= 50] # advanced indexing
# Do stuff with sl2...
sl2[:] = -2
# arr has not been changed, 
# changes must be written back into it
arr[arr >= 50] = sl2 # What I'd like to avoid

我想避免这种“回写”操作,因为这感觉是多余的,而且我经常忘记它。有没有更优雅的方法来完成同样的事情


Tags: to代码numpywithnpdohasarr
1条回答
网友
1楼 · 发布于 2024-09-28 03:19:14

布尔和整数数组索引都属于advanced indexing methods的范畴。在第二个示例(布尔索引)中,您将看到原始数组没有更新,这是因为advanced indexing总是返回数据的副本(请参见docs的高级索引部分的第二段)。这意味着一旦您执行了arr[arr >= 50],这已经是arr的一个副本,并且您对其应用的任何更改都不会影响arr

它不返回视图的原因是高级索引不能表示为切片,因此不能使用偏移量、跨距和计数进行处理,而偏移量、跨距和计数是查看阵列元素所必需的

我们可以很容易地验证,在高级索引的情况下,我们正在查看不同的对象,包括:

np.shares_memory(arr, arr[arr>50])
# False
np.shares_memory(arr, arr[:,-1])
# True

仅在执行基本切片操作时返回视图。因此,您必须像在上一个示例中那样重新分配。关于评论中的问题,当在同一表达式中重新赋值时:

arr[arr >= 50] = -2

python解释器将其翻译为:

arr.__setitem__(arr >= 50, -2)

这里需要理解的是,表达式可以在的位置进行计算,因此不需要创建新的对象,因为不需要它

相关问题 更多 >

    热门问题