Numpy布尔索引分配有时会失败并分配整个数组

def easy_labeling(arr, thresh=5): negative_mask = arr < thresh positive_mask = arr >= thresh labels = np.empty_like(arr, dtype=str) labels[negative_mask] = 'N' labels[positive_mask] = 'P' return labels

test_arr1 = np.arange(24).reshape((12,2)) test_arr1 >>> test_arr1 array([[ 0, 1], [ 2, 3], [ 4, 5], [ 6, 7], [ 8, 9], [10, 11], [12, 13], [14, 15], [16, 17], [18, 19], [20, 21], [22, 23]]) easy_labeling(test_arr1) >>> array([['N', 'N'], ['N', 'N'], ['N', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P']], dtype='<U1') test_arr2 = np.random.randint(12, size=(12,2)) test_arr2 >>> array([[ 1, 11], [ 5, 6], [11, 7], [ 9, 4], [11, 3], [ 0, 9], [ 0, 4], [11, 8], [ 3, 6], [ 0, 1], [ 5, 8], [10, 4]]) easy_labeling(test_arr2) >>> array([['N', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'N'], ['P', 'N'], ['N', 'P'], ['N', 'N'], ['P', 'P'], ['N', 'P'], ['N', 'N'], ['P', 'P'], ['P', 'N']], dtype='<U1')

test_arr3 = np.array([[ 2, 0, 4, 4], [ 0, 2, 9, 11], [ 4, 4, 6, 10], [11, 5, 10, 15], [ 5, 8, 0, 8], [ 3, 6, 5, 11], [ 6, 7, 2, 9], [ 1, 1, 1, 2], [ 9, 11, 3, 14], [ 8, 10, 7, 17], [10, 3, 11, 14], [ 7, 9, 8, 17]]) test_arr3 = test_arr3[:, 1:3] test_arr3 >>> array([[ 0, 4], [ 2, 9], [ 4, 6], [ 5, 10], [ 8, 0], [ 6, 5], [ 7, 2], [ 1, 1], [11, 3], [10, 7], [ 3, 11], [ 9, 8]]) easy_labeling(test_arr3): >>> array([['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P'], ['P', 'P']], dtype='<U1')

test_arr4 = np.array([[0, 4], [2, 9], [4, 6], [5, 10], [8, 0], [6, 5], [7, 2], [1, 1], [11, 3], [10, 7], [3, 11], [9, 8]]) test_arr4 >>> array([[ 0, 4], [ 2, 9], [ 4, 6], [ 5, 10], [ 8, 0], [ 6, 5], [ 7, 2], [ 1, 1], [11, 3], [10, 7], [ 3, 11], [ 9, 8]]) easy_labeling(test_arr4) >>> array([['N', 'N'], ['N', 'P'], ['N', 'P'], ['P', 'P'], ['P', 'N'], ['P', 'P'], ['P', 'N'], ['N', 'N'], ['P', 'N'], ['P', 'P'], ['N', 'P'], ['P', 'P']], dtype='<U1')

for x in [test_arr1, test_arr2, test_arr3, test_arr4]: ... print(type(x), x.shape, x.dtype) >>> <class 'numpy.ndarray'> (12, 2) int32 <class 'numpy.ndarray'> (12, 2) int32 <class 'numpy.ndarray'> (12, 2) int32 <class 'numpy.ndarray'> (12, 2) int32

1条回答

网友

1楼 · 发布于 2024-06-02 12:13:51

这看起来像是输入数组不连续时empty_like如何处理dtype=str的错误。（更新：我为此问题创建了一个numpy bug report。该fix已合并到主开发分支中，并将在下一版本（NumPy 1.22.0）中发布。）

下面是一个令人惊讶的行为的简单例子：

In [66]: a = np.arange(9).reshape(3, 3)

In [67]: b = a[:, ::2]

In [68]: b
Out[68]: 
array([[0, 2],
       [3, 5],
       [6, 8]])

In [69]: x = np.empty_like(b, dtype=str)

In [70]: x
Out[70]: 
array([['', ''],
       ['', ''],
       ['', '']], dtype='<U1')

In [71]: x.strides
Out[71]: (0, 0)

x的^{}属性不应为(0, 0)

另一种解决方法（除了您建议的方法之外）是在调用empty_like时使用显式NumPy数据类型而不是str：

In [72]: x = np.empty_like(b, dtype='U1')

In [73]: x
Out[73]: 
array([['', ''],
       ['', ''],
       ['', '']], dtype='<U1')

In [74]: x.strides
Out[74]: (8, 4)

相关问题更多 >

编程相关推荐

热门问题

热门文章