numpy二维布尔数组索引与沿一个轴的reduce

3条回答

网友

1楼 · 编辑于 2024-09-29 00:15:00

您可以使用masked arrays来实现这一点，但在我运行的测试中，它比(angles * belong).sum(1)快。在

掩码数组方法如下所示：

sum_ang = np.ma.masked_where(~belong, angles, copy=False).sum(1).data

这里，我们正在创建一个angles的掩码数组，其中值~belong（“不属于”）是掩码的（排除）。我们使用而不是，因为我们要排除belong中的False中的值。然后沿着第.sum(1)行取和。sum将返回另一个掩码数组，因此您可以使用该掩码数组的.data属性获取值。在

我添加了copy=Falsekwarg，这样代码就不会因为创建数组而变慢，但是它仍然比(angles * belong).sum(1)方法慢，所以您应该坚持这样做。在

网友

2楼 · 编辑于 2024-09-29 00:15:00

您可以使用^{}-

np.einsum('ij,ij->i',belong,angles)

您也可以使用^{}，如下-

^{pr2}$

样本运行-

In [32]: belong
Out[32]: 
array([[ True,  True,  True, False,  True],
       [False, False, False,  True,  True],
       [False, False,  True,  True,  True],
       [False, False,  True, False,  True]], dtype=bool)

In [33]: angles
Out[33]: 
array([[ 0.65429151,  0.36235607,  0.98316406,  0.08236384,  0.5576149 ],
       [ 0.37890797,  0.60705112,  0.79411002,  0.6450942 ,  0.57750073],
       [ 0.6731019 ,  0.18608778,  0.83387574,  0.80120389,  0.54971573],
       [ 0.18971255,  0.86765132,  0.82994543,  0.62344429,  0.05207639]])

In [34]: np.sum(angles*belong ,axis=1) # This worked for you, so using as baseline
Out[34]: array([ 2.55742654,  1.22259493,  2.18479536,  0.88202183])

In [35]: np.einsum('ij,ij->i',belong,angles)
Out[35]: array([ 2.55742654,  1.22259493,  2.18479536,  0.88202183])

In [36]: idx,_ = np.where(belong)
    ...: out = np.bincount(idx,angles[belong])
    ...: 

In [37]: out
Out[37]: array([ 2.55742654,  1.22259493,  2.18479536,  0.88202183])

运行时测试-

In [52]: def sum_based(belong,angles):
    ...:     return np.sum(angles*belong ,axis=1)
    ...: 
    ...: def einsum_based(belong,angles):
    ...:     return np.einsum('ij,ij->i',belong,angles)
    ...: 
    ...: def bincount_based(belong,angles):
    ...:     idx,_ = np.where(belong)
    ...:     return np.bincount(idx,angles[belong])
    ...: 

In [53]: # Inputs
    ...: belong = np.random.rand(4000,5000)>0.7
    ...: angles = np.random.rand(4000,5000)
    ...: 

In [54]: %timeit sum_based(belong,angles)
    ...: %timeit einsum_based(belong,angles)
    ...: %timeit bincount_based(belong,angles)
    ...: 
1 loops, best of 3: 308 ms per loop
10 loops, best of 3: 134 ms per loop
1 loops, best of 3: 554 ms per loop

我会选择np.einsum的那一个！在

网友

3楼 · 编辑于 2024-09-29 00:15:00

我发现了一种比einsum方法快3倍的方法，而且我不认为它能更快，所以我用另一种方法回答我自己的问题。在

我所希望的是计算出一个公式，这个公式涉及到，属于的位置是真的。这应该会加快大约3倍，因为归属是真实的大约30%的时间。在

我尝试用第一个公式来计算数组的位置，但这不属于第一个问题np.总和. 解决方案是使用np.add.reduceat。在

reduceat可以在特定切片的列表中减少ufunc（在本例中为add）。所以我只需要创建一个切片列表，这样我就可以减少由角度[归属]产生的一维数组。在

我将展示我的代码和时间安排，这应该是独立的。在

首先，我用reduceat解决方案定义一个函数：

def vote_op(angle, belong, THRES_THETA, lines_lengths_vstacked, max_line_length):
    intermediate = (0.3 * (1-(angle[belong]/THRES_THETA)) + 0.7 * (lines_lengths_vstacked[belong]/max_line_length))
    b_ind = np.hstack([0, np.cumsum(np.sum(belong, axis=1))])
    votes = np.add.reduceat(intermediate, b_ind[:-1])
    return votes

然后比较了基本方法和einsum方法：

^{pr2}$

时间安排：

[2.866840408487671, 2.6822349628234874, 2.665520338478774]
[2.3444239421490725, 2.352450520946098, 2.4150879511222794]
[0.6846337313820605, 0.660780839464234, 0.6091473217964847]

因此，还原解决方案的速度大约是其他两种方法的3倍，并给出了相同的结果。请注意，这些结果是针对比之前稍大的示例，其中：属于，角度和线条长度有形状：（3400170）以及np.count_非零（属于）/属于。大小->；0.16765051903114186

更新因为一个角落的案子np.还原（就像在numpy版本'1.11.0rc1'）中它不能正确地处理重复的索引，see，我不得不添加hack to vote_op（）函数来处理beyond中的整行都是False的情况。这会导致重复索引和错误的投票结果。我目前的解决方案是修补错误的值，这是可行的，但这是另一步。请参见新投票操作（）：

def vote_op(angle, belong, THRES_THETA, lines_lengths_vstacked, max_line_length):
    intermediate = (0.3 * (1-(angle[belong]/THRES_THETA)) + 0.7 * (lines_lengths_vstacked[belong]/max_line_length))
    b_rows = np.sum(belong, axis=1)
    b_ind = np.hstack([0, np.cumsum(b_rows)])[:-1]
    intermediate = np.hstack([intermediate, 0])
    votes = np.add.reduceat(intermediate, b_ind)
    votes[b_rows == 0] = 0
    return votes

相关问题更多 >

编程相关推荐

热门问题

热门文章