连续非连续切片上的Numpy缩减

from __future__ import division, print_function import numpy as np, pandas as pd from time import time np.random.seed(0) d = 500000 f = 500 n = 500 I = np.hstack((np.arange(n), np.random.randint(n, size=(d - n,)))) np.random.shuffle(I) A = np.random.rand(d, f) def reduce_naive(A, I, op="avg"): target_dtype = (np.float if op=="avg" else A.dtype) results = np.zeros((I.max() + 1, A.shape[1]), dtype=target_dtype) npop = {"avg": np.mean, "sum": np.sum, "max": np.max}.get(op) for i in np.unique(I): results[i, :] = npop(A[I == i, :], axis=0) return results def reduce_reduceat(A, I, op="avg"): sidx = I.argsort() sI = I[sidx] sortedA = A[sidx] idx = np.r_[ 0, np.flatnonzero(sI[1:] != sI[:-1])+1 ] if op == "max": return np.maximum.reduceat(sortedA, idx, axis=0) sums = np.add.reduceat(sortedA, idx, axis=0) if op == "sum": return sums if op == "avg": count = np.r_[idx[1:] - idx[:-1], A.shape[0] - idx[-1]] return sums/count.astype(float)[:,None] def reduce_bincount(A, I, op="avg"): ids = (I[:,None] + (I.max()+1)*np.arange(A.shape[1])).ravel() sums = np.bincount(ids, A.ravel()).reshape(A.shape[1],-1).T if op == "sum": return sums if op == "avg": return sums/np.bincount(ids).reshape(A.shape[1],-1).T def reduce_pandas(A, I, op="avg"): group = pd.concat([pd.DataFrame(A), pd.DataFrame(I, columns=("i",)) ], axis=1 ).groupby('i') if op == "sum": return group.sum().values if op == "avg": return group.mean().values if op == "max": return group.max().values def reduce_hybrid(A, I, op="avg"): sidx = I.argsort() sI = I[sidx] sortedA = A[sidx] idx = np.r_[ 0, np.flatnonzero(sI[1:] != sI[:-1])+1 ] unq_sI = sI[idx] m = I.max()+1 N = A.shape[1] target_dtype = (np.float if op=="avg" else A.dtype) out = np.zeros((m,N),dtype=target_dtype) ss_idx = np.r_[idx,A.shape[0]] npop = {"avg": np.mean, "sum": np.sum, "max": np.max}.get(op) for i in range(len(idx)): out[unq_sI[i]] = npop(sortedA[ss_idx[i]:ss_idx[i+1]], axis=0) return out for op in ("sum", "avg", "max"): for name, method in (("naive ", reduce_naive), ("reduceat", reduce_reduceat), ("pandas ", reduce_pandas), ("bincount", reduce_bincount), ("hybrid ", reduce_hybrid) ("numba ", reduce_numba) ): if op == "max" and name == "bincount": continue # if name is not "naive": # assert np.allclose(method(A, I, op), reduce_naive(A, I, op)) times = [] for tries in range(3): time0 = time(); method(A, I, op) times.append(time() - time0); print(name, op, "{:.2f}".format(np.min(times))) print()

naive sum 1.10 reduceat sum 4.62 pandas sum 5.29 bincount sum 1.54 hybrid sum 0.62 numba sum 0.31 naive avg 1.12 reduceat avg 4.45 pandas avg 5.23 bincount avg 2.43 hybrid avg 0.61 numba avg 0.33 naive max 1.19 reduceat max 3.18 pandas max 5.24 hybrid max 0.72 numba max 0.34

3条回答

网友

1楼 · 编辑于 2024-09-27 07:27:30

使用python/numpy jit编译器Numba我能够通过即时编译直观的线性算法获得更短的时间：

from numba import jit

@jit
def reducenb_avg(A, I):
    d, f = A.shape
    n = I.max() + 1
    result = np.zeros((n, f), np.float)
    count = np.zeros((n, 1), int)
    for i in range(d):
        result[I[i], :] += A[i]
        count[I[i], 0] += 1
    return result/count

@jit
def reducenb_sum(A, I):
    d, f = A.shape
    n = I.max() + 1
    result = np.zeros((n, f), A.dtype)
    for i in range(d):
        result[I[i], :] += A[i]
    return result

@jit
def reducenb_max(A, I):
    d, f = A.shape
    n = I.max() + 1
    result = -np.inf * np.ones((n, f))
    count = np.zeros((n, f))
    for i in range(d):
        result[I[i], :] = np.maximum(A[i], result[I[i], :])
    return result

def reduce_numba(A, I, op="avg"):
    return {"sum": reducenb_sum, "avg": reducenb_avg, "max": reducenb_max}.get(op)(A, I)

在基准测试问题上，这些方法在~0.32s内完成，大约是纯numpy排序方法的一半时间。在

网友

2楼 · 编辑于 2024-09-27 07:27:30

另一个可用于此目的的工具是无缓冲add.at：

def add_at(I,A):
    n = I.max() + 1
    res = np.zeros((n,A.shape[1]))
    cnt = np.zeros((n,1))
    np.add.at(res, I, A)
    np.add.at(cnt, I, 1)
    return res/cnt

（它的结构非常接近numbareducenb_avg）

^{pr2}$

对于这个小问题，与其他问题相比，它测试得很好，但扩展性不好（从3倍快到12倍慢）。在

网友

3楼 · 编辑于 2024-09-27 07:27:30

方法1：使用NumPy ufunc reduceat

我们有^{}来进行这三个约化操作，幸运的是，我们还有{a2}来执行这些限制在轴上的特定间隔的缩减。所以，使用这些，我们可以像这样计算这三个运算-

# Gives us sorted array based on input indices I and indices at which the
# sorted array should be interval-limited for reduceat operations to be
# applied later on using those results
def sorted_array_intervals(A, I):
    # Compute sort indices for I. To be later used for sorting A based on it.
    sidx = I.argsort()
    sI = I[sidx]
    sortedA = A[sidx]

    # Get indices at which intervals change. Also, get count in each interval
    idx = np.r_[ 0, np.flatnonzero(sI[1:] != sI[:-1])+1 ]
    return sortedA, idx

# Groupby sum reduction using the interval indices 
# to perform interval-limited ufunc reductions
def groupby_sum(A, I):
    sortedA, idx = sorted_array_intervals(A,I)
    return np.add.reduceat(sortedA, idx, axis=0)

# Groupby mean reduction
def groupby_mean(A, I):
    sortedA, idx = sorted_array_intervals(A,I)
    sums = np.add.reduceat(sortedA, idx, axis=0)
    count = np.r_[idx[1:] - idx[:-1], A.shape[0] - idx[-1]]
    return sums/count.astype(float)[:,None]

# Groupby max reduction
def groupby_max(A, I):
    sortedA, idx = sorted_array_intervals(A,I)
    return np.maximum.reduceat(sortedA, idx, axis=0)

因此，如果我们需要所有这些操作，我们可以对sorted_array_intervals的一个实例进行重用，如下-

^{pr2}$

方法1-B：混合版本（排序+切片+减少）

这是一个混合版本，它确实需要sorted_array_intervals的帮助来获得排序的数组和间隔变为下一个组的索引，但在最后一个阶段使用切片来求每个间隔的和，并对每个组进行迭代。在我们使用views时，切片在这里有帮助。在

实现应该是这样的-

def reduce_hybrid(A, I, op="avg"):
    sidx = I.argsort()
    sI = I[sidx]
    sortedA = A[sidx]

    # Get indices at which intervals change. Also, get count in each interval
    idx = np.r_[ 0, np.flatnonzero(sI[1:] != sI[:-1])+1 ]
    unq_sI = sI[idx]    

    m = I.max()+1
    N = A.shape[1]

    target_dtype = (np.float if op=="avg" else A.dtype)
    out = np.zeros((m,N),dtype=target_dtype)
    ss_idx = np.r_[idx,A.shape[0]]

    npop = {"avg": np.mean, "sum": np.sum, "max": np.max}.get(op)
    for i in range(len(idx)):
        out[unq_sI[i]] = npop(sortedA[ss_idx[i]:ss_idx[i+1]], axis=0)
    return out

运行时测试（使用问题中发布的基准测试的设置）

In [432]: d = 500000
     ...: f = 500
     ...: n = 500
     ...: I = np.hstack((np.arange(n), np.random.randint(n, size=(d - n,))))
     ...: np.random.shuffle(I)
     ...: A = np.random.rand(d, f)
     ...: 

In [433]: %timeit reduce_naive(A, I, op="sum")
     ...: %timeit reduce_hybrid(A, I, op="sum")
     ...: 
1 loops, best of 3: 1.03 s per loop
1 loops, best of 3: 549 ms per loop

In [434]: %timeit reduce_naive(A, I, op="avg")
     ...: %timeit reduce_hybrid(A, I, op="avg")
     ...: 
1 loops, best of 3: 1.04 s per loop
1 loops, best of 3: 550 ms per loop

In [435]: %timeit reduce_naive(A, I, op="max")
     ...: %timeit reduce_hybrid(A, I, op="max")
     ...: 
1 loops, best of 3: 1.14 s per loop
1 loops, best of 3: 631 ms per loop

方法2：使用NumPy bincount

这是另一种使用^{}进行基于bin的求和的方法。所以，有了它，我们可以计算出总和和平均值，也可以避免在这个过程中排序，就像这样-

ids = (I[:,None] + (I.max()+1)*np.arange(A.shape[1])).ravel()
sums = np.bincount(ids, A.ravel()).reshape(A.shape[1],-1).T
avgs = sums/np.bincount(ids).reshape(A.shape[1],-1).T

相关问题更多 >

编程相关推荐

热门问题

热门文章