我正在尝试改进函数,该函数为图像的每个像素计算位于像素附近的像素的标准偏差。我的函数使用两个嵌入的循环来遍历矩阵,这是我的程序的瓶颈。我想可能有一种方法可以通过去掉numpy的循环来改进它,但是我不知道如何继续。 欢迎任何建议!
问候
def sliding_std_dev(image_original,radius=5) :
height, width = image_original.shape
result = np.zeros_like(image_original) # initialize the output matrix
hgt = range(radius,height-radius)
wdt = range(radius,width-radius)
for i in hgt:
for j in wdt:
result[i,j] = np.std(image_original[i-radius:i+radius,j-radius:j+radius])
return result
首先,有不止一种方法可以做到这一点。
这不是最有效的速度方面,但是使用^{} 将允许您轻松地在移动窗口上应用任意python函数。
举个简单的例子:
注意,边界条件可以由
mode
kwarg控制。另一种方法是使用一些不同的跨步技巧来创建有效地作为移动窗口的数组视图,然后沿最后一个轴应用
np.std
。(注意:这是从我以前的一个答案中得到的:https://stackoverflow.com/a/4947453/325565)乍一看有点难以理解这里发生了什么。我不想插入我自己的答案,但我不想重新键入解释,所以看看这里:https://stackoverflow.com/a/4924433/325565如果你以前没有看到过这种“跨步”技巧。
如果我们将计时与一个100x100随机浮点数数组(其
radius
为5)进行比较,它比原始版本或generic_filter
版本快约10倍。但是,使用此版本在边界条件方面没有灵活性。(它与您当前所做的工作完全相同,而generic_filter
版本以牺牲速度为代价,为您提供了很多灵活性。)“跨步技巧”版本的缺点是,与“普通”跨步滚动窗口技巧不同,此版本的会复制一个,它比原始数组大得多。如果在一个大数组中使用它,您将遇到内存问题!(另一方面,在内存使用和速度方面,它基本上等同于@Ophion的答案。这只是做同样事情的另一种方法。)
酷把戏:你可以计算标准差,只要在窗口中给出平方值和值的和。
因此,您可以使用数据的统一过滤器快速计算标准偏差:
这比原始函数快得多。对于1024x1024数组和半径为20的数组,旧函数需要34.11秒,而新函数需要0.11秒,速度提高了300倍。
这在数学上是如何工作的?它计算每个窗口的数量
sqrt(mean(x^2) - mean(x)^2)
。我们可以从标准差sqrt(mean((x - mean(x))^2))
中导出这个量,如下所示:设
E
为期望算子(基本上是mean()
),设X
为数据的随机变量。然后:E[(X - E[X])^2]
= E[X^2 - 2X*E[X] + E[X]^2]
= E[X^2] - E[2X*E[X]] + E[E[X]^2]
(通过期望算符的线性)= E[X^2] - 2E[X]*E[X] + E[X]^2
(同样是线性关系,而且E[X]
是一个常数)= E[X^2] - E[X]^2
这证明了用这种方法计算的量在数学上等价于标准差。
在图像处理中,最常用的方法是使用求和面积表,这是1984年this paper中引入的一种思想。其思想是,当你通过在一个窗口上加上来计算一个数量,并将窗口(例如,向右移动一个像素)时,你不需要添加新窗口中的所有项,你只需要从总数中减去最左边的列,然后添加新的最右边的列。因此,如果从数组中在两个维度上创建一个累加和数组,则可以在一个窗口上通过两个和和和一个减法得到和。如果为数组及其平方保留面积求和表,那么很容易从这两个表中得到方差。下面是一个实现:
要确保这一点:
这应该比基于卷积的方法快一些。
相关问题 更多 >
编程相关推荐