将多个数组组合成一个二进制数组（性能）

def findNearest(self,array,value): if value >= array[0][0] and value <= array[-1][0]: diff = 1 # First Pass a = 0 b = len(array) while a < b: mid = (a+b)//2 if array[mid][0] > value: b = mid else: a = mid+1 if array[a][0] - value < diff: diff = array[a][0] - value index = a # Second Pass a = 0 b = len(array) while a < b: mid = (a+b)//2 if array[mid][0] < value: a=mid+1 else: b=mid if array[a][0] - value < diff: diff = array[a][0] - value index = a return a # Section of another function that performs the summing combinedSpectra = numpy.zeros(shape=(arraySize,2)) for index, i in enumerate(combinedSpectra): i[0] = ... # This generates the x-coordinates of the numpy array for i in arraySet: for j in i: combinedSpectra[self.findNearest(combinedSpectra,float(j[0]))][1] += float(j[1])

fullSet = [] for i in arraySet: for j in i: fullSet.append(j) fullSet.sort(key = lambda tup: tup[0]) combinedSpectra = numpy.zeros(shape=(arraySize,2)) for index, i in enumerate(combinedSpectra): i[0] = ... # This generates the x-coordinates of the numpy array for index1, i in enumerate(combinedSpectra[:-2]): for index2, j in enumerate(fullSet): if float(j[0]) >= float(combinedSpectra[index1+1][0]): break else: combinedSpectra[index1][1] += float(j[1])

fullSet = [] for i in array[lowTime:highTime]: for j in i[1]: fullSet.append(j) fullSet.sort(key = lambda tup: tup[0]) for i in fullSet: try: combinedSpectra[self.findNearest(combinedSpectra,float(i[0]))][1] += float(i[1]) else: pass

combinedSpectra = numpy.zeros(shape=(arraySize,2)) bins = [] for index, i in enumerate(combinedSpectra): i[0] = float(LOW_MZ) + index*(float(1)/float(SUM_SPECTRUM_RESOLUTION)) bins.append(float(LOW_MZ) + index*(float(1)/float(SUM_SPECTRUM_RESOLUTION))) fullSet = [] mz = [] for i in arraySet: for j in i[1]: fullSet.append(j) mz.append(j[0]) fullSet.sort(key = lambda tup: tup[0]) mz.sort() mzArray = numpy.asarray(mz) binsArray = numpy.asarray(bins) test = numpy.digitize(mzArray,bins) for index, i in enumerate(fullSet): combinedSpectra[test[index]-1][1]] += i[1]

1条回答

网友
1楼 · 发布于 2024-09-25 08:37:28

由于您已经在使用numpy，我建议您将输入数据集转换为numpy数组（使用^{}），然后使用^{}进行装箱。你知道吗
虽然这仍然在幕后进行二进制搜索，但它将在快速编译的c代码中完成！你知道吗
在我做的一个快速测试中，这将在不到半秒钟的时间内处理25万个点的数组。你知道吗
如果你在x中的垃圾箱是单调递增的，你可以改为使用^{}，它应该做与np.digitize相同的事情，只是速度更快（数字化有时会退回到缓慢的线性搜索）
若要使用此方法，请在方法4中替换对数字化的调用
numpy.searchsorted(bins, mzArray)

相关问题更多 >

编程相关推荐

热门问题

热门文章