Python：如何更快地发现通用索引？

missingA = np.argwhere(np.isnan(vectorA)==True); missingA = [missingA[ma][0] for ma in range(len(missingA))]; missingB = np.argwhere(np.isnan(vectorB)==True); missingB = [missingB[mb][0] for mb in range(len(missingB))]; allmissidxs = set(missingA).union(set(missingB)); idxs = [idx for idx in range(len(vectorA)) if idx not in allmissidxs];

1条回答

网友

1楼 · 发布于 2024-05-18 05:36:27

假设源向量与其他解决方案中的源向量相同：

vectorA = np.array([np.nan, 1., 2., 3.,     np.nan, 5.,     np.nan, 7.,
    8., np.nan])
vectorB = np.array([0.,     1., 2., np.nan, 4.,     np.nan, 6.,     np.nan,
    8., np.nan])

您可以使用Pandasonic索引及其交叉方法来完成任务。甚至可以将其写成以下一行：

result = pd.Index(vectorA).intersection(vectorB)

结果是：

Float64Index([1.0, 2.0, 8.0], dtype='float64')

如果希望将结果作为Numpy向量，请将.values附加到上述代码中结果将是：

array([1., 2., 8.])

这种方法的优点是避免了任何列表理解，因此，此代码的运行速度应该比您的代码快得多。在更大的数据样本上自己检查

相关问题更多 >

编程相关推荐

热门问题

热门文章