当我添加if条件时，python中通过ctypes使用的C函数会变慢

void dotProduct(double *parameters, double *feature, double *dataset) { const int FEATURE_COUNT = parameters[0]; const int DATASET_COUNT = parameters[1]; const double THRESHOLD = parameters[2]; double dotProductResult; for (int i = 0; i < DATASET_COUNT; i++) { dotProductResult = 0.0; for (int j = 0; j < FEATURE_COUNT; j++) { dotProductResult += dataset[i*FEATURE_COUNT+j] * feature[j]; } // if (dotProductResult > THRESHOLD) // { // parameters[3] = i; // } } }

ND_POINTER_PARAMETERS = np.ctypeslib.ndpointer(dtype=np.float64, ndim=1, flags="C") ND_POINTER_FEATURE = np.ctypeslib.ndpointer(dtype=np.float64, ndim=1, flags="C") ND_POINTER_DATASET = np.ctypeslib.ndpointer(dtype=np.float64, ndim=2, flags="C") dotProductLib.dotProduct.argtypes = [ND_POINTER_PARAMETERS, ND_POINTER_FEATURE, ND_POINTER_DATASET] feature = np.random.rand(512,) dataset = np.random.rand(1000000,512) parameters = np.array([len(feature), len(dataset), 200, -1], dtype=np.float64) t = time() dotProductLib.dotProduct(parameters, feature, dataset) print("---time taken C: ",1000*(time()-t), "ms")

1条回答

网友

1楼 · 发布于 2024-09-26 22:08:09

您的原始代码非常快，因为它实际上什么都不做！编译器识别出您实际上没有使用dotProductResult，因此函数得到optimized down to literally nothing。当您取消对条件的注释时，现在使用了dotProductResult的值，因此它必须实际计算点积。如果“添加一个else条件并在if中编写相同的语句”，那么它又快了，因为编译器意识到这相当于：

void dotProduct(double *parameters, double *feature, double *dataset)
    {
        const int DATASET_COUNT = parameters[1];

        if (DATASET_COUNT > 0)
        {
            parameters[3] = DATASET_COUNT - 1;
        }
    }

这样它就可以停止工作了

相关问题更多 >

编程相关推荐

热门问题

热门文章