使用itertools.count（）计数时出错

counter = itertools.count() dtype = [('clf', object), ('accu', float), ("counter", int)] self.models = np.zeros((n_randoms*n_boot, n_estimators), dtype=dtype) for i in tqdm(range(n_randoms*n_boot)): for j in range(n_estimators): clf = DecisionTreeClassifier(random_state = j, criterion="entropy") clf.fit(X_train_list[i], y_train_list[i]) accu_list[i, j] = clf.score(X_test_list[i], y_test_list[i]) self.models[i, j] = (clf, accu_list[i, j], next(counter)) self.sorted_models = np.sort(self.models, axis=1, order=["accu", "counter"])

1条回答

网友

1楼 · 发布于 2024-10-03 02:45:04

numpy.sort并不保证不将元素与它们自己进行比较。快速排序中的partition logic有时会在分区末尾执行自比较，因为元素比较发生在指针比较之前：

/*
 * Generic comparisons may be buggy, so don't rely on the sentinels
 * to keep the pointers from going out of bounds.
 */
for (;;) {
    do {
        pi += elsize;
    } while (cmp(pi, vp, arr) < 0 && pi < pj);
    do {
        pj -= elsize;
    } while (cmp(vp, pj, arr) < 0 && pi < pj);
    if (pi >= pj) {
        break;
    }
    GENERIC_SWAP(pi, pj, elsize);
}

这里，vp是指向透视图副本的指针，透视图位于初始值pj。如果轴是从初始pi到初始pj范围内的最高值，则pi一直前进到轴，并发生自比较

Pivot selection将保证存在一个高于枢轴的值，但较高的值紧跟在初始^{之后

在自比较中，计数器值将相等，比较将尝试询问分类器是否小于自身

分区只在排序轴增长超过插入排序阈值时才开始发生，这就是为什么只有在排序轴足够长时才看到问题的原因

避免自我比较会很方便。我很确定内置的sorted函数避免了自我比较，我认为在numpy.sort中避免自我比较不会太困难。这可能值得一个增强请求

相关问题更多 >

编程相关推荐

热门问题

热门文章