如何从积极的未标记学习中计算roc auc分数？

known_labels_ratio = 0.5 NP = data_P.shape[0] NU = data_U.shape[0] T = 1000 K = NP train_label = np.zeros(shape=(NP+K,)) train_label[:NP] = 1.0 n_oob = np.zeros(shape=(NU,)) f_oob = np.zeros(shape=(NU, 2)) for i in range(T): # Bootstrap resample bootstrap_sample = np.random.choice(np.arange(NU), replace=True, size=K) # Positive set + bootstrapped unlabeled set data_bootstrap = np.concatenate((data_P, data_U[bootstrap_sample, :]), axis=0) # Train model model = DecisionTreeClassifier(max_depth=None, max_features=None, criterion='gini', class_weight='balanced') model.fit(data_bootstrap, train_label) # Index for the out of the bag (oob) samples idx_oob = sorted(set(range(NU)) - set(np.unique(bootstrap_sample))) # Transductive learning of oob samples f_oob[idx_oob] += model.predict_proba(data_U[idx_oob]) n_oob[idx_oob] += 1 predict_proba = f_oob[:, 1]/n_oob

1条回答

网友

1楼 · 发布于 2024-10-05 17:41:28

y_pred必须是单个数字，给出正类p1的概率；目前，您的y_pred由两种概率组成[p0, p1]（定义为p0+p1=1.0）

假设您的正类是class1（即y_pred中每个数组的第二个元素），您应该做的是：

y_pred_pos = [y_pred[i, 1] for i in range(len(y_pred))]
y_pred_pos # inspect
# [0.9944571, 0.9267686, 0.83138204]

roc_auc_score(train_label, y_pred_pos)

如果y_pred是一个Numpy数组（而不是Python列表），则可以将上面第一个命令中的列表替换为：

y_pred_pos  = y_pred[:,1]

相关问题更多 >

编程相关推荐

热门问题

热门文章