我使用网格搜索来找到正确的参数。在
下面是我的代码。在
from sklearn.ensemble import GradientBoostingClassifier
gbm = GradientBoostingClassifier(random_state=2)
parameters = {"loss" : ("deviance", "exponential"), \
"learning_rate":[0.1, 0.01, 0.02, 0.05], \
"n_estimators":[100, 500, 1000, 5000],\
"max_depth":[1,3,5],\
"subsample":[0.5, 0.8, 0.9, 1],\
"max_features":("sqrt", "log2", 1.0, 0.2, 0.5, 0.8)}
from sklearn import grid_search
gs = grid_search.GridSearchCV(gbm, parameters, scoring="log_loss", n_jobs=-1,cv=3, verbose=5)
gs.fit(train, y)
我的问题是,如何计算得分(这里是对数损失)?在建立模型或数据时使用的是数据的对数损失,在每个简历中被忽略掉,然后是得分的平均值?在
目前没有回答
相关问题 更多 >
编程相关推荐