今天我遇到了一些非常奇怪的行为。当我尝试用一个简单的模型在iris数据集上进行分类时,keras版本1.2.2给了我+-95%的准确率,而keras版本2.0+为每个训练示例预测相同的类(导致+-35%的准确率,因为有三种类型的iris)。唯一能让我的模型预测准确率达到+-95%的是将keras降级到2.0以下的版本:
我觉得这是凯拉斯的问题,因为我试过以下几件事,都没什么区别
因为模型非常简单,而且它自己运行(您只需要简单的虹膜.csv数据集)我决定包含整个代码
import pandas as pd
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasClassifier
from keras.utils import np_utils
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold
from sklearn.preprocessing import LabelEncoder
#Load data
data_frame = pd.read_csv("iris.csv", header=None)
data_set = data_frame.values
X = data_set[:, 0:4].astype(float)
Y = data_set[:, 4]
#Encode class values as integers
encoder = LabelEncoder()
encoder.fit(Y)
encoded_Y = encoder.transform(Y)
# convert integers to dummy variables (i.e. one hot encoded)
dummy_y = np_utils.to_categorical(encoded_Y)
def baseline_model():
#Create & Compile model
model = Sequential()
model.add(Dense(8, input_dim=4, init='normal', activation='relu'))
model.add(Dense(3, init='normal', activation='sigmoid'))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
return model
#Create Wrapper For Neural Network Model For Use in scikit-learn
estimator = KerasClassifier(build_fn=baseline_model, nb_epoch=200, batch_size=5, verbose=0)
#Create kfolds-cross validation
kfold = KFold(n_splits=10, shuffle=True)
#Evaluate our model (Estimator) on dataset (X and dummy_y) using a 10-fold cross-validation procedure (kfold).
results = cross_val_score(estimator, X, dummy_y, cv=kfold)
print("Accuracy: {:2f}% ({:2f}%)".format(results.mean()*100, results.std()*100))
如果有人想复制这个错误,下面是我用来观察问题的依赖项:
numpy=1.16.4
pandas=0.25.0
sk-learn=0.21.2
theano=1.0.4
tensorflow=1.14.0
在keras2.0中,许多参数改变了名称,有一个兼容层来保持工作,但是在使用
KerasClassifier
时,它并不适用。你知道吗在本部分代码中:
您使用的是旧名称
nb_epoch
,而不是现代名称epochs
。默认值是epochs=1
,这意味着您的模型只针对一个历元进行了训练,产生的预测质量非常低。你知道吗还要注意的是:
您应该使用
softmax
激活而不是sigmoid
,因为您使用的是分类交叉熵损失:我已经设法隔离了这个问题,如果你把
nb_epoch
改成epochs
(其他条件完全相同),那么这个模型在keras2中也预测得很好。我不知道这是故意的行为还是一个错误。你知道吗相关问题 更多 >
编程相关推荐