python中Keras序列的分类

training_data = [] with open(INTENT_RECOGNITION_TRAINING, 'r') as json_file: json_obj = json.load(json_file) for data in json_obj['data']: for query in data['queries']: words = [START_TOKEN] + word_tokenize(query[0]) + [END_TOKEN] if len(words) > JText.MAX_QUERY_LENGTH: JText.MAX_QUERY_LENGTH = len(words) training_data.append((words, data['intent'])) training_data = [(JText._pad_sequence(ws, JText.MAX_QUERY_LENGTH), intent) for (ws, intent) in training_data] for i in range(len(training_data)): if training_data[i][1] not in JText.INTENTS: JText.INTENTS.append(training_data[i][1]) query_vector = [] for w in training_data[i][0]: if w in JText.WORD2VEC.vocab: query_vector.append(JText.WORD2VEC[w]) else: query_vector.append(np.zeros(300)) training_data[i] = (query_vector, training_data[i][1]) random.shuffle(training_data) X_train = [tup[0] for tup in training_data] y_train = [tup[1] for tup in training_data] y_labelencoder = LabelEncoder() y_train = y_labelencoder.fit_transform(y_train).reshape(-1, 1) y_onehotencoder = OneHotEncoder(categorical_features=[0]) y_train = y_onehotencoder.fit_transform(y_train).toarray() recognizer = Sequential([ LSTM(100, input_shape=(JText.MAX_QUERY_LENGTH, 300)), Dense(len(JText.INTENTS), activation='sigmoid') ]) recognizer.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) recognizer.fit(X_train, y_train, nb_epoch=100, batch_size=10)

1条回答

网友

1楼 · 发布于 2024-04-20 05:53:36

没有keras模型代码或错误消息，很难提供准确的答案。我会根据现有的信息，通过陈述一个通用的解决方案来帮助你。在

我假设你在Keras中使用LSTM来进行序列分类。如果是这样的话，你的输入应该是一个3D数组的维度（批大小、时间步长、长度、每个单词向量）。所以在你的例子中，输入是一个形状的序列（没有序列，50300），假设每个序列中有50个单词。在
关于应该使用什么层，因为提供的y参数似乎只有3个分类类。如果是这种情况，可以考虑添加一个密集层，其输出_dim=3（即第一个参数3）

这个blog是序列分类的一个很好的例子，应该为初学者提供一些直观的想法。在

希望这有帮助

更新我正在尝试做类似的事情，但遇到了同样的问题。从你的代码看，你好像在传递一个形状的n数组（seqˉlen，300）。Keras需要一个3D numpy数组，而不是numpy数组的列表。在

这就是我如何重新配置我的训练数据

X_train = np.zeros((len(training_data,MAX_QUERY_LENGTH,300))
for i in range(len(training_data)):
     tup = training_data[i]
     X_train[i,:,:]=tup[0]

上面的代码没有经过优化，但它最好地传达了所需的更改，以便让LSTM层接受您的输入

希望这有帮助

相关问题更多 >

编程相关推荐

热门问题

热门文章