采用forserver与dask-datafram进行训练的Keras模型

import glob import dask.dataframe paths_train = glob.glob(r'x_train_d_final*.csv') X_train_d = dd.read_csv('.../x_train_d_final0.csv') Y_train1 = keras.utils.to_categorical(Y_train.iloc[,1], num_classes) batch_size = 500 num_classes = 2 epochs = 5 model = Sequential() model.add(Dense(645, activation='sigmoid', input_shape=(1290,),kernel_initializer='glorot_normal')) #model.add(Dense(20, activation='sigmoid',kernel_initializer='glorot_normal')) model.add(Dense(num_classes, activation='sigmoid')) model.compile(loss='binary_crossentropy', optimizer=Adam(decay=0), metrics=['accuracy']) history = model.fit(X_train_d.to_records(), Y_train, batch_size=batch_size, epochs=epochs, verbose=1, class_weight = {0:1,1:6.5}, shuffle=False)

2条回答

网友

1楼 · 编辑于 2024-05-04 00:31:10

今天Keras不知道Dask数据帧或数组。我怀疑它只是将dask对象转换为等效的Pandas或Numpy对象。在

如果您的Keras模型可以增量训练，那么您可以使用dask.delayed和一些for循环来解决这个问题。在

最终，看到Keras和Dask项目能够相互了解，从而在不增加工作量的情况下促进这些工作负载，这将是一件好事。在

网友

2楼 · 编辑于 2024-05-04 00:31:10

您应该将fit_generator()fromSequential model与生成器或Sequence实例一起使用。两者都提供了一种只加载一部分数据的适当方法。在

Keras文档提供了一个很好的例子：

def generate_arrays_from_file(path):
    while 1:
        f = open(path)
        for line in f:
            # create Numpy arrays of input data
            # and labels, from each line in the file
            x, y = process_line(line)
            yield (x, y)
        f.close()

model.fit_generator(generate_arrays_from_file('/my_file.txt'),
                    steps_per_epoch=1000, epochs=10)

相关问题更多 >

编程相关推荐

热门问题

热门文章