以下脚本随机崩溃(即,有时崩溃并生成此回溯,大多数情况下不会)。该脚本利用多个线程并行训练MNIST softmax模型。在
您可以通过运行for ((n=0;n<100;n++)); do python mnist_softmax_parallel_issue.py; done
轻松地再现崩溃
回溯
external/eigen_archive/unsupported/Eigen/CXX11/src/Tensor/TensorBroadcasting.h:125: Eigen::TensorEvaluator<const Eigen::TensorBroadcastingOp<Broadcast, XprType>, Device>::T
ensorEvaluator(const XprType&, const Device&) [with Broadcast = const Eigen::IndexList<Eigen::type2index<1l>, int>; ArgType = const Eigen::TensorMap<Eigen::Tensor<float, 2, 1, long
int>, 16, Eigen::MakePointer>; Device = Eigen::ThreadPoolDevice; Eigen::TensorEvaluator<const Eigen::TensorBroadcastingOp<Broadcast, XprType>, Device>::XprType = Eigen::TensorBroadcastingOp<const Eigen::IndexList<Eigen::type2index<1l>, int>, const Eigen::TensorMap<Eigen::Tensor<float, 2, 1, long int>, 16, Eigen::MakePointer> >]: Assertion input_dims[i] > $' failed.
mnist_softmax_设备_问题.py
^{pr2}$
mnist.train.next_batch()
不是线程安全的。此后,batch_xs
和{(0, 784)
和{当用零行传递这些矩阵时,将触发上述断言。在
相关问题 更多 >
编程相关推荐