深入学习一些关于

2条回答

网友

1楼 · 编辑于 2024-05-06 23:03:22

让我们看看BVLC/caffe提供的一个示例：^{}。
您会注意到，实际上有3'.prototxt'文件：

^{}：这个文件描述了训练阶段的网络体系结构。在
^{}：这个文件描述了测试时的网络体系结构（“部署”）。在
^{}：这个文件非常小，包含用于训练的“元参数”。例如，learning rate policy，regulariztion等

由train_val.prototxt和deploy.prototxt表示的网络体系结构应该基本相似。两者之间几乎没有什么主要区别：

输入数据：在培训期间，通常使用一组预定义的输入进行培训/验证。因此，train_val通常包含显式输入层，例如"HDF5Data"层或"Data"层。另一方面，deploy通常不知道它将得到什么输入，它只包含一个语句：
```
input: "data"
input_shape {
  dim: 10
  dim: 3
  dim: 227
  dim: 227
}
```
它声明了网络需要什么输入以及它的维度是什么。
或者，可以放置^{}层：
```
layer {
  name: "input"
  type: "Input"
  top: "data"
  input_param { shape { dim: 10 dim: 3 dim: 227 dim: 227 } }
}
```
输入标签：在训练期间，我们向网络提供“基本真实”的预期输出，在deploy期间，这些信息显然不可用。在
损失层：在培训期间，必须定义损失层。该层告诉解算器在每次迭代时应该调整参数的方向。这个损失将网络当前的预测与预期的“真实情况”相比较。损失的梯度会反向传播到网络的其他部分，这就是驱动学习过程的原因。在deploy期间，没有丢失和反向传播。在

在caffe中，您提供一个train_val.prototxt来描述网络、train/val数据集和丢失。此外，您还提供了一个solver.prototxt来描述用于训练的元参数。训练过程的输出是一个.caffemodel二进制文件，包含网络的训练参数。
一旦训练完网络，就可以使用deploy.prototxt和.caffemodel参数来预测新的和未看到的输入的输出。在

网友

2楼 · 编辑于 2024-05-06 23:03:22

是的，但是.prototxt文件有不同的类型例如

https://github.com/BVLC/caffe/blob/master/examples/mnist/lenet_train_test.prototxt

这是为训练和测试网络准备的

对于命令行训练，ypu可以使用一个解算器文件，例如.prototxt文件

https://github.com/BVLC/caffe/blob/master/examples/mnist/lenet_solver.prototxt

相关问题更多 >

编程相关推荐

热门问题

热门文章

深入学习一些关于

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >