擅长:python、mysql、java
<p>虽然批处理转换平台支持灵活的有效负载限制(通过<code>MaxPayloadInMB</code>),但许多算法设置了更严格的内部限制。SageMaker内置的LDA算法就是这样,它根据内部配置拒绝“大”请求。在</p>
<p>您在日志中看到的错误正好说明了这一点:批处理转换客户机试图发送一个大小为20MB的请求,但LDA算法服务器拒绝了该请求,错误代码为<code>413 (Request Entity Too Large)</code>。在</p>
<p>使用SageMaker内置算法容器或任何非您自己的容器时,我们建议您在<code>CreateTransformJob</code>请求中保留参数<code>MaxPayloadInMB</code>未设置。这将提示平台选择算法的默认执行参数,您将看到这些参数打印在日志中,如下所示:</p>
<pre><code>[sagemaker logs]: MaxConcurrentTransforms=1, MaxPayloadInMB=${DEFAULT_MAX_PAYLOAD_IN_MB}, BatchStrategy=MultiRecord
</code></pre>
<p>有关如何解析这些“执行参数”的详细信息,请参阅<a href="https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-batch-code.html#your-algorithms-batch-code-how-containe-serves-requests" rel="nofollow noreferrer">here</a>文档中的“优先顺序”。在</p>
<p>除了控制有效负载大小外,您的其他转换作业参数选择(<code>SplitType=RecordIO</code>和<code>BatchStrategy=MultiRecord</code>)对于传递RecordIO Protobuf数据看起来是正确的。在</p>