擅长:python、mysql、java
<p><strong>权重绑定:在<em>输入到嵌入层</em>和输出到softmax</em>层之间共享权重矩阵;也就是说,我们只使用一个权重矩阵,而不是使用两个权重矩阵。这样做的直觉是为了解决过度拟合的问题。因此,<em>权重捆绑</em>可以看作是一种正则化形式。在</p>
<p>这已在<a href="https://github.com/pytorch/examples/blob/master/word_language_model/model.py#L28" rel="nofollow noreferrer">word language model in PyTorch examples</a>中实现</p>