Python中文
首页
教程
问答
标签
搜索
登录
注册
神经机器翻译中的加权加权
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想把解码器的<code>embedding</code>层和<code>next_word</code>预测层的权重联系起来。嵌入尺寸设置为300,解码器的隐藏尺寸设置为600。NMT中目标语言的词汇量为50000,因此嵌入权重维为<code>50000 x 300</code>,预测下一个单词的线性层的权重为<code>50000 x 600</code>。在</p> <p>那么,我该怎么系呢?在这种情况下,实现配重的最佳方法是什么?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>在应用共享投影之前,可以使用线性层将600维空间向下投影到300维。这样,您仍然可以获得这样的优势:整个嵌入(可能)对于每一个小批量都有一个非零梯度,但有可能稍微增加网络的容量。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何为此数据帧创建散点图?
1 回答
如何为此编写Django模板
5 回答
如何为此表达式编写正则表达式?
1 回答
如何为步进电机选择合适的值?
3 回答
如何为每15分钟间隔的日期时间行(在新列中)添加标签?
7 回答
如何为每一列创建汇总表?
7 回答
如何为每一组groupbyPandas做滚动“得到假人”
3 回答
如何为每一行分别运行函数(python)?
8 回答
如何为每一行生成一个随机数?
5 回答
如何为每一轮将pytorch模型输出存储到numpy
10 回答
如何为每个.py-fi文件创建单独的zip文件
7 回答
如何为每个<li class=”“><a>找到最近的上述同级<li>?
7 回答
如何为每个CSV列生成特定的文件?
10 回答
如何为每个csv文件使用read_csv,即使它是空的?PythonPandas
3 回答
如何为每个CSV文件创建单独的Pandas数据帧并给它们起有意义的名称?
5 回答
如何为每个datetime和每个id创建一行?
1 回答
如何为每个Django型号选择赋予不同的颜色
6 回答
如何为每个Django模型实例安排一个周期性的芹菜任务?
6 回答
如何为每个Django视图设置一个装饰器?
4 回答
如何为每个for循环迭代分配变量
8 回答