Python中文
首页
教程
问答
标签
搜索
登录
注册
为什么Keras LSTM在CPU上的速度是GPU的三倍?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我使用<a href="https://www.kaggle.com/sbongo/for-beginners-tackling-toxic-using-keras" rel="nofollow noreferrer">this notebook from Kaggle</a>来运行LSTM神经网络。在</p> <p>我开始训练神经网络,我发现它太慢了。它几乎比CPU训练慢三倍。在</p> <ul> <li><code>CPU perfomance:</code>每历元8分钟</li> <li><code>GPU perfomance:</code>每历元26分钟。在</li> </ul> <p>在这之后,我决定在<a href="https://stackoverflow.com/questions/41972015/keras-lstm-on-cpu-faster-than-gpu">this question on Stackoverflow</a>中找到答案,并应用了<code>CuDNNLSTM</code><em>(它只在GPU上运行)</em>而不是<code>LSTM</code>。在</p> <p>因此,GPU性能变得<strong>每历元仅1min</strong>,模型精度下降3%。在</p> <p><strong>问题:</strong></p> <p>1)有人知道为什么在经典的<code>LSTM</code>层中GPU的工作速度比CPU慢吗?我不明白为什么会这样。在</p> <p>2)为什么当我使用<code>CuDNNLSTM</code>而不是{<cd4>}时,训练变得更快,模型的准确性降低了?在</p> <p>备注:</p> <p><code>My CPU:</code>英特尔酷睿i7-7700处理器(8M缓存,最高4.20GHz)</p> <p><code>My GPU:</code>英伟达GeForce GTX 1050 Ti(4 GB)</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>在Keras中,用CuDNN快速实现LSTM。在</p> <pre><code>model.add(CuDNNLSTM(units, input_shape=(len(X_train), len(X_train[0])), return_sequences=True)) </code></pre> <p>它只能在带有TensorFlow后端的<code>GPU</code>上运行。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
4 回答
如何添加表示整数的擦边字符串?
10 回答
如何添加要在Bokeh中使用的新font.ttf文件?
1 回答
如何添加要显示的矩阵XY轴编号和XY轴
3 回答
如何添加计数?
1 回答
如何添加计数器函数?
4 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
6 回答
如何添加计数器来跟踪while循环中的月份和年份?
8 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
4 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
4 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
9 回答
如何添加评论拉梅尔亚姆
2 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
7 回答
如何添加谷歌地点自动完成到Flask?
3 回答
如何添加超时、python discord bot
2 回答
如何添加超过1dp的检查
1 回答
如何添加距离方法
9 回答
如何添加跟随游戏的敌人精灵
1 回答
如何添加路径以便python可以找到程序?
1 回答
如何添加身份验证/安全性以使用happybase访问HBase?
3 回答