擅长:python、mysql、java
<p>猜测它只是一个不同的,更好的实现,如果实现不同,你不应该期望相同的结果。在</p>
<p>一般来说,在GPU上有效地实现一个算法是非常困难的,要获得最大的性能需要特定于体系结构的实现。因此,如果一个特定于Nvidia的gpu的实现比gpu的一般实现具有更高的性能也就不足为奇了。与致力于CNN一般实现的团队相比,Nvidia将投入更多的资源来加速gpu的代码,这也就不足为奇了。在</p>
<p>另一种可能是后端使用的数据类型已从双精度浮点更改为单精度甚至半精度浮点。较小的数据类型意味着您可以更快地处理更多的数字,但以准确性为代价。对于神经网络应用来说,这通常是可以接受的,因为没有一个单独的数字需要特别精确的网络产生可接受的结果。在</p>