CPU上的矩阵乘法（numpy）和GPU上的矩阵乘法（gnumpy）给出了不同的结果

import gnumpy as gpu import numpy as np n = 400 a = np.random.uniform(low=0., high=1., size=(n, n)).astype(np.float32) b = np.random.uniform(low=0., high=1., size=(n, n)).astype(np.float32) ga = gpu.garray(a) gb = gpu.garray(b) ga = ga.dot(gb) a = a.dot(b) print ga.as_numpy_array(dtype=np.float32) - a

[[ 1.52587891e-05 -2.28881836e-05 2.28881836e-05 ..., -1.52587891e-05 3.81469727e-05 1.52587891e-05] [ -5.34057617e-05 -1.52587891e-05 0.00000000e+00 ..., 1.52587891e-05 0.00000000e+00 1.52587891e-05] [ -1.52587891e-05 -2.28881836e-05 5.34057617e-05 ..., 2.28881836e-05 0.00000000e+00 -7.62939453e-06] ..., [ 0.00000000e+00 1.52587891e-05 3.81469727e-05 ..., 3.05175781e-05 0.00000000e+00 -2.28881836e-05] [ 7.62939453e-06 -7.62939453e-06 -2.28881836e-05 ..., 1.52587891e-05 7.62939453e-06 1.52587891e-05] [ 1.52587891e-05 7.62939453e-06 2.28881836e-05 ..., -1.52587891e-05 7.62939453e-06 3.05175781e-05]]

import gnumpy as gpu import numpy as np a=np.array([1.907607,-.7862027, 1.147311, .9604002], dtype=np.float32) b=np.array([-.9355000, -.6915108, 1.724470, -.7097529], dtype=np.float32) ga = gpu.garray(a) gb = gpu.garray(b) ga = ga.dot(gb) a = a.dot(b) print "CPU", a print "GPU", ga print "DIFF", ga - a >>>CPU 0.0559577 >>>GPU 0.0559577569366 >>>DIFF 8.19563865662e-08

2条回答

网友

1楼 · 编辑于 2024-09-21 05:32:27

RTX卡的浮点精度为半，因为它的图像渲染速度更快。你必须告诉GPU在为AI乘法浮点时使用全精度。做人工智能时，精确性是非常重要的。

我经历了同样的浮点差异，你在尝试使用Cuda与一个RTX2080TI。

网友

2楼 · 编辑于 2024-09-21 05:32:27

我建议使用np.allclose来测试两个浮点数组是否几乎相等。

虽然您只看到两个结果数组中的值之间的绝对差异，np.allclose还考虑了它们的相对差异。例如，假设输入数组中的值大1000倍，那么两个结果之间的绝对差异也会大1000倍，但这并不意味着两个点积的精度会降低。

np.allclose将返回True，前提是您的两个测试数组中的每个对应元素对都满足以下条件，a和b：

abs(a - b) <= (atol + rtol * abs(b))

默认情况下，rtol=1e-5和atol=1e-8。这些公差是一个很好的“经验法则”，但它们是否足够小取决于您的具体应用。例如，如果您处理的是值<；1e-8，那么1e-8的绝对差将是一场彻底的灾难！

如果尝试对两个具有默认公差的结果调用np.allclose，则会发现np.allclose返回True。那么，我的猜测是，这些差异可能很小，不值得担心。这真的取决于你对结果做了什么。

相关问题更多 >

编程相关推荐

热门问题

热门文章