MATLAB是Numpy的两倍

网友

1楼 · 编辑于 2024-05-19 16:09:53

你试图重新创建美国宇航局的实验，但是你已经改变了许多变量。例如：

你的硬件和操作系统是不同的（www.nccs.nasa.gov/dali_front.html）
您的Python版本不同（2.5.3与3.3）
你的MATLAB版本不同（2008年与2012年）

假设美国航天局的结果是正确的，结果的差异是由于这些变化的变量中的一个或多个。我建议你：

用SciPy预先构建的binaries重新测试。
研究是否对与此类计算相关的MATLAB进行了任何改进。

另外，您可能会发现this link很有用。

网友

2楼 · 编辑于 2024-05-19 16:09:53

由于缓存的缘故，这种比较最终变成了苹果对橘子的比较，因为在连续的内存块上传输或做一些工作更为有效。这个特定的基准是内存限制的，因为实际上没有计算，因此缓存命中率是获得良好性能的关键。

Matlab将数据按列主顺序（Fortran顺序）放置，因此a(:,:,k)是一个连续的内存块，复制速度很快。

Numpy默认为row major order（C order），因此在a[:,:,k]中元素之间有很大的跳跃，这会减慢内存传输。实际上，可以选择数据布局。在我的笔记本电脑中，使用a = np.asfortranarray(np.random.rand(5000,5000,3))LED创建阵列的速度提高了5倍（1s比0.19s）。

对于numpy MKL和普通numpy，这个结果应该非常相似，因为MKL是一个快速的LAPACK实现，在这里您不会调用任何使用它的函数（MKL在解决线性系统、计算点产品时绝对有帮助…）。

我真的不知道Gauss-Seidel解算器是怎么回事，但前一段时间我写了一个题为Numpy running at half the speed of MATLAB的问题的答案，其中谈到了MKL、FFT和Matlab的JIT。

网友

3楼 · 编辑于 2024-05-19 16:09:53

由于缓存的缘故，这种比较最终变成了苹果对橘子的比较，因为在连续的内存块上传输或做一些工作更为有效。这个特定的基准是内存限制的，因为实际上没有计算，因此缓存命中率是获得良好性能的关键。

Matlab将数据按列主顺序（Fortran顺序）放置，因此a(:,:,k)是一个连续的内存块，复制速度很快。

Numpy默认为row major order（C order），因此在a[:,:,k]中元素之间有很大的跳跃，这会减慢内存传输的速度。实际上，可以选择数据布局。在我的笔记本电脑中，使用a = np.asfortranarray(np.random.rand(5000,5000,3))LED创建阵列的速度提高了5倍（1s比0.19s）。

对于numpy MKL和普通numpy，这个结果应该非常相似，因为MKL是一个快速的LAPACK实现，在这里您不会调用任何使用它的函数（MKL在解决线性系统、计算点产品时绝对有帮助…）。

我真的不知道Gauss-Seidel解算器是怎么回事，但前一段时间我写了一个题为Numpy running at half the speed of MATLAB的问题的答案，其中谈到了MKL、FFT和Matlab的JIT。

相关问题更多 >

编程相关推荐

热门问题

热门文章