擅长:python、mysql、java
<p>好的,<br/>
我想出了一个方法:<code>Cuda Toolkit 3.1</code>提供了openCL的评测(更高版本不会)。从这个包中使用<code>compute visual profiler</code>,它是<code>(computeprof.exe)</code>。它可用于windows和linux <a href="https://developer.nvidia.com/cuda-toolkit-31-downloads" rel="nofollow noreferrer">here</a>,并可与新的Cuda工具包一起安装。<br/>
看起来像这样:</p>
<p><img src="https://i.stack.imgur.com/OZoqL.png" alt="Timings"/>
<img src="https://i.stack.imgur.com/LZxeA.png" alt="Total time histogram"/>
<img src="https://i.stack.imgur.com/VAYum.png" alt="Hist 2"/>
<img src="https://i.stack.imgur.com/wkPOk.png" alt="Hist 3"/></p>
<p>我希望这对其他人也有帮助。在</p>