擅长:python、mysql、java
<p>有对齐和未对齐的加载指令。如果你违反了对齐规则,对齐的会出错,但是它们更快。未对齐的接收任何地址,并在内部进行加载/移位以获取所需的数据。您使用的是对齐版本<code>_mm256_load_ps</code>,并且可以切换到未对齐的版本<code>_mm256_loadu_ps</code>,而无需任何中间分配。在</p>
<p>一个好的矢量化编译器将包括一个导入循环以到达一个对齐的地址,然后是一个处理对齐数据的主体,然后是一个最后一个循环来清除任何偏离。在</p>