我正在用pyopenCL编写一个openCL内核,在这里我要处理向量元素。在
在普通C中,我想要的结果是:
int i = 0;
float *vec = (float*)maalloc(sizeof(float)*4);
for (i=0;i<4;i++)
{
vec[i]=2*i;
}
在openCL中,向量的元素是以“pythonic”点语法样式访问的。在
^{pr2}$
因此,vec[2]
在openCL中变成了{},因此用变量访问元素不再是简单的了。但是如何使用变量访问向量元素?在
Tags:
OpenCL对主机端组件和设备端组件(内核)都支持C,因此您可以使用
float
数组编写与第一个示例几乎完全相同的内核。内核可能如下所示:然后,可以指定要使用的线程数,以便对数组的每个元素执行此操作(使线程数与数组中的元素相同)。在
OpenCL确实允许使用点表示法进行访问,但这是为了访问vector data types的元素。向量数据类型可以提供更好的性能,因为可以同时对向量数据类型中的所有元素执行相同的操作。在
例如,
float4
是一种向量数据类型,它相邻存储四个32位浮点,以构成一个128位结构。然后可以一次对所有4个浮动执行操作。在例如:
^{pr2}$它需要一条指令同时进行四次乘法运算。
mult_result
的值是{2.0f, 4.0f, 6.0f, 8.0f}
。在然后可以使用点表示法访问
float4
变量的组件,例如:以下是向量数据类型的摘要:Vector Data Type Overview。在
相关问题 更多 >
编程相关推荐