BLAS sgemm/dgemm如何工作?

2024-09-30 01:19:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图利用BLAS中的函数sgemm,使用python中的ctypes。尝试求解C=A x B以下代码可以正常工作:

no_trans = c_char("n")
m = c_int(number_of_rows_of_A)
n = c_int(number_of_columns_of_B)
k = c_int(number_of_columns_of_A)
one = c_float(1.0)
zero = c_float(0.0)

blaslib.sgemm_(byref(no_trans), byref(no_trans), byref(m), byref(n), byref(k),
               byref(one), A, byref(m), B, byref(k), byref(zero), C, byref(m))

现在我想解这个方程:C=A'xa,其中A'A的转置,下面的代码运行正常,但返回的结果是错误的:

^{pr2}$

对于一个测试,我插入了一个矩阵a=[12;34]。正确的结果是C=[1014;1420],但是sgemm例程会抛出C=[511;1125]。在

据我所知,矩阵A不必被我转置,因为算法会处理它。在第二种情况下传递参数有什么问题?在

任何帮助,链接,文章,建议是感激!在


Tags: columnsof函数no利用numbertrans矩阵

热门问题