如何使用numpycapi正确创建numpy字符串数组

2024-06-26 00:25:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在一个C扩展模块中创建一个由字符串组成的numpy数组。我说不出我做错了什么,在这一点上我尝试了各种各样的方法。我的主要问题是,我创建了一个固定大小的字符串类型数组,其中固定大小实际上是最大大小,但字符串是以空结尾的c字符串。 问题是,当我打印出ive返回的数组时,它打印的是整个固定长度,而不是使用空终止符,即:

b'PZYJKT\x00A\x04' b'PZYJKBT\x00\x04' b'PZYJKBT\x00\x04'

而不是

b'PZYJKT' b'PZYJKBT' b'PZYJKBT'

我在这个例子中设置了dtype=“S13”。如果我在本机python中执行相同的操作,则一切正常:

>>> import numpy as np
>>> np.array( [ 'PZYJKT', 'PZYJKBT', 'PZYJKBT' ], dtype = 'S13' )
array([b'PZYJKT', b'PZYJKBT', b'PZYJKBT'], dtype='|S13')

尽管在内部它看起来像我的字符串数组一样表示:

^{pr2}$

我只注意到,如果我对整个固定字符串进行零初始化,那么它的工作方式似乎与python类似。是不是numpy查看了整个字符串中的lastnull终止符?在

编辑:im用于创建数组的代码:

template<size_t N>
PyObject * as_nparray( char * data )
{
    npy_intp dims[1]{ ( npy_intp ) buffer.size() };

    bp::str date_type = ( "S"s + std::to_string( N ) ).c_str();
    PyArray_Descr *descr;
    PyArray_DescrConverter( date_type.ptr(), &descr );
    return PyArray_NewFromDescr( &PyArray_Type, descr, 1, dims, NULL, data, NPY_ARRAY_OWNDATA, NULL );
}

我还想补充一下,我发现这篇文章似乎暗示了我的怀疑,numpy字符串应该是null填充的而不是null结尾: https://mail.scipy.org/pipermail/numpy-discussion/2014-July/070637.html


Tags: 字符串numpyas结尾np数组arraydtype