使用性能更好的python创建数据集列表

2024-10-03 23:29:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个由C/C++函数作为行组成的数据集。我想得到每个函数,将它们拆分,并创建一个单词列表(a)。并将该列表A放到列表B中,作为python中的列表列表

到目前为止,我一直在使用它,但我的数据集有128312项,而且速度很慢

我们能改进这个吗?如果是,我愿意接受建议

functionSourceDF = hdf.get('functionSource')

.
.
.

FSDarray = []
for i in range(0,size):
    FSDarray.append(functionSourceDF[i].split(" "))
FSDarray = np.array(FSDarray)

多谢各位


Tags: 数据函数in列表forsizegetrange
1条回答
网友
1楼 · 发布于 2024-10-03 23:29:34

实际上,您可以使用numpy解决此类问题

import numpy as np
a = ["This is a test", "of numpy", "splitting words"]
a = np.array(a)
a = np.char.split(a)
print(a)

输出

[列表(['This','is','a','test'])列表(['of','numpy'])) 列表(['spliting','words'])]

相关问题 更多 >