2024-09-30 05:18:39 发布
网友
我有一个大的文本语料库(~170kB),我想训练一个NLP应用程序
然而,试图使列表的所有元素的列表与同一列表的所有其他元素一次配对一个,导致程序以退出代码137退出
def wordsToBigrams(words): totalSentenceBigrams = [(a,b) for b in words for a in words]
在构建该列表时,很可能内存不足。为了避免这种情况,请使用the ^{} library并在生成每个对时对其进行处理。或者将生成的对保存到文件以备以后使用
具体来说,使用product函数:
product
Equivalent to nested for-loops in a generator expression. For example, product(A, B) returns the same as ((x,y) for x in A for y in B).
product(A, B)
((x,y) for x in A for y in B)
编辑:是的,您的脚本需要大量内存-这是我的计算机上的内存消耗:
在构建该列表时,很可能内存不足。为了避免这种情况,请使用the ^{} library 并在生成每个对时对其进行处理。或者将生成的对保存到文件以备以后使用
具体来说,使用
product
函数:编辑:是的,您的脚本需要大量内存-这是我的计算机上的内存消耗:
相关问题 更多 >
编程相关推荐