如何将多个文件的输出传递到一个数组

# URDU STOP WORDS REMOVAL doc_clean = [] stopwords_corpus = UrduCorpusReader('./data', ['stopwords-ur.txt']) stopwords = stopwords_corpus.words() count = 1 # print(stopwords) for infile in (wordlists.fileids()): words = wordlists.words(infile) finalized_words = remove_urdu_stopwords(stopwords, words) doc_clean[count] = finalized_words print(doc_clean) count =count+1 print("\n==== WITHOUT STOPWORDS ===========\n") print(finalized_words) id2word = corpora.Dictionary(doc_clean) mm = [id2word.doc2bow(text) for text in texts] lda = models.ldamodel.LdaModel(corpus=mm, id2word=id2word, num_topics=3, update_every=1, chunksize=10000, passes=1)

2条回答

网友

1楼 · 编辑于 2024-06-26 18:00:26

您将doc\u clean定义为空列表，但在第一次迭代中，您引用doc\u clean[count]，count=1，因此引用空列表的第二个元素。你知道吗

更换

doc_clean[count]=finalized_words

与

doc_cleanappend(finalized_words)

那就不用计数了。你知道吗

网友

2楼 · 编辑于 2024-06-26 18:00:26

这里不需要使用count变量。List提供append函数将元素添加到列表中。
改变这个

  doc_clean[count] = finalized_words

为了这个

 doc_clean.append(finalized_words)

相关问题更多 >

编程相关推荐

热门问题

热门文章