获取频率分布错误，类型错误：不可损坏类型：“list”

doc_clean = [] stopwords_corpus = UrduCorpusReader('./data', ['stopwords-ur.txt']) stopwords = stopwords_corpus.words() # print(stopwords) for infile in (wordlists.fileids()): words = wordlists.words(infile) print(infile) #print(words) finalized_words = remove_urdu_stopwords(stopwords, words) print("\n==== WITHOUT STOPWORDS ===========\n") print(finalized_words) doc_clean.append(finalized_words) fdist1 = FreqDist(doc_clean) print(fdist1)

1条回答

网友

1楼 · 发布于 2024-06-26 17:41:38

我猜您是想构建一个包含所有单词的列表（在清理之后），但是这行代码将每个列表的元素作为doc_clean的元素追加到中：

doc_clean.append(finalized_words)

基本上，FreqDist将计算列表中的不同元素，因此如果这些元素是列表，则有问题。要从所有文档中构建单词的单个列表，请将append()替换为extend()：

^{pr2}$

编程相关推荐

java JetXcel在关闭可写工作簿之前修改多个单元格
java saveMyProfile计算false 2次
java在安卓系统中如何在长时间内让现在和时间变得不同
java生成大小写字母
java set MainClass标头，带有来自mainClassName的渐变
java无法仅为此网站拖放selenium
java如何使HttpURLConnection从servlet响应中获取标头？
java如何将cachecontrol添加到@RestController servlet路径？
java如何在jasper report中调用实体方法？
java中的“<<”运算符

相关问题更多 >

编程相关推荐

热门问题

热门文章