在Python中使用gensim在Tweets上运行LDA时出错

import logging, gensim, bz2 logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) # load id->word mapping (the dictionary), one of the results of step 2 above id2word = 'enams4nieuw.dict' # load corpus iterator mm = gensim.corpora.MmCorpus('enams4nieuw.mm') print(mm) # extract 100 LDA topics, using 1 pass and updating once every 1 chunk (10,000 documents) lda = gensim.models.ldamodel.LdaModel(corpus=mm, id2word=id2word, num_topics=100, update_every=1, chunksize=10000, passes=1)

2条回答

网友

1楼 · 编辑于 2024-10-02 10:23:17

将变量id2word设置为字符串。在

看来你有一个文件名我猜你把字典弄脏了？在

id2word需要是字典。在

网友

2楼 · 编辑于 2024-10-02 10:23:17

我也犯了同样的错误，看起来ldamodel.py尝试获取关键字的最大值而不是索引/ID的最大值，所以我的解决方案是简单地交换dict中的列

my_dict2 = {y:x for x,y in my_dict.items()}

编程相关推荐

java Android Studio |在下一个活动出现之前等待一段时间（Startscreen）
java为什么我们可以在子类构造函数中调用超类方法？
java如何修复膨胀类Android的错误。支持v7。小装置。卡德维尤
Android Java：图像视图太多？
java SonarQube Gradle插件警告：“未找到类：org.joda.convert”
java构建规范。Spring启动项目的yml文件
java为什么我的libGDX小程序会产生这种安全异常？
java Spring引导冷启动
swing Java Jpanel缩放按钮（netbeans 7.4 Gui Builder）
java无法将图像上载到firebase

相关问题更多 >

编程相关推荐

热门问题

热门文章