尝试在gensim中创建doc2vec模型时键入错误

2024-10-01 04:54:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用gensim训练Doc2Vec模型

我使用的数据集是20个新闻组数据集[1],它包含在sklearn的数据集模块中

我使用了gensim文档中的示例来创建模型

docs = newsgroups_train['data']
enumerated_docs = enumerate(docs)
documnets= [TaggedDocument(doc.split(),i) for i, doc in enumerated_docs]
model = Doc2Vec(documnets, vector_size=20, window=2, min_count=30, workers=4)

我检查了每一行代码,所有的代码似乎都与初始化模型的代码行一致

我得到一个类型错误: TypeError: 'int' object is not iterable

[1]https://scikit-learn.org/0.19/datasets/twenty_newsgroups.html


Tags: 模块数据代码文档模型docsdocsklearn
1条回答
网友
1楼 · 发布于 2024-10-01 04:54:03

Enumerate返回整数计数器和列表中的值。因此,在第三行代码中,i是一个整数。但是,TaggedDocument函数的第二个参数应该是iterable

相关问题 更多 >