用于doc2vec训练的doc2vec输入格式和python中的infer_vector（）

1条回答

网友

1楼 · 发布于 2024-10-03 09:20:26

TaggedLineDocument是一个方便类，它希望其源文件（或类似文件的对象）是空格分隔的标记，每行一个。（也就是说，你在第一个问题中称之为“案例1”。）

但是您可以编写自己的iterable对象作为documents作为gensimdocuments语料库，只要这个语料库（1）iterable返回next()对象，这些对象与TaggedDocument一样，具有words和{}列表；并且（2）可以多次迭代，因为Doc2Vec同时需要对初始词汇表调查和然后iter训练通过。在

infer_vector()方法接受标记列表，类似于单个TaggedDocument类对象的words属性。（也就是说，你在第二个问题中称之为“案例2”。）

编程相关推荐

java我在删除项目时在recycler视图中有一个bug
java Android应用程序错误：
java在Reader中打开PDF并等待它退出
json Java Jackson，使用Map<String，Object>编组类，而不访问类代码库
java反向操作
java url包含特殊字符
javagooglecalendarapi:com。谷歌。应用程序编程接口。客户古格里皮斯。json。谷歌JSONResponseException
java无法在XAMPP中运行mysqldump
JUnit 5中的java参数化beforeach/beforeAll
基于Java的OnCreate或Buttons之外的安卓编辑文本视图

相关问题更多 >

编程相关推荐

热门问题

热门文章

用于doc2vec训练的doc2vec输入格式和python中的infer_vector（）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >