擅长:python、mysql、java
<p>我真的很想对已经接受的回复做一个评论,但是我似乎没有足够的要点来这样做,因为这是一个要求澄清的单独的答复道歉。在</p>
<p>我现在正试图做完全相同的事情,但我的问题是,在使用多值标记时,我似乎无法像本问题中那样训练模型。特别是(仅为演示目的使用荒谬的值):</p>
<pre><code>MyDocs = namedtuple('MyDocs', 'words tags')
# some processing, an element of my_docs ends up looking like:
# MyDocs(words=['some', 'parsed', 'text'], tags=['tag_0_i', 'tag_1_j'])
model = Doc2Vec(dm=1, size=3, window=3, dm_concat=1, negative=5, hs=0, sample=1e-5)
model.build_vocab(my_docs)
# model.docvecs.doctag_syn0[0] is
# array([0.00338327, 0.8583702, -0.00845612])
doc_list = my_docs[:]
alpha_0, alpha_1 = 0.050, 0.001
for epoch in range(10):
shuffle(doc_list)
model.train(doc_list, total_examples=model.corpus_count, epochs=1)
# model.docvecs.doctag_syn0[0] is still:
# array([0.00338327, 0.8583702, -0.00845612])
</code></pre>
<p>你知道我做错了什么吗?在</p>