带word2的文本的多标签

def clean(sentence, model): regex = re.compile('[%s]' % re.escape(string.punctuation)) tokens = str.split(sentence) cleans = [] for t in tokens: if t in model: cleans.append(t) elif t.lower() in model: cleans.append(t.lower()) elif regex.sub('_', t) in model: cleans.append(regex.sub('_', t)) elif len(str.split(regex.sub(' ', t))) > 1: for token in str.split(regex.sub(' ', t)): if clean(token): cleans.append(clean(token)[0]) cleans = [w for w in cleans if w not in stopwords.words("english")] return cleans def model_similarity (model, list1, list2, l1neg=[], l2neg=[]): list1sum = sum([model[l] for l in list1]) list2sum = sum([model[l] for l in list2]) if l1neg: list1sum -= sum([model[l] for l in l1neg]) if l2neg: list1sum -= sum([model[l] for l in l2neg]) return 1-scipy.spatial.distance.cosine(list1sum,list2sum)

1条回答

网友

1楼 · 发布于 2024-09-30 14:16:23

请注意您编写的model_similarity（）的定义：

def model_similarity (model, list1, list2, l1neg=[], l2neg=[]):

python期望前三个参数是model、list1和list2。这些被称为位置参数，因为在定义中列出它们时，没有后面跟等号的名称（就像对l1neg和l2neg一样）。看来你忘了包括模型了。请参见位置与关键字参数：https://docs.python.org/2/glossary.html

您似乎还忘记在clean（）的调用中包含该模型。在

所以电话看起来像：

^{pr2}$

另外，请确保在所有函数定义之后缩进代码。看来可能还有其他问题。在

相关问题更多 >

编程相关推荐

热门问题

热门文章