擅长:python、mysql、java
<p>我不接受词干和柠檬化不起作用!您可以标记您的输入。然后获取词干,在营销的情况下,如果语言选择正确(检查词干分析包中的语言选择正确),您将获得市场。您还应该确保在if语句的两个元素上应用词干</p>
<p>如果存在听写问题或细微差异,您可以使用<a href="https://pypi.org/project/python-Levenshtein/" rel="nofollow noreferrer">Levenstein</a>包并接受类似于比率T的输入</p>
<p>例如:</p>
<pre><code>import nltk.stem.porter
p_stemmer = PorterStemmer()
print("the stem of marketing:",p_stemmer.stem('Marketing'))
print("the stem of marketing research:",p_stemmer.stem('Marketing Research'))
</code></pre>
<p>结果如下:</p>
<p><code>the stem of marketing: 'market' (correct)</code></p>
<p><code>the stem of marketing research: 'marketing research' (not want we want)</code></p>
<p>如您所见,如果未应用标记化,则词干分析器将无法按预期工作</p>
<p>我建议将所有这些结合起来(标记化、词干和levenstein)</p>