擅长:python、mysql、java
<p>我建议您使用sklearn的tfidf向量化器(<a href="https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html" rel="nofollow noreferrer">https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html</a>)。它支持ngrams,并且内存使用效率高。您可以轻松地将矢量器传递给任何sklearn分类器以构建分类模型</p>