TypeError:“int”和“str”的实例之间不支持“<”，不理解

train_data = "C:/Users/User/Abhinav/TrumpStuff/trumpwords.csv" Xwords = pd.read_csv(train_data, usecols=[2], header=None) ywords_pos = pd.read_csv(train_data, usecols=[3], header=None) ywords_neg = pd.read_csv(train_data, usecols=[4], header=None) ywords_bad = pd.read_csv(train_data, usecols=[5], header=None) count_vect = CountVectorizer() Xtrain_counts = count_vect.fit_transform(getStringArray(Xwords)) tfidf_transformer = TfidfTransformer() Xtrain_tfidf = tfidf_transformer.fit_transform(Xtrain_counts) clf_positive = MultinomialNB().fit(Xtrain_tfidf, ywords_pos) clf_negative = MultinomialNB().fit(Xtrain_tfidf, ywords_neg) clf_bad = MultinomialNB().fit(Xtrain_tfidf, ywords_bad) """ My data is from https://data.world/lovesdata/trump-tweets-5-4-09-12-5-16/workspace/file?filename=trumpwords.xlsx """

1条回答

网友

1楼 · 发布于 2024-10-04 01:28:32

您使用CountVectorizer对数据进行矢量化，然后将结果用于TfIdfVectorizer。不能为TfIdfVectorizer提供整数数据。如果要使用TfIdfVectorizer，则直接在文本中使用它。CountVectorizer和{}是两种不同的方法，可以将文本数据矢量化，这些数据可以输入到模型中。我建议你仔细阅读一下，了解它的作用。在

希望有帮助！在

相关问题更多 >

编程相关推荐

热门问题

热门文章