TypeError:“int”和“str”的实例之间不支持“<”,不理解

2024-10-04 01:28:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在创建一个用于情绪分析的机器学习算法,但是一直遇到这个错误

TypeError: '<' not supported between instances of 'int' and 'str'

我也看到了其他问题,但只有一种解决方法,比如“TypeError:”<;“在'str'和'int'实例之间不支持”

train_data = "C:/Users/User/Abhinav/TrumpStuff/trumpwords.csv"
Xwords = pd.read_csv(train_data, usecols=[2], header=None)
ywords_pos = pd.read_csv(train_data, usecols=[3], header=None)
ywords_neg = pd.read_csv(train_data, usecols=[4], header=None)
ywords_bad = pd.read_csv(train_data, usecols=[5], header=None)

count_vect = CountVectorizer()
Xtrain_counts = count_vect.fit_transform(getStringArray(Xwords))
tfidf_transformer = TfidfTransformer()
Xtrain_tfidf = tfidf_transformer.fit_transform(Xtrain_counts)

clf_positive = MultinomialNB().fit(Xtrain_tfidf, ywords_pos)
clf_negative = MultinomialNB().fit(Xtrain_tfidf, ywords_neg)
clf_bad = MultinomialNB().fit(Xtrain_tfidf, ywords_bad)

"""
 My data is from https://data.world/lovesdata/trump-tweets-5-4-09-12-5-16/workspace/file?filename=trumpwords.xlsx
"""

我希望代码运行并给我一个情绪,但目前,我无法克服这个错误。错误如下:

^{pr2}$

Tags: csvnonereaddata错误trainfittfidf
1条回答
网友
1楼 · 发布于 2024-10-04 01:28:32

您使用CountVectorizer对数据进行矢量化,然后将结果用于TfIdfVectorizer。不能为TfIdfVectorizer提供整数数据。如果要使用TfIdfVectorizer,则直接在文本中使用它。CountVectorizer和{}是两种不同的方法,可以将文本数据矢量化,这些数据可以输入到模型中。我建议你仔细阅读一下,了解它的作用。在

希望有帮助!在

相关问题 更多 >