我正在创建一个用于情绪分析的机器学习算法,但是一直遇到这个错误
TypeError: '<' not supported between instances of 'int' and 'str'
我也看到了其他问题,但只有一种解决方法,比如“TypeError:”<;“在'str'和'int'实例之间不支持”
train_data = "C:/Users/User/Abhinav/TrumpStuff/trumpwords.csv"
Xwords = pd.read_csv(train_data, usecols=[2], header=None)
ywords_pos = pd.read_csv(train_data, usecols=[3], header=None)
ywords_neg = pd.read_csv(train_data, usecols=[4], header=None)
ywords_bad = pd.read_csv(train_data, usecols=[5], header=None)
count_vect = CountVectorizer()
Xtrain_counts = count_vect.fit_transform(getStringArray(Xwords))
tfidf_transformer = TfidfTransformer()
Xtrain_tfidf = tfidf_transformer.fit_transform(Xtrain_counts)
clf_positive = MultinomialNB().fit(Xtrain_tfidf, ywords_pos)
clf_negative = MultinomialNB().fit(Xtrain_tfidf, ywords_neg)
clf_bad = MultinomialNB().fit(Xtrain_tfidf, ywords_bad)
"""
My data is from https://data.world/lovesdata/trump-tweets-5-4-09-12-5-16/workspace/file?filename=trumpwords.xlsx
"""
我希望代码运行并给我一个情绪,但目前,我无法克服这个错误。错误如下:
^{pr2}$
您使用}是两种不同的方法,可以将文本数据矢量化,这些数据可以输入到模型中。我建议你仔细阅读一下,了解它的作用。在
CountVectorizer
对数据进行矢量化,然后将结果用于TfIdfVectorizer
。不能为TfIdfVectorizer
提供整数数据。如果要使用TfIdfVectorizer
,则直接在文本中使用它。CountVectorizer
和{希望有帮助!在
相关问题 更多 >
编程相关推荐