seq2class是为使用lstm进行文本分类而开发的
seq2class的Python项目详细描述
Seq2Class是文本分类的一站式解决方案。使用序列模型(lstm)通过seq2class包简化了文本分类。这个包是通过利用lstm(长-短期内存)模型的功能构建的。
要求
Seq2Class支持Python3.6或更新版本。
安装
pip install seq2class
示例
这个软件包是为使用顺序模型进行文本分类而开发的。
data = 'movies.csv'
labels = 'title'
text = 'genres'
s = Sequence2class()
X_train, X_test, y_train, y_test = s.train_test_split(data, labels, text)
trained_model = s.fit_train(X_train, y_train, 500, 50, 7789, 5, 4)
prediction = s.predict(trained_model, X_test, y_train, 4)
其中movies.csv
是包含文本和标签的培训文件。
参考文献
数据集信息
[1] movies.csv dataset have been used for research purpose from this `*link* <http://files.grouplens.org/datasets/movielens/ml-latest-small.zip>`.