使用神经结构的端到端设置分析包
sentiment-analysis-csci-e89的Python项目详细描述
情感分析csci e89
此软件包旨在使用最先进的技术,使用户能够进行端到端的情感分析。
api假设一个公共数据模型,该模型在
文档。简言之,模块需要具有以下字段的表格数据集作为训练数据:
- 文本\u id
- 文本
- 标签
以及以下用于实时测试数据的字段:
- 文本\u id
- 文本
api包含5个主要模块:
- 数据清洗:一个为支持许多流行的机器学习数据集而编写的类。它清理原始数据并 以其他模块可以使用的方式构造它。在
- 预处理:一个类,提供许多高级函数来执行复杂的数据转换和清理。这个类负责为我们的神经结构准备原始文本数据。在
- 建模:提供许多方法的类,每个方法都专门用于训练某种类型的体系结构。有关所提供的每个体系结构的确切规范,请参阅文档。在
- pretrained_embeddings:一个类,它提供了一些方法,以netoworks可以使用的格式准备众所周知和流行的单词嵌入(glow和word2vec)。我们要求用户从适当的来源下载原始数据。文档中再次包含了详细信息。在
- predict\u newdata:一个类,提供使用我们经过训练的网络对实时数据进行预测的方法。我在这里定义的实时数据可以看作是测试数据,这些数据是在原始工作之外进行处理和准备的,而这些工作是针对我们的模型进行训练和验证的。在
许多不同的神经结构都提供了易于调用的方法,因此允许您用不超过几行的代码。一些其中的体系结构实现了迁移学习,并要求下载某些文件 本地的。
请参阅文档和教程脚本。
这本图里亚尔是一个jupyter笔记本的形式,一步一步地实现。请在这里找到:https://github.com/stefano10p/-sentiment_analysis_csci_e89-/tree/master/tutorial
安装
运行以下程序进行安装:
pipinstallsentiment-analysis-csci-e89
请从此处下载文档:
https://github.com/stefano10p/-sentiment_analysis_csci_e89-/tree/master/docs/_build/html
用每个html文件在您的计算机上创建一个本地目录。
你也可以从我的github下载这个包:https://github.com/stefano10p/-sentiment_analysis_csci_e89-
你会发现要求.txt克隆存储库时的文件。
在您的计算机上创建一个虚拟环境:
conda create——名称情感分析
激活环境并使用需求文件配置所有必要的依赖项。
conda激活情绪分析
pip安装-r要求.txt
您已经准备好使用软件包了。
谢谢您!
- 项目
标签: