为nlp任务下载和预处理数据
nlprep的Python项目详细描述
特色
- 处理超过100个数据集
- 生成已处理数据集的统计报表
- 支持多种预处理方式
- 提供一个面板,用于在运行时输入参数
- 易于调整您自己的数据集和预处理实用程序
在线资源管理器
https://voidful.github.io/NLPrep-Datasets/
文件
从docs了解更多信息。在
快速入门
通过pip安装
pip install nlprep
获取一个数据集
^{pr2}$概述
$ nlprep
arguments:
--dataset which dataset to use
--outdir processed result output directory
optional arguments:
-h, --help show this help message and exit
--util data preprocessing utility, multiple utility are supported
--cachedir dir for caching raw dataset
--infile local dataset path
--report generate a html statistics report
贡献
谢谢你兴趣。那里有很多方法可以为这个项目做出贡献。开始here。在
许可证
图标参考
图标修改自Darius Danwww.flaticon.com网站
图标从Freepik修改www.flaticon.com网站在
- 项目
标签: