为nlp任务下载和预处理数据

nlprep的Python项目详细描述


特色

  • 处理超过100个数据集
  • 生成已处理数据集的统计报表
  • 支持多种预处理方式
  • 提供一个面板,用于在运行时输入参数
  • 易于调整您自己的数据集和预处理实用程序

在线资源管理器

https://voidful.github.io/NLPrep-Datasets/

文件

docs了解更多信息。在

快速入门

通过pip安装

pip install nlprep

获取一个数据集

^{pr2}$

你也可以在googlecolab中尝试nlprep:Google Colab

概述

$ nlprep
arguments:
  --dataset     which dataset to use     
  --outdir      processed result output directory       

optional arguments:
  -h, --help    show this help message and exit
  --util        data preprocessing utility, multiple utility are supported 
  --cachedir    dir for caching raw dataset
  --infile      local dataset path
  --report      generate a html statistics report

贡献

谢谢你兴趣。那里有很多方法可以为这个项目做出贡献。开始here。在

许可证PyPI - License

图标参考

图标修改自Darius Danwww.flaticon.com网站
图标从Freepik修改www.flaticon.com网站在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Eclipse中使用ctrlshiftt而不是ctrlshiftr有什么好处?   java自动装箱概念SCJP   java如何使用JAXR和Resteasy、Angular和Wildfly10处理COR   java如何在整数数组中动态添加元素?   JAVA从继承生成器模式返回父对象继承   java问题调试生产者消费者问题   java MQ:已达到通道的最大实例数   JavaPowerMockMockito:我试图stubb的方法最终被调用   java Hibernate将多个列映射到一个表   在java中,将字符串中的单词大写,但跳过字符串中的数字和多余空格或符号   使用Eclipse将Java项目导出到JAR时出现“重复条目”错误   java使用eclipselink在实体表上指定NullConstraint   <Java>我可以在TCPIP中使用多个服务器socket吗?   带有自定义视图的java AlertDialog:调整大小以包装视图的内容   如何从用C#编写的web服务生成用于java的SOAP API?