为nlp任务下载和预处理数据

nlprep的Python项目详细描述


特色

  • 处理超过100个数据集
  • 生成已处理数据集的统计报表
  • 支持多种预处理方式
  • 提供一个面板,用于在运行时输入参数
  • 易于调整您自己的数据集和预处理实用程序

在线资源管理器

https://voidful.github.io/NLPrep-Datasets/

文件

docs了解更多信息。在

快速入门

通过pip安装

pip install nlprep

获取一个数据集

^{pr2}$

你也可以在googlecolab中尝试nlprep:Google Colab

概述

$ nlprep
arguments:
  --dataset     which dataset to use     
  --outdir      processed result output directory       

optional arguments:
  -h, --help    show this help message and exit
  --util        data preprocessing utility, multiple utility are supported 
  --cachedir    dir for caching raw dataset
  --infile      local dataset path
  --report      generate a html statistics report

贡献

谢谢你兴趣。那里有很多方法可以为这个项目做出贡献。开始here。在

许可证PyPI - License

图标参考

图标修改自Darius Danwww.flaticon.com网站
图标从Freepik修改www.flaticon.com网站在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
我可以用C++代码使用java代码吗?   java使用JSR303在派生类中提供更具体的约束   java在这个查找唯一路径数算法中我做错了什么?   java如何为2个不同的服务提供商使用2个不同的SSL证书?   java在Gridview上绘制文本   java使用连接for循环构建字符串名   java StringBuilder拆分无法处理某些文件   java事件关注EditText   Java Web Start“找不到URL的缓存资源”   java程序从命令行运行的速度比在Eclipse中慢   java为什么HttpServletRequest会截断#字符上的url输入?   java自定义折叠工具栏平滑标题大小调整   使用Mockito对安卓 java中调用另一个静态函数的函数进行单元测试   http在java客户机中使用cachecontrol头   java如何使用。是否使用Delimiter从输入文件中排除标点符号和数字?   使用上下文作为参数/参数的java   java更有效地从Jar中提取文件   java为多个JButton提供相同的actionListener