对数据帧的自然语言处理支持。

text-extensions-for-pandas的Python项目详细描述


熊猫数据帧的自然语言处理支持。在

Documentation Status

Pandas的文本扩展将extension types添加到Pandas数据帧中,以表示自然 语言数据,以及用于处理这些扩展的函数库 类型。在

特点

SpanArray:Pandas扩展类型,用于文本

span
  • 将要素与文档区域相连接
  • 可视化NLP应用程序的内部数据
  • 分析模型的准确性
  • 综合多个模型的结果

TensorArray:张量

的Pandas扩展类型
  • 代表伯特嵌入熊猫系列
  • 在Pandas系列中存储logit和其他特征向量
  • 将整个时间序列存储在熊猫系列的每个单元格中

流行NLP工具包的Pandas前端

文件

有关如何使用库的示例,请查看中的笔记本 this directory。在

API文档可以在https://text-extensions-for-pandas.readthedocs.io/en/latest/找到

源代码

Pandas文本扩展的源代码可以在https://github.com/CODAIT/text-extensions-for-pandas上找到。在

我们欢迎代码和文档贡献!参见README file 更多关于贡献的信息。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何从IBM MQ的JMSException检测可恢复错误   java Lucene6。4.2:找不到类,尝试添加查询。   Java Pdf差异库   在Java中多线程处理我的线程   java将字符串传递给Uri。下载中的parse()   java在列表中查找原语位置   java JPA条件从另一个查询中选择   java中的强制转换和转换   java如何在没有上下文的情况下获取SOAP Web服务(Apache Axis 1.4)的调用客户端的IP地址   java Android IllegalBlockSizeException:解密中最后一个块未完成   java Jersey是否要自定义无效资源路径的错误处理?   如何将JavaCVS web项目转换为基于maven的web项目?   java如何检查通用列表是否与jUnit相等?   arraylist java。util。尝试使用迭代器时发生ConcurrentModificationException错误   使用springsecurity,jsp上的java${u csrf.token}始终为空   sql使用java从临时表中选择数据   spring验证中的java@Notnull和@Pattern无效   java如何使用jQuery将包含对象数组的对象数组传递给Spring MVC控制器?