树状图原型语篇生成器

DPD的Python项目详细描述


树状图原型语篇分析

根据[Harris,1954]和[Rubenstein and Goodenough,1965],自然语言中的单词是在语言环境(如句子、段落)中构造的,在这种情况下,具有相似含义的单词往往共享相似的上下文。这一假设被称为分布假设,它表明一个语料库通常由各种话语语境构成,每一个语境都是一组扩展的语言环境,传达相似/相关的概念和话题。尽管这一理论出现于1954年的语言学领域,但最近在许多其他领域,如认知科学(如[McDonald and Ramscar,2001])和自然语言处理(如[Mikolov et al.,2013a])受到了越来越多的关注。这个假设是我们方法的基本原则。我们的方法旨在将一个大的语料库建模为一组所谓的dp语篇,然后将它们作为典型的演讲进行研究。要做到这一点,核心步骤是建立一个共享相似的非草书上下文的单词群。这是通过字嵌入和子空间聚类实现的,但也可以使用其他数据挖掘技术。然后,采用层次聚类算法,将簇内词表示为树状图原型语篇(dp语篇)。最后,dp语篇表现出足够的可理解性,可以用charaudeau的方法进行研究,也可以用其他的语篇分析方法进行分析。

安装

安装生成器的最简单方法是使用python的包安装程序pip。 键入命令:

pip install DPD

教程

查看jupyter笔记本教程tutorials/tutorial1.ipynb了解基本用法说明

许可证

本项目属于GNU通用公共许可(2007年6月29日第3版)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java附加两个数组   java如何在Extjs的不同页面中使用相同的存储   java Jung,大顶点的布局重叠,图形出现在奇怪的位置   java如何在Android中通过画布绘制圆?   java验证库设计模式选择   java研磨机未知标记“timedTests”   java Android领域子类实例方法   java使用resteasy/jaxrs从请求负载接收两种类型的数据   缓冲策略Java缓冲策略有时不能正确绘制   java跟踪棋子   密度无关像素如何在java中锐化图像缩略图?   java如何在MongoDB更新查询中编写(或)更新   java A*寻路游戏系统退出问题   java在安卓中读取xml的最佳方式是什么?   通过反射调用的方法的java抑制警告   安卓 java。语言错误:信号11(SIGSEGV),代码10(?),故障地址006e006f   java lombok 1.18.2使用DexBuilderForDebug抛出TransformClasses   java JOptionPane CD对话框按钮?   java只返回json中的一些值,而不是完整实体对象   java包不存在错误,请稍后重试