将rdf数据建模为向量空间

rdfsim的Python项目详细描述


这个python库有助于从rdf中编码的非常大的层次结构生成向量空间。一个明显的示例应用程序是从skos层次结构或rdfs子类层次结构生成向量空间。

开始

运行测试:

$ nosetests

安装:

$ python setup.py install

示例使用

$ wget http://downloads.dbpedia.org/3.7/en/skos_categories_en.nt.bz2 $ bunzip2 skos_categories_en.nt.bz2 $ python >>> from rdfsim.space import Space >>> space = Space(‘skos_categories_en.nt’) >>> space.similarity_uri(category1, category2)

为整个dbpedia skos类别构造向量空间 Hierarchy(3M三倍)在一台普通笔记本电脑上需要几分钟, 内存占用约500万。

或者,它的一个子集可以在examples/目录中找到。

工作原理

对于层次结构中的每个主题t,我们考虑其父主题集 在k层上的父(t,k)。我们为空间中的每个t构造一个向量 其中每个维度对应于层次结构中的主题d。价值 尺寸d上的t的定义如下:

t_d = sum_{k = 0}^{max_depth} sum_{d in parents(t, k)} decay^k

其中max_depth和decay是两个参数,可以用来影响 我们有多重视 类别层次结构。

它们可以指定如下:

>>> Space.max_depth = 8
>>> Space.decay = 0.9

许可条款和作者

请参阅“复制”和“作者”文件。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java测试访问令牌过滤器   close()上的java Apache POI运行时异常   java为什么Eclipse中的GWT总是显示错误404?   java从socket python服务器接收消息   java mediaRecorder:start()函数失败   不关闭DB连接可能是Tomcat上Java堆溢出的原因吗?   java JFrame无法关闭   java BigQuery加载本地文件不起作用,位置有问题   java可以在递归任务中使用吗?   servlets如何从JSESSIONID加载Java HttpSession?   java将JFileChooser与PDFBox一起使用时,文件不会另存为pdf,但保存时不带扩展名   java将处理结果存储在表中   java算法发现循环世界中重叠间隔的持续时间(24小时)   在windows 10上双击Eclipse安装程序可执行文件(eclipseinstjrewin64.exe)后,java不会发生任何事情   java编译和部署自定义Solr请求处理程序   Java/Android崩溃ApacheCommonsio2。4.jar   spring web应用程序中的java集成收件箱功能   java Grizzly、Jersey和Spring自动布线问题   java如何在pom中添加jar文件依赖项。xml   关于Android中大量GUI更新编码的java概念(GUI处理程序)