使用json/rdf对象图进行数据集成的库。

jsongraph的Python项目详细描述


#jsongraph[![构建状态](https://travis-ci.org/pudo/jsongraph.svg?branch=master)(https://travis ci.org/pudo/jsongraph)

给定一组异构的源记录,它将生成一组具有来自所有可用源的合并信息的复合实体。此外,它还允许使用
simple查询结果图,基于json的图形查询语言。

此工具的目的是通过简单的json对象无缝提供基于图形的数据集成系统
(基于rdf)。

所有项目信息的图表。这可以由一个
三重存储或一个内存结构来支持。
graph=graph(base_uri='file:///path/to/schema/files')
graph.register('person','person_schema.json')

加载有关个人的数据。
context=graph.context()
context.add('person',,数据)
context.save()
对各种源文件重复数据加载。


“limit”:5}]:
打印项['name']
```

一个“图形”可以只存在于内存中,也可以存储在后端
数据库中。
BR/>在“图表”中的所有数据都被构造为JSON对象的集合(即
嵌套字典、列表和值)。必须使用[json模式](http://json schema.org/)定义所有存储对象
的结构。某些限制
适用于此类架构,例如,它们可能不允许附加或模式属性。


这些
还包括元数据,例如数据源和系统在这些数据中应具有的信任级别。“context”通常对应于源数据文件或用户交互。

然后,他们可以在
单独的“上下文”中生成数据的合并版本。

此合并版本应用实体重复数据消除。对于跨多个“context”具有多个可用值的对象属性
,将选择最可靠的“context”中的信息


这很大程度上受到了google的[metaweb查询语言](http://mql.freebaseapps.com/ch03.html)的启发。
查询被写成json,搜索通过示例进行。搜索也可以是深嵌套的,遍历以任意复杂度存储在“图”中的对象之间的链接。对consolidated
``context``的查询将根据各种来源的数据生成反映最佳可用信息的响应


这将分三步进行:

*为给定的
``graph``中的所有实体生成一组重复数据消除候选对象。这些将是对象的简化表示,可以
输入到比较工具中(自动或与用户交互)。

*一旦确定了候选对象,它们将转换为类型(``original_fingerprint`->;``same_as_fingerprint``)。此类映射
应用于上下文。

*在图形合并(见上文)时,已映射到另一个的实体不包括在内。它们的所有属性都是由目标实体继承的。


“url”:“http://…”
}
}
````

要在安装了“virtualenv`
和“make`”的系统上执行,请键入:

``bash
$make test
``

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java只创建一次Springbean,即使多次调用也是如此   AmazonWeb服务如何在AWS工作区上运行Java代码而不使用键?   java Lwjgl安装错误   java从URL读取文本文件并输出到TextView   图论Java显示错误Java。lang.OutOfMemoryError   多线程Java多线程执行超过循环边界   java我怎样才能使这段代码只打印最终答案?   返回字符的Java方法抱怨没有返回字符。   java失败于ServiceSuccess方法?   mysql错误:java。util。ArrayList无法转换为java。串   Java解压在处理xlsx文件后退出   java在Windows Live服务中使用RestEasy时,如何解组返回的联系人列表?   java需要嵌套if的建议   java使用Set属性在JSP:UseBean中设置javascript变量值   java为什么在println时即使有值显示也会出现空指针异常?   任何使用系统的替代方案。在用Gradle构建的java控制台应用程序中?   使用泛型的方法的java单元测试   x509certificate在JAVA中如何将证书与CSR进行匹配