2024-09-30 04:37:27 发布
网友
是否有操作out of core的产生式规则系统的实现?
我已经检查过像CLIPS和Jess这样的开源实现,但它们只在内存中运行,因此在处理大量事实和规则(例如数十亿/万亿)时,它们往往会崩溃或强制进行重磁盘交换。
我在考虑是否可以使用Django的ORM将一个简单的规则引擎,比如Pychinko移植到SQL后端。然而,支持CLIPS中的功能级别将是非常重要的,我不想重新设计轮子。
有没有其他方法可以扩展生产规则系统?
您可以检查JENA和类似的RDF规则引擎,这些引擎设计用于处理非常大的事实数据库。在
这不是对你问题的直接回答,但它可能会给你一条解决问题的思路。在
早在80年代和90年代,我们部署了一个信息检索系统,允许大量的长期查询。具体地说,我们有64MB内存的系统(在那些日子里是一个buttload),每天接收超过一百万条消息,并对该流应用10000到10000+个持续查询。在
如果我们所做的只是针对最新的文档迭代地应用每个常设查询,那么我们将是死肉。我们所做的是执行一种inversion的查询,特别是确定查询中的必须有和可能有的术语。然后我们使用文档中的术语列表来查找那些有可能成功的查询。客户学会了创建具有强大差异性的查询,因此,有时只需要对10或20个查询进行全面评估。在
我不知道你的数据集,也不知道你的规则是什么样子的,但也许有类似的东西你可以试试。在
您可以检查JENA和类似的RDF规则引擎,这些引擎设计用于处理非常大的事实数据库。在
这不是对你问题的直接回答,但它可能会给你一条解决问题的思路。在
早在80年代和90年代,我们部署了一个信息检索系统,允许大量的长期查询。具体地说,我们有64MB内存的系统(在那些日子里是一个buttload),每天接收超过一百万条消息,并对该流应用10000到10000+个持续查询。在
如果我们所做的只是针对最新的文档迭代地应用每个常设查询,那么我们将是死肉。我们所做的是执行一种inversion的查询,特别是确定查询中的必须有和可能有的术语。然后我们使用文档中的术语列表来查找那些有可能成功的查询。客户学会了创建具有强大差异性的查询,因此,有时只需要对10或20个查询进行全面评估。在
我不知道你的数据集,也不知道你的规则是什么样子的,但也许有类似的东西你可以试试。在
相关问题 更多 >
编程相关推荐