基于数据库中列表值中的外键筛选联接

2024-09-19 23:39:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是referencedb(2.3.5~0trusty)和python(2.7.6)以及python referencedb 绑定(2.3.0.post6),并尝试查询预先存在的数据库。 (请假设我无法更改正在使用的模式)

这是我遇到的问题的一个简化例子。你知道吗

表/etc的名称被移到了一个人们更常用的域中 但我的问题在结构上是等价的(而且更紧凑)。你知道吗

借款人

Schema: (borrower_id:key (primary), name :string, favourite_authors : list of author_id )

Sample data:
{ "borrower_id": "91a15585-f084-41b3-9df1-1a3b16a8daed",
  "name": "Jo",
  "favourite_authors" : [ "b9503702-8832-43c8-a3f0-34691635419a",
                          "3bae9a66-2de6-4c64-ae95-c5f7caad86bb",
                        ]
}
{ "borrower_id": "23a8a193-c32e-4332-a40b-2ba56d158205",
  "name": "Bob",
  "favourite_authors" : [ "41305d3b-2819-4af5-be62-3c7999c4d747",
                          "d270f08d-aab1-4644-8dea-8f4fdd2d80b4"
                        ]
}
{ "borrower_id": "01031fb0-35de-4324-af47-611fec9ca7ad",
  "name": "Sam",
  "favourite_authors" : [ "b9503702-8832-43c8-a3f0-34691635419a"
                        ]
}

作者

Schema: (author_id:key (primary), name :string, books_written : list of book_id )

Sample data:
{ "author_id": "b9503702-8832-43c8-a3f0-34691635419a",
  "name": "Joanna Smith",
  "books_written" : [ "c1a48e2e-a831-4f5b-95b2-9b429dcf34e5",
                      "8f0e89b6-78e8-45ec-b7db-9cf3e00e0a8d",
                    ]
}
{ "author_id": "3bae9a66-2de6-4c64-ae95-c5f7caad86bb",
  "name": "John Smith",
  "books_written" : [ "8f0e89b6-78e8-45ec-b7db-9cf3e00e0a8d",
                      "b9fb4de0-e3bd-4df1-b192-c9a0ae7fb2e1",
                    ]
}
{ "author_id": "41305d3b-2819-4af5-be62-3c7999c4d747",
  "name": "Jo Smith",
  "books_written" : [ "b9fb4de0-e3bd-4df1-b192-c9a0ae7fb2e1",
                      "37b6eb03-e8ea-43dc-b3e4-ffc0bbfb1154",
                    ]
}
{ "author_id": "d270f08d-aab1-4644-8dea-8f4fdd2d80b4",
  "name": "Jim Smith",
  "books_written" : [ "8f0e89b6-78e8-45ec-b7db-9cf3e00e0a8d",
                      "37b6eb03-e8ea-43dc-b3e4-ffc0bbfb1154",
                    ]
}

书籍

Schema: (book_id:key (primary), name:string, book_info: object, may contain a data
                                                        dict, that has a list of
                                                        repeatable metadata options...)

Sample data:
{ "book_id": "c1a48e2e-a831-4f5b-95b2-9b429dcf34e5",
  "name": "",
  "book_info" : {
      "data" : [
                { "tag": "sf },
                { "period" : "past"}
               ]
        }
}
{ "book_id": "8f0e89b6-78e8-45ec-b7db-9cf3e00e0a8d",
  "name": "",
  "book_info" : {
      "data" : [
                { "tag": "romance },
                { "period" : "present"}
               ]
        }
}
{ "book_id": "89b68f0e-78e8-45ec-b7db-9cf3e00e0a8d",
  "name": "",
  "book_info" : {
      "data" : [
                { "period" : "present"}
               ]
        }
}
{ "book_id": "b9fb4de0-e3bd-4df1-b192-c9a0ae7fb2e1",
  "name": "",
  "book_info" : {
      "data" : [
                { "tag": "sf },
                { "tag": "romance},
                { "period" : "present"}
               ]
        }
}
...
{ "book_id": "37b6eb03-e8ea-43dc-b3e4-ffc0bbfb1154",
  "name": "",
  "book_info" : {
      "data" : [
                { "tag": "sf },
                { "period" : "future"}
               ]
        }
}

现在,我要执行的公共查询等效于:

  • “你能给我一份所有借书人的名单吗 著有“sf”书籍“。。。你知道吗

注意:并不是所有的书都在图书信息的数据部分有标签选项。。。你知道吗

我正在尝试使用 重新思考DB的ReQL查询接口-我确信它可以做到这一点- 但我看不出一个明显的方法。你知道吗

我的出发点是研究一下DB的各种连接选项, 但是我看不到任何明显的方法来使用属性执行连接 它包含一个外键列表,而不仅仅是一个原子键。 (我通常会将外键放在 重复或有一个关系表,但正如我所说,我不能改变 结构(我有)

我更喜欢面向python的解决方案,但是javascript(或任何其他语言)会很方便,因为我可以转换:-)

欢迎提出任何建议。你知道吗


Tags: nameinfoiddatatagbooksauthorsauthor
1条回答
网友
1楼 · 发布于 2024-09-19 23:39:52

此代码(Javascript)将执行以下操作:

r.db("test").table("Borrowers").filter(function(borrower){ 
  return borrower("favourite_authors").setIntersection(r.db("test").table("Authors").filter(function(author){ 
    return author("books_written").setIntersection(r.db("test").table("Books").filter(function(book){ 
      return book("book_info")("data").contains({"tag": "sf"}); })("book_id").coerceTo("array")).isEmpty().not();})("author_id").coerceTo("array")).isEmpty().not();}) 

但是已经非常慢了,在一个只包含样本数据的数据库上(在我的服务器上是35-70毫秒)

它基本上是3个子查询的组合:

一:

r.db("test").table("Books").filter(function(book){ 
  return book("book_info")("data").contains({"tag": "sf"}); })("book_id").coerceTo("array")

这是最内在的。它检索一个数组,其中包含标记为sf的所有书籍的id。此数组放入以下子查询中:

r.db("test").table("Authors").filter(function(author){ 
  return author("books_written").setIntersection(<book ids go here>).isEmpty().not();})("author_id").coerceTo("array")

它检索参与一本或多本给定书籍的所有作者id的数组。它通过作者书籍的交集和sf书籍数组的非空性进行过滤。(如果交叉口非空,则至少有一本作者的书被标记为sf)

r.db("test").table("Borrowers").filter(function(borrower){ 
  return borrower("favourite_authors").setIntersection().isEmpty().not();})

最后一部分是基于与第二部分相同的原则,并最终返回的借款人谁喜欢一个作者谁写了科幻书。你知道吗

相关问题 更多 >