dedupe.blocker()函数无法解包不可iterable int obj

2024-10-01 02:29:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用dedupe.io Python库,但是出于我的需要,我需要连接到MS-SQL数据库

所以我决定首先让csv示例工作(我做到了),然后我想尝试将pgSQL示例转换为MS-SQL版本。目前,当我遇到问题时,我正在转换脚本

基本上,我被困在脚本试图将块映射写入csv文件的地方。这是似乎失败的线路/呼叫:

b_data = deduper.blocker(full_data)

根据documentation,它应该:

Yields tuples of (predicate, record_id)

但是,我得到以下错误:

File "C:\PythonV\dedupeio\dedupe\lib\site-packages\dedupe\blocking.py", line 42, in __call__
    record_id, instance = record
TypeError: cannot unpack non-iterable int object

所以我想也许我做错了什么,所以我遵循同样的逻辑,并试图将函数调用应用到CSV版本,它似乎可以工作(因为它运行和输出重复),但我得到相同的错误。所以现在我在想我遗漏了什么或者是个bug。不管怎样,我想知道我如何才能解决这个问题


Tags: csvio版本脚本id数据库示例sql