我有几个表,表将在不同的数据库和下面的样本比较,我正在尝试
EmplTbl = cur.execute("select A , B , C from EmployeeTable where EmplName in ('A','B')")
emp_entries = set(cur)
DeptTbl = cur.execute("select A , B , C from DeptTable")
dept_entries = set(cur)
print(emp_entries.difference(dept_entries))
在这个例子中,我只提供了3列进行比较。但在我的情况下,我有30-40列。 当我试图在集合之间做一个区别或者使用'for'循环或者数据帧连接比较时——脚本运行得非常慢,我得到的最后一条消息是“Killed”
在下面的代码中,我尝试进行内部连接以获得精确匹配
EmplTbl = cur.execute("select A , B , C from EmployeeTable where EmplName in ('A','B')")
emp_entries = set(cur)
DeptTbl = cur.execute("select A , B , C from DeptTable")
for DeptTbl in cur:
if emp_entries in DeptTbl:
print(emp_entries)
记录的数量:我可能有1000万
有没有什么方法可以提高我的表现,让它跑得快。我有4节点配置的linux服务器。 请建议
您可以直接使用差异查询:
或者
干杯!!你知道吗
相关问题 更多 >
编程相关推荐