python3：如何最快比较两个大文件？

import json uid_available = [] linesB = [] for line in open('E:/Small_file.txt'): line = json.loads(line) linesB.append(hash(line['uid'])) for line in open('E:/Big_file.txt'): line = json.loads(line) if hash(line['uid']) not in linesB and line['user'] == 'User A': uid_available.append(line['uid'])

1条回答

网友

1楼 · 发布于 2024-06-25 06:25:50

在列表中查找项目需要O(n)时间。如果使用dict或set，可以将其改进为O(1)。你知道吗

您可以做的最短修改是：

linesB = []
for line in open('E:/Small_file.txt'):
    line = json.loads(line)
    linesB.append(hash(line['uid']))
linesB = set(linesB)

或者做对了

linesB = set()
for line in open('E:/Small_file.txt'):
    line = json.loads(line)
    linesB.add(hash(line['uid']))

编程相关推荐

jsoup有效文件路径抛出java。木卫一。FileNotFoundException
java如何在不删除和添加Mapbox中的层的情况下更改SymbolLayer的Z值？
java计算用户定义年数内四个季度的降雨量
如何在Java中轻松地将格式为“20 0F 01”的字符串更改为十六进制值？
java在JPA或Hibernate中“持久类”和“实体”之间有什么区别？
java Android:AlarmManager“缺少对unregisterReceiver（）的调用？”当按下后退按钮时
logcat中的java错误“isDataSchedulerEnabled（）：false”
java i/p col特性必须是字符串或数字类型，但不能是org。阿帕奇。火花利纳格小姐。向量
java如何从Post请求url和浏览器转储中隐藏密码
多线程javamail中的java问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

python3：如何最快比较两个大文件？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >