比较大CSV文件行与其他行Python内存问题

2条回答

网友

1楼 · 编辑于 2024-06-28 19:39:25

正如@Padraic指出的，这个文件不够大，不必担心内存不足。关于执行您想要的操作的最佳方法是使用字典，如下面的代码示例所示：

dictio = {}
file2 = open(file)
for line in file2.readlines():
    parts = line.split(' ')
    if parts[0] in dictio:
        print('duplicate ' + line)
    else:
        dictio[parts[0]] = parts[1]

其中parts[0]只是行中的一个随机部分，用于标识唯一性，您可以使用任何条件作为字典的键

网友

2楼 · 编辑于 2024-06-28 19:39:25

你在用unix吗？那么sort -u呢，或者如果只需要根据某个列值sort -t',' -k1,1 -u进行uniquize呢？当文件增长时，添加类似-S500MB的内容来保持RAM中的排序。。。在

编程相关推荐

java使用无循环和乘法的递归调用查找值
java字符串大小冲突
在一组Java文件对象中查找唯一的超级目录
没有Eclipse控制台输出窗口（Java）？
java这怎么等于105而不是15？
java Adempiere列调出，用于不处理从（代码）选项导入和创建行的字段
java tomcat、2个webapps、2个log4js，但这两个应用都记录到一个文件中
lambda理解Java谓词
HotspotFX上的Java EOF问题
java google应用程序引擎：如何向连接/断开通道“ping”添加信息？

相关问题更多 >

编程相关推荐

热门问题

热门文章

比较大CSV文件行与其他行Python内存问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >