Python循环遍历两个csv文件，以比较每个文件中的重复条目数问题的回答

Python循环遍历两个csv文件，以比较每个文件中的重复条目数

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

<pre><code>import csv cred = open("AllCredits.csv", "r") creader = csv.reader(cred) pur = open("AllPurchases.csv", "r") preader = csv.reader(pur) out = open("output.txt", "r+") for row in creader: tn = #current phone number crednum = #number of rows with that phone number for row in preader: purnum = #number of rows with that phone number if crednum != 2*(purnum): out.write(str(tn) + "\n") cred.close() pur.close() out.close() </code></pre> 对于这两个文件，我只查看第一列（第0列），这是电话号码。这些文件是按电话号码排序的，因此任何重复的文件都是相邻的。我需要知道在cred文件中有多少行具有相同的电话号码，然后我需要知道在pur文件中有多少行具有相同的电话号码。我需要这样做的次数，因为它需要比较所有的重复电话号码之间的文件 例如： ^{pr2}$ 对于这个例子，我需要知道的是，credits文件中有2个2476实例，而purchases文件中有1个实例，然后credits文件中有1个实例3654，而purchases文件中只有1个实例。我需要比较cred文件中的每个电话号码，并得到两个文件中出现的电话号码，但是如果pur文件中存在不在cred文件中的电话号码，我就不需要计算任何东西。（但是如果cred中有2个数字，pur中没有，我确实需要为purnum返回一个0。）请注意，真正的两个文件大小分别为5000kb和13000kb，并且有数万行。在 我是python的新手，所以我不确定最好的方法。python中的循环与我习惯的完全不同（我主要使用c++） 我将编辑添加任何需要，所以请让我知道，如果有任何需要澄清。这不像我以前做过的任何项目，所以解释可能不理想。在 编辑：我想我可能跳过了对一个重要因素的解释，因为它包含在我的示例代码中。我需要知道这些数字只是为了比较，不一定要打印计数。如果是crednum！=2*purnum，那么我想打印那个电话号码，只打印那个电话号码，否则我不需要在输出文件中看到它，我也不需要实际打印计数，只需使用它们进行比较，以确定需要打印的电话号码。在

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

Python循环遍历两个csv文件，以比较每个文件中的重复条目数

1 个回答

相关Python问题