python两个csv文件

2024-10-04 01:28:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图比较两个csv文件。如果用户名与表1和表2的名称相同,我想比较相似性用户名创建表3打印

比如说

table1.csv
id_Acco,     user_name,       post_time
1543603,     SameDavie ,      "2020/09/06"
1543595,     Johntim,         "2020/09/11"
1558245,     ACAtesdfgsf ,    "2020/09/19"

table2.csv
id_Acco,     user_name,     post_time
1543603,    SameDavie,      "2020/09/06"
1543595,    Johntim ,       "2020/09/11"
1558245,    Davidwillian,   "2020/09/19"

输出

table3.csv

id_Acco,     user_name,     post_time
1543603,     SameDavie ,    "2020/09/06"
1543595,     Johntim ,      "2020/09/11"

代码

`A = pd.read_csv(r'table1.csv')
 B= pd.read_csv(r'table2.csv')
 print(A-B) 
 print(B-A)

Tags: csvnameidreadtimepost用户名pd
1条回答
网友
1楼 · 发布于 2024-10-04 01:28:51

您可以concatA和B并检查duplicated记录:

z = pd.concat([A, B])[['user_name']]
z.loc[z.duplicated()].to_csv('table3.csv')

输出(在table3.csv中):

   user_name
0  SameDavie
1    Johntim

另外,如果您的文件中有时像示例中那样有这些尾随空格,您可能希望在连接后去掉它们:

z = pd.concat([A, B])['user_name'].str.strip()
z.loc[z.duplicated()].to_frame().to_csv('table3.csv')

相关问题 更多 >