在基于一列合并两个文件的Python脚本中包含不匹配的行

import pandas as pd a = pd.read_csv('PARENT.csv', encoding = "UTF-8", mangle_dupe_cols=True, usecols=['abTestGroup','platform','countryCode','userId']) b = pd.read_csv("CHILD.csv") merged = b.merge(a, on='userId', how='inner') merged = merged.drop_duplicates() merged.to_csv("final_output.csv", index=False)

2条回答

网友

1楼 · 编辑于 2024-10-01 13:35:08

join方法适用于您的案例：

a.join(b)

网友

2楼 · 编辑于 2024-10-01 13:35:08

因为您正在执行内部联接，所以只返回匹配的userIds。为了返回不匹配的userIds，您可以根据下面语句中的连接顺序执行右/左连接

merged = b.merge(a, on='userId', how='inner')

如果b包含bbbbbbbbbbb，则执行左连接。如果a包含bbbbbbbbbbb，那么您将进行正确的连接

merged = b.merge(a, on='userId', how='left')
merged = b.merge(a, on='userId', how='right')

请参阅下面的连接类型

编程相关推荐

尝试在jave中上载图像时出现java NoSuchFileException
在Weka Java API中创建字符串属性
java如何重写toString并打印ArrayList的自定义类类型
java您在RegistrySpec中放了什么。用于Izpack安装以设置发布服务器字段的xml
持久性查询中的java异常
铸造（Java）为什么是数学。ceil（15/10）是1.0而不是2.0？
Rest设计的javascript正则表达式
java无法构建实际的Intellij IDEA社区版
ssl从openssl自签名证书文件创建Java密钥库
java将在IntelliJ上开发的Spring boot javascript web应用程序连接到Chrome的JetBrains扩展进行调试

相关问题更多 >

编程相关推荐

热门问题

热门文章