Pandas离开了外部连接

2024-10-01 19:18:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在和Python熊猫一起工作。 我遇到了一个问题。 有一个名为master的数据集,其长度如下:

print(len(master))
120000

然后我尝试使用另一个名为click的数据集将其外部联接起来:

^{pr2}$

我不知道为什么数字从120000变为120799,因为合并必须基于数据集主数据集进行。在

感谢任何一个解决这个问题的想法,谢谢!在


Tags: 数据masterlen数字clickprintpr2集将
1条回答
网友
1楼 · 发布于 2024-10-01 19:18:36

您的合并只保证结果将有len(master.index)作为最小行数。正如@Wen所提到的,如果click在连接列上有多个匹配项,那么您将拥有更多的行。在

这个例子应该阐明行为:

df1 = pd.DataFrame([['a', 1, 2], ['b', 2, 3], ['c', 4, 5]], columns=['A', 'B', 'C'])
df2 = pd.DataFrame([['a', 6, 7], ['a', 8, 9]], columns=['A', 'D', 'E'])

pd.merge(df1, df2, how='left')

#    A  B  C    D    E
# 0  a  1  2  6.0  7.0
# 1  a  1  2  8.0  9.0
# 2  b  2  3  NaN  NaN
# 3  c  4  5  NaN  NaN

相关问题 更多 >

    热门问题