pd.merge未对列值进行合并

2024-09-29 17:11:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试在retweeting_id列上合并下面的这两个数据帧

                retweeting_id           retweeting_username     retweeting_followers_count
207857          822215673812119553      WhiteHouse              26139914
        id                      user_id  retweet_count      tweet                              prediction   retweeting_id   username    
4682    1341442941642928129     64932923    191     RT @WhiteHouse: Over 80% of Americans say they...   2   8.222157e+17    Erika   
4683    1341443049067479041     64932923    332     Hope—and help—are on the way!\n\n"The first sh...   2   8.222157e+17    Erika   
5764    1339008184997064705     232598875   694     "Yesterday, the United States witnessed a medi...   1   8.222157e+17    Wm R Collie IV MD   
10065   1338931792800325634     1105109168  297     "Yesterday, the United States witnessed a medi...   1   8.222157e+17    President-elect 𝔾𝕖𝕟𝕖𝕒𝕝𝕠𝕘𝕪 𝔾𝕚𝕣𝕝     

但是当我使用

df1 = pd.merge(test2, test1, on= 'retweeting_id')

我得到一个空的数据帧。我认为第二个数据框中的科学符号把它弄乱了,但我知道数字是一样的,因为我使用的是

test2 = df_merge2[(df_merge2['retweeting_id'] == 822215673812119553  )]

获取第二个数据帧。任何关于如何使这两个合并的想法,任何帮助都将不胜感激。谢谢


Tags: the数据idoncountusernameunitedtest2
2条回答

尝试在第二个数据帧上将转发id更改为整数。然后,再次尝试合并

我通过使用转换为字符串来修复它

test2.retweeting_id = test2.retweeting_id.map(lambda x: '{:.0f}'.format(x))

在两个数据帧上,现在它们正确合并

相关问题 更多 >

    热门问题