我正在尝试在retweeting_id列上合并下面的这两个数据帧
retweeting_id retweeting_username retweeting_followers_count
207857 822215673812119553 WhiteHouse 26139914
id user_id retweet_count tweet prediction retweeting_id username
4682 1341442941642928129 64932923 191 RT @WhiteHouse: Over 80% of Americans say they... 2 8.222157e+17 Erika
4683 1341443049067479041 64932923 332 Hope—and help—are on the way!\n\n"The first sh... 2 8.222157e+17 Erika
5764 1339008184997064705 232598875 694 "Yesterday, the United States witnessed a medi... 1 8.222157e+17 Wm R Collie IV MD
10065 1338931792800325634 1105109168 297 "Yesterday, the United States witnessed a medi... 1 8.222157e+17 President-elect 𝔾𝕖𝕟𝕖𝕒𝕝𝕠𝕘𝕪 𝔾𝕚𝕣𝕝
但是当我使用
df1 = pd.merge(test2, test1, on= 'retweeting_id')
我得到一个空的数据帧。我认为第二个数据框中的科学符号把它弄乱了,但我知道数字是一样的,因为我使用的是
test2 = df_merge2[(df_merge2['retweeting_id'] == 822215673812119553 )]
获取第二个数据帧。任何关于如何使这两个合并的想法,任何帮助都将不胜感激。谢谢
尝试在第二个数据帧上将转发id更改为整数。然后,再次尝试合并
我通过使用转换为字符串来修复它
在两个数据帧上,现在它们正确合并
相关问题 更多 >
编程相关推荐