我有如下所示的3列,在pandas dataframe
中有标题screen_name, screen_name_retweet , screen_name_mention
。你知道吗
screenName screen_name_retweet screen_name_mention
User1 User10 User1
User4 User10 User5
User3 User3 User12
User6 User10 User7
我想要的是将screen_name
与screen_name_retweet
和screen_name_mention
匹配,如果在screen_name and screen_name_retweet or screen_name_mention
之间发现重复项,则将该列(screen_name_retweet and screen_name_mention
)值替换为''
。所以上面的列应该是这样的
screenName screen_name_retweet screen_name_mention
User1 User10
User4 User10 User5
User3 User12
User6 User10 User7
我怎样才能得到想要的答案?你知道吗
我已经试过了:
df.loc[(df['screenName'].duplicated() & df['screen_name_mention'].duplicated()), ['screen_name_mention']] = ''
但什么都没发生,桌子也没变
使用replace方法
我认为这个解决方案可以从性能的角度进行改进,但它是有效的。你知道吗
相关问题 更多 >
编程相关推荐