匹配列值并用“”替换重复项

screenName screen_name_retweet screen_name_mention User1 User10 User1 User4 User10 User5 User3 User3 User12 User6 User10 User7

screenName screen_name_retweet screen_name_mention User1 User10 User4 User10 User5 User3 User12 User6 User10 User7

2条回答

网友

1楼 · 编辑于 2024-07-01 07:19:08

使用replace方法

import pandas as pd
df = pd.read_csv(file_name)          #read your file as dataframe
for index, row in df.iterrows():
    if row[0]==row[1]:
        df['screen_name_retweet'].replace(row[1], "", inplace = True)
    if row[0] == row[2]:
        df['screen_name_mention'].replace(row[2], "", inplace = True)
print(df)

网友

2楼 · 编辑于 2024-07-01 07:19:08

import pandas as pd
a = pd.DataFrame([["user1","user10","user1"],
                  ["user4","user10","user5"],
                  ["user3","user3","user12"]] ,
                  columns=["i1","i2","i3"]) #simplified input dataframe
for i in a.index:
    m = a.loc[i].duplicated() #mask array for each rows
    a.loc[i] = a.loc[i].mask(m).fillna("") #filter duplicates and fill by empty string

我认为这个解决方案可以从性能的角度进行改进，但它是有效的。你知道吗

更新日期：

相关问题更多 >

编程相关推荐

热门问题

热门文章