从中列的列表中删除重复对

2条回答

网友

1楼 · 编辑于 2024-10-02 22:36:53

您可以按条带删除[]，然后先按,或;拆分，然后使用您的解决方案：

print (df.e2etrail.str.strip('[]').str.split('[;,]'))
dtype: object
0    [sitea, siteb, sitea, siteb, sitec, sited, sit...
Name: e2etrail, dtype: object

f = lambda x : ','.join(sorted(set(x),key=x.index))
df['test'] = df.e2etrail.str.strip('[]').str.split('[;,]').map(f)
print (df)
   cola.                                           e2etrail  \
0    1.0  [sitea,siteb,sitea,siteb;sitec,sited,sitec,sited]   

                      test  
0  sitea,siteb,sitec,sited

如果需要输出列表：

f = lambda x : sorted(set(x),key=x.index)
df['test'] = df.e2etrail.str.strip('[]').str.split('[;,]').map(f)
print (df)
   cola.                                           e2etrail  \
0    1.0  [sitea,siteb,sitea,siteb;sitec,sited,sitec,sited]   

                           test  
0  [sitea, siteb, sitec, sited]

网友

2楼 · 编辑于 2024-10-02 22:36:53

最终，我将列表转换为系列，删除了重复项并再次加入系列，如下所示：

        df['e2etrails']=df['e2etrails'].str.split(';')
        df['e2etrails']=df['e2etrails'].apply(lambda row :';'.join(pd.Series(row).str.split(',').map(lambda x : ','.join(sorted(set(x),key=x.index)))))

相关问题更多 >

编程相关推荐

热门问题

热门文章

从中列的列表中删除重复对

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >