Python列表理解/循环，用于在不同的df列中选择相同的成员

col1 = ['QUENTIN TARANTINO', 'BARACK OBAMA', 'QUENTIN TARANTINO', 'CHARLIE CHAPLIN', 'JAMES LEBRON', 'KOBE BRYANT', 'Philippe Wain', 'LE CAM ALBERT', 'ANDREW ROBERTS', 'Obama Barack', 'tarantino quentin'] col2 = ['OBAMA, BARACK', 'CHAIN, GEORGE', 'Phylo, SOPY', 'Losan, Santos']

2条回答

网友

1楼 · 编辑于 2024-09-28 19:26:21

解决此问题的简单方法是使用set try this：因为您需要首先将lower应用于列表中的所有元素

col = list(set( [x.lower().replace(', ',' ') for x in col1]+[x.lower().replace(', ',' ') for x in col2]))

网友

2楼 · 编辑于 2024-09-28 19:26:21

除了Espoir的答案，要处理翻转，请运行以下命令：

col = list(set( [x.lower().replace(', ',' ') for x in col1]+[x.lower().replace(', ',' ') for x in col2])) #thanks espoir
for x in col:
    rev = [i for i in reversed(x.split())]
    if ' '.join(rev) in col:
        col.pop(col.index(x))

它将消除列中的翻转重复

因为它的作用

在列上迭代。
1. 生成每个名称的反向列表。你知道吗
2. 检查联接的反向名称是否已存在。
  1. 如果是，请将其从列表中删除

^{}将返回一个迭代器，因此它应该是for循环的主题。rev只保留一个翻转名称的副本，以便在下一步进行比较。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python列表理解/循环，用于在不同的df列中选择相同的成员

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >