Pandas在数据框中查找与列表匹配的行中的所有单词

2条回答

网友

1楼 · 编辑于 2024-10-05 12:25:42

这里有一种不使用正则表达式的方法。另外，我将您的anticipationlist从dict更改为list

import pandas as pd

anticipationlist= ['abundance',
                    'opera',
                    'star',
                    'start',
                    'achievement',
                    'acquiring',
                    ]

values = [
    'operation start yesterday',
    'operation start now',
    'operation achievement',
    ]
df = pd.DataFrame(data=values, columns=['text'])

def find_values(x):
    results = []
    for value in anticipationlist:
        for word in x.split():
            if word == value:
                results.append(word)
    return ' '.join(results)
df['result'] = df['text'].apply(lambda x: find_values(x))

print(df.head())

网友

2楼 · 编辑于 2024-10-05 12:25:42

可以分别为每个值添加单词边界：

pat = '|'.join(r"\b{}\b".format(x) for x in anticipationlist)
df['result']=df["text"].str.findall(pat).apply(", ".join)

print (df)
                        text       result
0  operation start yesterday        start
1        operation start now        start
2      operation achievement  achievement

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas在数据框中查找与列表匹配的行中的所有单词

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >