我对情绪(愤怒、恐惧、预期、信任等)有一个口述,其中有与情绪相关的词语
预期名单:
{'anticipation': ['abundance',
'opera',
'star',
'start',
'achievement',
'acquiring',...]
我有一个数据框,里面有几行句子,我想找出与情绪相关的单词
| text |
|--------------------------- |
| operation start yesterday |
| operation start now |
| operation halt |
预期产量
| text | result |
|--------------------------- |------------- |
| operation start yesterday | start |
| operation start now | start |
| operation achievement | achievement |
我试过了
df['result']=df["text"].str.findall(r"\b"+"|".join(anticipationlist) +r"\b").apply(", ".join)
我的结果是
| text | result |
|--------------------------- |-------------------- |
| operation start yesterday | opera, star |
| operation start now | opera, star |
| operation achievement | opera, achievement |
如何改进代码以获得期望的结果
这里有一种不使用正则表达式的方法。另外,我将您的
anticipationlist
从dict
更改为list
可以分别为每个值添加单词边界:
相关问题 更多 >
编程相关推荐