我有以下数据帧(df)
Comments ID
0 10 Looking for help
1 11 Look at him but be nice
2 12 Be calm
3 13 Being good
4 14 Him and Her
5 15 Himself
以及列表中的一些单词,我需要搜索一个完全匹配的
word_list = ['look','be','him']
这是我想要的输出
Comments ID Word_01 Word_02 Word_03
0 10 Looking for help
1 11 Look at him but be nice look be him
2 12 Be calm be
3 13 Being good
4 14 Him and Her him
5 15 Himself
我试过一些方法,比如芬德尔街你知道吗
str.findall(r"\b" + '|'.join(word_list) + r"\b",flags = re.I)
还有其他一些,但我似乎无法得到确切的匹配我的话。你知道吗
任何帮助解决这个问题都将不胜感激。你知道吗
谢谢
你需要每个单词的边界。将^{} 、^{} 和^{} 转换为原始
DataFrame
的一种可能的解决方案:对于输出add^{} 中的小写数据:
您的解决方案应该按照相同的模式进行更改,将值转换为
list
s和join
转换为原始值:或者使用列表理解(应该是最快的):
对于小写add
.lower()
:您可以使用pandas的
apply
函数。 示例:输出:
相关问题 更多 >
编程相关推荐