我正在处理一个如下所示的pandas数据帧:
0 Item Category
1 Hammer A
2 Car A
3 Cardiologist B
4 Park A
5 Parkway A
6 CarparkCar A
我需要找到Item
中包含特定字母序列的所有单元格,这些字母序列被定义为参考词的子字符串。我对包含参考词中没有的附加字母的单元格不感兴趣。在
期望输出:
0 Item Category Contains_substring_of_reference_word
1 Hammer A FALSE
2 Car A TRUE
3 Cardiologist B FALSE
4 Park A TRUE
5 Parkway A FALSE
6 CarparkCar A TRUE
如何检查pandas dataframe列的哪个单元格包含给定单词/字符串的子字符串?
选项1
{{cd2>简单的方法是使用^-
将结果分配回-
^{pr2}$选项2
另一个使用
set.difference
操作的解决方案-选项3
使用
np.vectorize
添加另一个选项,这应该更快。在计时
您可以使用理解来创建集合,并使用
<=
来表示子集。在相关问题 更多 >
编程相关推荐