在pandas中过滤行

2条回答

网友

1楼 · 编辑于 2024-09-27 17:38:20

您可以使用|（或）with str.contains()with |分隔三种模式：

df = df[df['CODE'].str.contains('\d|__|AA')]

Out[3]: 
  User_ID        CODE
0     A12  AAada __fa
1    F453      21 ads
2     J43      Has AA
5     L32      sad 21
6     M54  43__12 asd

网友

2楼 · 编辑于 2024-09-27 17:38:20

可以对序列series.str.contains()使用字符串访问器。这是user guide

以及解决方案的代码

pats = ['AA', '__', '\d']
mask = {}
for pat in pats:
    mask[pat] = df.CODE.str.contains(pat, regex=True)
        # regex=True is default, shown here for demonstration
    
    print()
    print(mask[pat])

输出

0     True
1    False
2     True
3    False
4    False
5    False
Name: CODE, dtype: bool

0     True
1    False
2    False
3    False
4    False
5     True
Name: CODE, dtype: bool

0    False
1     True
2    False
3    False
4     True
5     True
Name: CODE, dtype: bool

以后可以使用这些掩码中的每一个来过滤数据帧。在这种情况下，最好将它们作为单独的遮罩，因为它们似乎有重叠

相关问题更多 >

编程相关推荐

热门问题

热门文章

在pandas中过滤行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >