如何使用datafram中的任意正则表达式筛选带字符串的行

2024-10-01 17:34:31 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的后续问题 how to filter rows based on unix based regular expressions passed as an input argument to a data frame column

import numpy as np
import pandas as pd
import os

csvFile = "csv.csv"
csvDelim = '@@@'
 df = pd.read_csv(csvFile, engine="python", index_col=False, delimiter=csvDelim )
df.head()


ID  col_1   
0   ACLKB
1   CLKAA
2   AACLK
3   BBBCLK

我有一个python函数find

 def find(self, findText, colName exactMatch):

      mask = (mask | (self.df[colName].astype('str') == findText))

现在findText可以CLK或者?CLK或^CLK或CLK$等。它可以包含任何正则表达式。现在如何有一个通用的解决方案,我的find函数可以找到任何正则表达式的字符串

我正在寻找关于如何在数据帧中支持基于regex的过滤器行的非常好的文档


Tags: csvtocsvfile函数importselfdfas

热门问题