当过滤多个列时,我看到了一些例子,我们可以使用类似于df[df['A'].str.contains("string") | df['B'].str.contains("string")]
来过滤行。在
我有多个文件,我想在其中获取每个文件,并且只从包含'email'
字符串的列名中获取那些带有'gmail.com'
的行。在
因此,示例标头可以类似于:“firstname”“lastname”“companyname”“address”“emailid1”“emailid2”“emailid3”。。。在
列emailid1..2..3
的emailid包含gmail.com
。我想获取gmail可以出现在其中任何一行中的行。在
for file in files:
pdf = pd.read_csv('Reduced/'+file,delimiter = '\t')
emailids = [col for col in pdf.columns if 'email' in col]
# pdf['gmail' in pdf[emailids]]
您可以将^{} 与^{} 一起使用:
输入示例:
例如:
^{pr2}$您可以筛选出包含email的列,查找
gmail.com
或您希望的任何文本,然后再选择子集,例如:这给了你:
相关问题 更多 >
编程相关推荐