pandas在多个列上搜索子字符串

网友

1楼 · 编辑于 2024-10-01 00:33:15

import pandas as pd
row  =[['abcx','abcy'],
       ['efg','abcz'],
       ['higj','UK']]
df= pd.DataFrame(row)
df.columns = ['c_name', 'f_name']

print df[df['c_name'].str.contains('abc', case=False)]

delta_df =df[~df['c_name'].str.contains('abc', case=False)]
print delta_df[delta_df['f_name'].str.contains('abc', case=False)]

输出

^{pr2}$

网友

2楼 · 编辑于 2024-10-01 00:33:15

将第一个搜索结果标记为2。如果新的搜索结果满足，则将覆盖（由1覆盖）。在

网友

3楼 · 编辑于 2024-10-01 00:33:15

stack变成一个系列
str.contains获取子字符串的真值
unstack返回dataframe
子集结果以确保至少一个匹配
idxmax(1)得到列中的第一个True

def find_subtext(df, txt):
    contains = df.stack().str.contains(txt).unstack()
    return contains[contains.any(1)].idxmax(1)

^{pr2}$

df.assign(abc=find_subtext(df, 'abc'))

  c_name f_name     abc
0    abc  abc12  c_name
1    xyz   abc1  f_name
2    mnq   mnq2     NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

pandas在多个列上搜索子字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >