按行比较列以获得部分字符串匹配

3条回答

网友

1楼 · 编辑于 2024-09-28 03:20:32

基于@onyanbu的答案。你知道吗

in可以用来代替re.findall()

df["match"] = df.apply(lambda v: int(v[2] in v[1]),axis=1)
print(df["match"]

输出：

网友

2楼 · 编辑于 2024-09-28 03:20:32

import re

df['compare_match']=df.apply(lambda v:len(re.findall(v[2],v[1])),axis=1)

df
   id text_1 text_2_compare  compare_match
0   1    yyy             yy              1
1   2    yxy             xx              0
2   3    zzy             zy              1
3   4    zzy              x              0
4   5    xyx             yx              1

编辑：

实际上，我以为OP需要text_2_compared出现在text_1中的次数，但再看一遍这个问题，似乎OP只需要一个指示变量。因此，使用@gaganso上面所做的v[2] in v[1]就足够了

网友

3楼 · 编辑于 2024-09-28 03:20:32

使用简单列表

df['New']=[int(y in x) for x , y in zip(df['text_1'],df['text_2_compare'])]
df
Out[496]: 
   id text_1 text_2_compare  New
0   1    yyy             yy    1
1   2    yxy             xx    0
2   3    zzy             zy    1
3   4    zzy              x    0
4   5    xyx             yx    1

相关问题更多 >

编程相关推荐

热门问题

热门文章

按行比较列以获得部分字符串匹配

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >