使用正则表达式python迭代数据帧

2024-10-03 21:31:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试在DF或list的另一列中解析SI类型的模式 我试了两件事:

|    a             |
-------------------+
| Builder          |
| left             |
| SI_NAME lide_on  |
| SI_ID 456        |
| Scheduling Info  |

df['b']= df['a'].apply(lambda row: re.findall('\SI_\w+\s',row))  

以及

^{pr2}$

我无法得到结果,第一个在新列中返回了一个空列表


Tags: nameid类型dfonbuilder模式left
1条回答
网友
1楼 · 发布于 2024-10-03 21:31:27

你可以用像

df['b'] = df['a'].str.findall(r'^SI_\w+')

使用.str将强制将内容解析为字符串。在

^SI_\w+模式与SI_匹配,然后在字符串的开头只匹配1+个单词的字符(由于^),看起来您要跟踪的条目遵循此模式。您可以在末尾添加.apply(','.join)或类似的内容,以在结果列中获取字符串数据。在

相关问题 更多 >