Python中正则表达式中的lookbehind和negative lookbehind断言紧密相连

import numpy as np import pandas as pd import re myDF = pd.DataFrame({'pet':['rabbit','mammal/rabbit','mammal/small fluffy rabbit','mammal/lop-eared rabbit','mammal/many rabbits','mammal/jack rabbit']})

rxStr = '(?P<bunny>(?<=/)(?<!jack)(?:.*rabbits?))' rx = re.compile(rxStr,flags=re.I|re.X) rabbitDF = myDF['pet'].str.extract(rx,expand=True) myDF = myDF.join(rabbitDF) print(myDF) pet bunny 0 rabbit NaN 1 mammal/rabbit rabbit 2 mammal/small fluffy rabbit small fluffy rabbit 3 mammal/lop-eared rabbit lop-eared rabbit 4 mammal/many rabbits many rabbits 5 mammal/jack rabbit jack rabbit

2条回答

网友

1楼 · 编辑于 2024-09-30 16:20:20

In [52]:  myDF['pet'].str.extract(r'/(?P<bunny>(?!jack).*rabbits?.*)',expand=True)
Out[52]:
                 bunny
0                  NaN
1               rabbit
2  small fluffy rabbit
3     lop-eared rabbit
4         many rabbits
5                  NaN

RegEx explained ...

网友

2楼 · 编辑于 2024-09-30 16:20:20

使用先行而不是后视：

myDF.pet.str.extract('(?P<bunny>(?<=/)(?!jack).*rabbit)', expand=True)

                 bunny
0                  NaN
1               rabbit
2  small fluffy rabbit
3     lop-eared rabbit
4          many rabbit
5                  NaN

^{pr2}$

这里，否定的lookahead意味着正斜杠后面不能跟“jack”。在

相关问题更多 >

编程相关推荐

热门问题

热门文章