基于正则表达式和保留匹配模式的标记化

2024-10-03 23:28:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用regex模式分割一个文件,这样文件就可以在下面三个分隔符上进行标记

  1. /你知道吗
  2. &
  3. 什么

条件是我希望在最终输出中保留分隔符

例如

输入文件:

/wp-admin/wellsfargo/index.html/
/e1452e05fde1b15e51fc5a30065a5689?login=_&.verify?service=_&data:text/html;charset=_
/hZfAh

预期输出:

/wp-admin
/wellsfargo
/index.html
/e1452e05fde1b15e51fc5a30065a5689
?login=_
&.verify
?service=_
&data:text
/html;charset=_
/hZfAh

如何使用Python或Bash实现这一点


Tags: 文件textdataindexadminhtmlservicelogin
1条回答
网友
1楼 · 发布于 2024-10-03 23:28:36

假设您的输入存储在变量s中,您可以将re.findall与以下regex模式一起使用:

import re
print('\n'.join(re.findall(r'[/&?][^/&?\n]+', s)))

这将输出:

/wp-admin
/wellsfargo
/index.html
/e1452e05fde1b15e51fc5a30065a5689
?login=_
&.verify
?service=_
&data:text
/html;charset=_
/hZfAh

相关问题 更多 >