从文本fi中选择特定段落

2024-06-28 15:42:15 发布

您现在位置:Python中文网/ 问答频道 /正文

示例文本:

StartString fcchwd
dheoidfjewofd
edeodei
eddeed
dd djded dojef efjefj
fefije efoef;

 StartString wdjkndd
dwojdpjf wodjojd wdjwjdm
wodjow
wdjwdjm ojdowj ww
wdeswjd wdojwod;

#jfejf
/** hfhih **/

dijhfs
wdjw


StartString wkpwkd 
dokowdk djd 
owjidwo;

我试着低于正则表达式,但它是只给予赛后在线

r"StartString\s*(.*)\s*"

如何存储从StartString开始并以;结束的所有集合。稍后我想从这些集合中删除换行符 这可以用简单的replace命令来完成,但不确定如何找出这些集合。请建议


Tags: 文本示例ddstartstringdojefwdjkndddwojdpjfefoef
1条回答
网友
1楼 · 发布于 2024-06-28 15:42:15

您可以尝试以下模式:

import re 

str1 = "StartString fcchwd dheoidfjewofd edeodei eddeed dd djded dojef efjefj fefije efoef;  StartString wdjkndd dwojdpjf wodjojd wdjwjdm wodjow wdjwdjm ojdowj ww wdeswjd wdojwod;  #jfejf  /** hfhih **/ dijhfs wdjw  StartString wkpwkd  dokowdk djd owjidwo;"


regex = re.compile(r'(StartString.+?;)')
l = regex.findall(str1)
print(l)

输出:

C:\Users\Desktop>py x.py
['StartString fcchwd dheoidfjewofd edeodei eddeed dd djded dojef efjefj fefije efoef;', 'StartString wdjkndd dwojdpjf wodjojd wdjwjdm wodjow wdjwdjm ojdowj ww wdeswjd wdojwod;', 'StartString wkpwkd  dokowdk djd owjidwo;']

相关问题 更多 >