如何用regex中的下一个表达式分配组?

2024-09-26 18:20:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图捕捉到孔文本到csv格式的书,我使用正则表达式。但我不太明白。 我需要在这个例子中搜索:

agur, pi. aguren, subs., lune, mois. Ex.: arbd uaguren, quatre mois.

将其转换为:

col1 = agur
col2 = aguren                        (criteria : after 'pi.' -> col2)
col3 = lune, mois                    (criteria : after 'subs.' -> col3)
col4 = arbd uaguren, quatre mois.    (criteria : after 'Ex.' -> col4)

Tags: piexcol2col3subscriteriaaftercol4
1条回答
网友
1楼 · 发布于 2024-09-26 18:20:13

我有一个解决方案,每个列都有一个正则表达式:

col1=agur

start: beginning of text
stop : ", pi"
regex: ^(.+), pi

col2=aguren

start: "pi."
stop : ","
regex: .+pi\.([^,]+)

col3=lune,mois

start: "subs., "
stop : ","
regex: .+subs\., ([^.]+)

col4=arbd uaguren,四元mois.

start: "Ex."
stop : end of line
regex: .+Ex\.(.+)

对于每个regex,我都提供了开始和停止标准。可能在处理真实数据后需要调整它们。你知道吗

相关问题 更多 >

    热门问题