我试图捕捉到孔文本到csv格式的书,我使用正则表达式。但我不太明白。 我需要在这个例子中搜索:
agur, pi. aguren, subs., lune, mois. Ex.: arbd uaguren, quatre mois.
将其转换为:
col1 = agur
col2 = aguren (criteria : after 'pi.' -> col2)
col3 = lune, mois (criteria : after 'subs.' -> col3)
col4 = arbd uaguren, quatre mois. (criteria : after 'Ex.' -> col4)
我有一个解决方案,每个列都有一个正则表达式:
col1=agur
col2=aguren
col3=lune,mois
col4=arbd uaguren,四元mois.
对于每个regex,我都提供了开始和停止标准。可能在处理真实数据后需要调整它们。你知道吗
相关问题 更多 >
编程相关推荐