我想分析一个xml文件和我的程序的一部分分割成句子的数据,但我的行尾字符消失了…我需要他们添加注释与xml标记在我的句子的开头和结尾
目前我有:
import re
line_end_chars = "!", "?", ".",">"
regexPattern = '|'.join(map(re.escape, line_end_chars))
line_list = re.split(regexPattern, texte)
如果我用文本运行这个代码
" Je pense que cela est compliqué de coder. Où puis-je apprendre?"
这会给我:
["Je pense que cela est compliqué de coder",
"Où puis-je apprendre"]
而不是我想要的,那就是:
["Je pense que cela est compliqué de coder.",
"Où puis-je apprendre?"]
然后我可以编写.replace
代码来添加我的xml标记
一种可能的解决方案是使用
re.sub
而不是re.split
,然后使用str.splitlines()
:印刷品:
我有两种方法可以考虑这样做
两种打印
相关问题 更多 >
编程相关推荐