如何使用regex或beautifulsoup、lxml等工具箱解析这样的句子:
input = """Yesterday<person>Peter Smith</person>drove to<location>New York</location>"""
对此:
Yesterday
<person>Peter Smith</person>
drove
to
<location>New York</location>
我不能使用re.findall("<person>(.*?)</person>", input)
,因为标记不同。你知道吗
试试这个正则表达式-
正则表达式的演示here
看看使用
BeautifulSoup
有多简单:印刷品:
UPD(将非标记项拆分为空格,并在新行上打印每个部分):
印刷品:
希望有帮助。你知道吗
相关问题 更多 >
编程相关推荐