Python中有一系列未闭合的字符串。注意:对于NLP解析器,这不需要是正确的XML。例如,考虑以下字符串:
<hi><TIMEX>every monday, wednesday and friday</TIMEX> </TIMEX>but <TIMEX>not saturday
</TIMEX></bye><TIMEXUNTIL>until january</TIMEXUNTIL> from <TIMERANGE>11:30am-12:00
</TIMERANGE>
我们有一个额外的开放标签:
^{pr2}$和额外的结束标记:
</TIMEX>
</bye>
如何轻松删除没有匹配的打开/关闭标记?我想要的输出是:
<TIMEX>every monday, wednesday and friday</TIMEX> but <TIMEX>not saturday
</TIMEX><TIMEXUNTIL>until january</TIMEXUNTIL> from <TIMERANGE>11:30am-12:00
</TIMERANGE>
一种解决方案是遍历字符串,查找标记,包括关闭的和打开的标记。在
然后把逻辑,相应地。理想情况下,它可以用堆栈数据结构来解决。可以使用以下逻辑编写代码。-在
相关问题 更多 >
编程相关推荐