我需要一个字符串,如下所示:
original_str="SnO<sub>2</sub>solution-based (a<100 <sup>o</sup> AAAC>u_test)abcdhhhh"
规则是
"<" or ">" to "<" or ">" if they are not part of a HTML tag.
PS:The string only has <sup></sup><sub></sub> html tag
因此,处理后的字符串应该是:
process_str="SnO<sub>2</sub>solution-based (a<100 <sup>o</sup> AAAC>u_test)abcdhhhh"
我不知道如何使用正则表达式来处理这个问题。你知道吗
使用regex解析HTML不是一个好主意-有关详细信息,请参见this answer。你知道吗
而是使用容错HTML解析器来读取字符串,然后生成兼容的输出。你知道吗
如果您只需要最初发布的片段,请使用
相关问题 更多 >
编程相关推荐