假设我有这样的文本:
<p>Joe likes <ul><li>pizza</li>, <li>burgers</li>, and <li>fries</li></ul></p>
我想使用一个regex来提取使用python的<li>
/list标记之间的所有文本
regexp = <p>.+?(<li>.+?</li>).+?</p>
这只返回由<li>
/list标记包围的列表中的第一项:
<li>pizza</li>
有没有一种方法可以抓取<li>
/list标记之间的所有项,这样我的输出看起来像:
<li>pizza</li><li>burgers</li><li>fries</li>
为什么需要
<p>
标记我想要你想要的
编辑
如果您只需要在
<p>
标记之间的文本,可以通过两个步骤完成:这应该起作用:
假设您已经提取了示例字符串,您可以执行以下操作:
相关问题 更多 >
编程相关推荐