从soup BeautifulSoup/Python中删除span标记

2024-05-10 12:44:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个Python汤,像这样:

<p>
 <span style="text-decoration: underline; color: #3366ff;">
   Title:
 </span>
 Info
</p>
<p>
 <span style="color: #3366ff;">
  <span style="text-decoration: underline;">
   Title2:
  </span>
 </span>
 Info2
</p>

我想让它看起来像这样:

<p>
   Title:
 Info
</p>
<p>
   Title2:
 Info2
</p>

有没有办法用bs4做这个?


Tags: textinfotitlestylecolorspanunderline办法
2条回答

您还可以使用replace_with删除span标记:

from bs4 import BeautifulSoup
soup = BeautifulSoup(html)
for span_tag in soup.findAll('span'):
    span_tag.replace_with('')
print(soup)

你会想用美组的unwrap()来做这个。

import bs4
soup1 = bs4.BeautifulSoup(htm1, 'html.parser')
for match in soup1.findAll('span'):
    match.unwrap()
print soup1

相关问题 更多 >