BS4:删除<a>标记

2024-09-30 02:30:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是BeautifulSoup 4,我有以下HTML:

<tr>
  <td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>

我只是想去掉“a”标签,把文字放在里面,像这样:

<tr>
  <td>London 10 vol 54 page</td>
</tr>

bs4有什么办法吗


Tags: targethtmlpage标签trcompanytdhref
1条回答
网友
1楼 · 发布于 2024-09-30 02:30:47

您正在搜索^{}方法:

txt = '''<tr>
  <td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>'''

from bs4 import BeautifulSoup

soup = BeautifulSoup(txt, 'html.parser')

soup.a.unwrap()

print(soup)

印刷品:

<tr>
<td>London 10 vol 54 page</td>
</tr>

相关问题 更多 >

    热门问题