在标记之前删除值 - 问答 - Python中文网

在标记之前删除值

2024-10-04 01:31:22 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我在一个用br分隔的标记中有数据，我试图找出如何删除br标记之前的所有值，但遇到了困难

以下是我的数据的示例：

<td>
  ValueToBeDeleted
  <br>
  <br/> ValueToKeep
</td>

因此，我试图保留“ValueToKeep”，并删除我正在处理的数据的TD标记中的先前值。另外，我的数据文件中有数百个TD标签需要清理，所以我也在寻找迭代解决方案。有什么想法吗

Tags：数据标记 br 示例数据文件标签解决方案 td

2条回答

网友

1楼 · 编辑于 2024-10-04 01:31:22

也许：

text = text.split('<br/>')[-1]
print(text.replace('</td>','').strip())

使用BS4 BeautifulSoup：

from bs4 import BeautifulSoup as soup
soup_ = soup(html,'html.parser')
soup_ = soup_.find('td').text.split('\n')[-2]

网友

2楼 · 编辑于 2024-10-04 01:31:22

您可以使用正则表达式来完成特定的任务

您可以尝试以下适用于我的代码（需要测试更多案例）：

import re

html="""    <td>
      ValueToBeDeleted
      <br>
      <br/> ValueToKeep
    </td>"""

value_search = re.search(r'\<br\/\>(.*)', html, re.IGNORECASE)

if value_search:
    value = title_search.group(1)

print(value)

相关问题更多 >

编程相关推荐

热门问题

热门文章