2024-10-04 01:31:22 发布
网友
我在一个用br分隔的标记中有数据,我试图找出如何删除br标记之前的所有值,但遇到了困难
以下是我的数据的示例:
<td> ValueToBeDeleted <br> <br/> ValueToKeep </td>
因此,我试图保留“ValueToKeep”,并删除我正在处理的数据的TD标记中的先前值。另外,我的数据文件中有数百个TD标签需要清理,所以我也在寻找迭代解决方案。有什么想法吗
也许:
text = text.split('<br/>')[-1] print(text.replace('</td>','').strip())
使用BS4 BeautifulSoup:
from bs4 import BeautifulSoup as soup soup_ = soup(html,'html.parser') soup_ = soup_.find('td').text.split('\n')[-2]
您可以使用正则表达式来完成特定的任务
您可以尝试以下适用于我的代码(需要测试更多案例):
import re html=""" <td> ValueToBeDeleted <br> <br/> ValueToKeep </td>""" value_search = re.search(r'\<br\/\>(.*)', html, re.IGNORECASE) if value_search: value = title_search.group(1) print(value)
也许:
使用BS4 BeautifulSoup:
您可以使用正则表达式来完成特定的任务
您可以尝试以下适用于我的代码(需要测试更多案例):
相关问题 更多 >
编程相关推荐