使用python找到HTML标签

2024-10-01 00:24:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个HTML文件,我想找出id以“tr”开头的<tr>标记,比如"id=tr3245""id=tr8796"

<tr id=tr1256>
  ....
</tr>
<tr id=tr5847>
  ....
</tr>
<tr id=tr8746>
  ....
</tr>
<tr id=tr9844>
  ....
</tr>

我怎么能用“靓汤”来做这个呢?在


Tags: 文件标记idhtmltrtr8746tr5847tr9844
1条回答
网友
1楼 · 发布于 2024-10-01 00:24:56

BeautifulSoup.selecttr[id^="tr"]css选择器一起使用(请参见Beautiful Soup Documentation - CSS Selector):

from bs4 import BeautifulSoup

html = '''
<tr id=tr1256>
  ....
</tr>
<tr id=tr5847>
  ....
</tr>
<tr id=tr8746>
  ....
</tr>
<tr id=tr9844>
  ....
</tr>
'''

soup = BeautifulSoup(html)
for tr in soup.select('tr[id^="tr"]'):
    print(tr.get('id'))

印刷品

^{pr2}$

相关问题 更多 >