从web元素中获取所选文本

2024-07-05 12:40:00 发布

您现在位置:Python中文网/ 问答频道 /正文

为什么有可能从td标签中获得纯文本的第一个文本,如“Zubr Polish Lager 6%”

<td width="35%">Amber Storm Scotch Ale 6% 
                    <br/>SIZE/LIFE: 330ml <b>CASE</b>
                    <br/>UOS: 12
                    <br/>RRP: £1.59
                    <br/>POR%: 100.1%
                    </td>

Tags: 文本brsize标签widthtdcasestorm
3条回答

在td元素中输入id,如下所示

<td width="35%"><div id="myId">Amber Storm Scotch Ale 6% </div>
                    <br/>SIZE/LIFE: 330ml <b>CASE</b>
                    <br/>UOS: 12
                    <br/>RRP: £1.59
                    <br/>POR%: 100.1%
                    </td>

然后你可以打电话给你的身份证

优于使用</br>你可以使用一些类似<p>

<td width="35%">
   <p>Amber Storm Scotch Ale 6% </p>
   <p>SIZE/LIFE: 330ml <b>CASE</b></p>
   <p>UOS: 12 </p>
   <p>RRP: £1.59 </p>
   <p>POR%: 1B00.1% </p>
</td>

在JS中,u可以使用firstElementChild.innerHtml获取第一个p元素的内容

但为此,您需要向ur<td>添加一个id

如果您是网页垃圾处理使用BeautifulSoup获取文本HTML

!pip install beautifulsoup4
from bs4 import BeautifulSoup
html = """
<td width="35%">Amber Storm Scotch Ale 6% 
                    <br/>SIZE/LIFE: 330ml <b>CASE</b>
                    <br/>UOS: 12
                    <br/>RRP: £1.59
                    <br/>POR%: 100.1%
                    </td>
"""
BeautifulSoup(html).find('td').text.split('\n')[0]

Output: 'Amber Storm Scotch Ale 6% '

相关问题 更多 >