使用CSS选择器和BeutifulSoup获取属性值

2024-09-27 21:29:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用Python进行网页抓取,并使用BeutifulSoup

我有这样的HTML标记:

<tr class="deals" data-url="www.example2.com">
<span class="hotel-name">
<a href="www.example2.com"></a>
</span>
</tr>
<tr class="deals" data-url="www.example3.com">
<span class="hotel-name">
<a href="www.example3.com"></a>
</span>
</tr>

我想得到data-urlhref值,如果我能得到href值就更好了

下面是我的相关代码片段:

^{pr2}$

Tags: namecomurl网页datawwwhoteltr
1条回答
网友
1楼 · 发布于 2024-09-27 21:29:41

您可以使用tr.deals span.hotel-name aCSS选择器来访问链接:

from bs4 import BeautifulSoup

data = """
<tr class="deals" data-url="www.example.com">
<span class="hotel-name">
<a href="wwwexample2.com"></a>
</span>
</tr>
"""

soup = BeautifulSoup(data)
print(soup.select('tr.deals span.hotel-name a')[0]['href'])

印刷品:

^{pr2}$

如果您有多个链接,请对其进行迭代:

for link in soup.select('tr.deals span.hotel-name a'):
    print(link['href'])

相关问题 更多 >

    热门问题