在Python中使用BeautifulSoup获取具有特定类属性的链接的ref文本

2024-05-03 14:43:04 发布

您现在位置:Python中文网/ 问答频道 /正文

如何在与类匹配的锚标记中仅从a href获取文本。所以如果我有

<a href="Link_I_Need.html" class="Unique_Class_Name">link text</a>

如何仅从类唯一的锚标记获取string Link_I_Need.html?


Tags: textname标记文本stringhtmllinkneed
2条回答
<a class="blueText" href="/info/046386294000000899/?s_bid=046386294000000899&amp;s_sid=FSP-LSR-002&amp;s_fr=V01&amp;s_ck=C01" target="_blank">川村商店</a>

你只能收到这样的短信

for url in url_list:
    res = requests.get('%s' % url)
    soup = bs4.BeautifulSoup(res.text, "html.parser")
    for p in soup.find_all('a', class_='blueText'):
        print(p.text) 

使用^{}^{}方法选择具有href属性和Unique_Class_Name类属性的元素。然后遍历元素并访问href属性值:

soup = BeautifulSoup(html)
anchors = soup.find_all('a', {'class': 'Unique_Class_Name', 'href': True})

for anchor in anchors:
    print (anchor['href'])

也可以将基本CSS选择器与^{} method一起使用:

soup = BeautifulSoup(html)

for anchor in soup.select('a.Unique_Class_Name'):
    if anchor.has_attr('href'):
        print (anchor['href'])

相关问题 更多 >