从Element.tag获取ID属性

type(an_element) Out[13]: bs4.element.Tag an_element Out[14]: <span class="addr"><a href="p.php?q=Ascot+Vale&sta=vic&id=2758769&address=1%2F39+Sandown+Road%2C+Ascot+Vale" target="_blank">1/39 Sandown Road</a></span>

2条回答

网友

1楼 · 编辑于 2024-09-28 21:23:06

此元素没有id。它有url，它有字符串id=，但它不是标签的id

您应该使用get("href")或regex之类的标准字符串函数来搜索文本中的值。或者可以使用urllib.parse.parse_qs('q=Ascot+...')

import urllib.parse
from bs4 import BeautifulSoup

html = '<span class="addr"><a href="p.php?q=Ascot+Vale&amp;sta=vic&amp;id=2758769&amp;address=1%2F39+Sandown+Road%2C+Ascot+Vale" target="_blank">1/39 Sandown Road</a></span>'

soup = BeautifulSoup(html)

href = soup.find('a').get('href')

args = href.split('?')[1]

data = urllib.parse.parse_qs(args)

print(data['id'][0])

编辑：使用split()相同

import urllib.parse
from bs4 import BeautifulSoup

html = '<span class="addr"><a href="p.php?q=Ascot+Vale&amp;sta=vic&amp;id=2758769&amp;address=1%2F39+Sandown+Road%2C+Ascot+Vale" target="_blank">1/39 Sandown Road</a></span>'

soup = BeautifulSoup(html)

href = soup.find('a').get('href')

args = href.split('?')[1]

id_ = args.split('id=')[1].split('&')[0]

print(id_)

网友

2楼 · 编辑于 2024-09-28 21:23:06

您只需要提取url并解析查询参数。正则表达式的另一种方法：

 from bs4 import BeautifulSoup
 import re

 soup = BeautifulSoup('<span class="addr"><a href="p.php?q=Ascot+Vale&amp;sta=vic&amp;id=2758769&amp;address=1%2F39+Sandown+Road%2C+Ascot+Vale" 
    target="_blank">1/39 Sandown Road</a></span>',"html.parser")
 links = soup.findAll('a', href=True)
 for link in links:
    href = link['href']
    a = re.search("id=.*&",href)
    if a:
      x = a.group(0)
      x = x[:-1]
      print(x)

相关问题更多 >

编程相关推荐

热门问题

热门文章

从Element.tag获取ID属性

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >