美极了,芬德尔一个接一个?

2024-10-01 15:34:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我对Python很陌生,主要需要它来从网站获取信息。 在这里,我试图从网站的底部得到简短的标题,但不能完全得到。在

from bfs4 import BeautifulSoup
import requests

url = "http://some-website"
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")

nachrichten = soup.findAll('ul', {'class':'list'})

现在我需要另一个findAll来从var“nachrichten”获取所有链接/a,但是我该怎么做呢?在


Tags: fromimporthttpurl标题网站somewebsite
2条回答
from bs4 import BeautifulSoup
import requests
url = "http://www.n-tv.de/ticker/"
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")
nachrichten = soup.findAll('ul', {'class':'list'})
links = []
for ul in nachrichten:
    links.extend(ul.findAll('a'))
print len(links)

希望这能解决你的问题,我想进口的是bs4。我从来没有一群小朋友

如果要在一个列表中包含所有链接,请使用css选择器

anchors = soup.select('ul.list a')

如果需要单独的列表:

^{pr2}$

另外,如果需要href,可以确保只找到具有href属性的锚并提取:

hrefs = [a["href"] for a in soup.select('ul.list a[href]')]

使用find_all设置href=Trueul.find_all(a, href=True)。在

相关问题 更多 >

    热门问题