我试图阅读以下内容:
我的目标是阅读本页中的每个职位名称-https://www.cvbankas.lt/?miestas=Vilnius&padalinys%5B%5D=&keyw=python
我所尝试的:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.cvbankas.lt/?miestas=Vilnius&padalinys%5B%5D=&keyw=python'
page = requests.get(URL).text
soup = BeautifulSoup(page, 'html.parser')
results = soup.find(id='ResultsContainer')
# Look for Python jobs
python_jobs = results.find_all("div", string=lambda t: "python" in t.lower())
for p_job in python_jobs:
link = p_job.find("h3")["href"]
print(p_job.text.strip())
print(f"Apply here: {link}\n")
但我得到了以下错误:
AttributeError: 'NoneType' object has no attribute 'find_all'
我怎样才能读所有的标题
签出我的代码:
输出为:
您的问题是没有id为
"ResultsContainer"
的元素但是参考页面的结构,您可以使用
css selector
直接获取所有信息:结果:
问题是,没有任何带有
id="ResultsContainer"
的标记。您可以使用文本Python搜索所有<h3>
标记,然后查找url的父<a>
标记:印刷品:
相关问题 更多 >
编程相关推荐