我试图用Python编写一个scraper来从页面中获取一些信息。与此页上显示的优惠标题相同:
https://www.justdial.com/Panipat/Saree-Retailers/nct-10420585
现在我使用以下代码:
import bs4
import requests
def extract_source(url):
source=requests.get(url).text
return source
def extract_data(source):
soup=bs4.BeautifulSoup(source)
names=soup.findAll('title')
for i in names:
print i
extract_data(extract_source('https://www.justdial.com/Panipat/Saree-Retailers/nct-10420585'))
但是当我执行这段代码时,它会给我一个错误:
^{pr2}$我能做些什么来解决这个问题?在
如注释中所述,您需要指定允许的用户代理并将其作为
headers
传递:输出:
^{pr2}${cdose没有响应站点请求
试试这个:
我添加了'lxml'以潜在地避免解析错误。在
相关问题 更多 >
编程相关推荐