urllib2.urlopen(url).read()无法读取url内容

2024-10-01 09:38:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用以下python命令读取链接的web内容:http://www.quikr.com/Mobile-Phones/y149

import requests
import urllib2
hdr = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11'}
url = 'http://www.quikr.com/Mobile-Phones/y149'
req = urllib2.Request(url, headers=hdr)
page = urllib2.urlopen(req).read()

print page给出以下输出:

^{pr2}$

是否有任何解决方法来获取要读取的实际url内容。感谢任何帮助。 提前谢谢!!在


Tags: import命令comhttpurl内容hdrwww
1条回答
网友
1楼 · 发布于 2024-10-01 09:38:57

一种选择是通过^{}来自动化真正的浏览器。工作样品:

from selenium import webdriver

driver = webdriver.Firefox()
driver.get("http://www.quikr.com/Mobile-Phones/y149")

for phone in driver.find_elements_by_css_selector(".snb_entire_ad"):
    link = phone.find_element_by_css_selector("a.adttllnk")

    print link.text

driver.close()

如果要获取页面源代码,请使用^{}(当然在关闭驱动程序之前):

^{pr2}$

相关问题 更多 >