带有PhantomJS的Selenium不会被重定向

2024-09-25 00:23:19 发布

您现在位置:Python中文网/ 问答频道 /正文

关于这个问题的具体例子,当我在常规浏览器中转到以下地址时:

http://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240

我被重新定向到https

https://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240

我在Python交互式shell中尝试了以下操作:

>>> from selenium import webdriver
>>> driver = webdriver.PhantomJS()
>>> driver.get("http://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240")
>>> driver.current_url
u'http://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240'

从输出中可以看出,重新定向没有发生。我稍等了一会儿,再次发出driver.current_url,但输出结果相同。如何使Selenium像在常规浏览器中那样被重新定向?在

编辑:我试图将Selenium直接发送到https地址,但它无法发送!可能是因为这个url是一个文件吗?如果这是正常行为,那么当我只有http链接时,如何找到文件的url?在


Tags: httpsorghttpurlindexwwwdriverpaper
1条回答
网友
1楼 · 发布于 2024-09-25 00:23:19

问题是你的页面没有使用30X,而是使用了不同的方法使用Refresh头。刷新标头的格式为

Refresh: 5; url=http://www.example.org/fresh-as-a-summer-breeze

其中5表示5秒后加载url。您可以看到我如何使用IPython+请求提取它重定向到的url

^{pr2}$

相关问题 更多 >