硒元素

2024-09-30 06:25:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用Selenium在以下地址创建Verizon无线电话页面:

http://www.verizonwireless.com/b2c/store/controller?item=phoneFirst&action=viewPhoneOverviewByDevice&deviceType=Phones&sortOption=priceSort&lid=//global//phones+and+accessories//cell+phones

我进入页面并使用get_html_source保存页面,没有问题,但是当我去查看页面时,我保存的所有关于手机的数据都丢失了。我似乎不明白为什么它没有保存整个页面。在

提前感谢您的帮助!在

注意:这是在python中完成的


Tags: storecomhttp地址wwwseleniumaction页面
2条回答

如果要在屏幕上打印,请尝试将其捕获为字符串,然后将其存储在记事本文件中。由于屏幕缓冲区的大小是有限的,它有时不会显示所有的页面源内容。在

我访问你提供的网址。我手动查看了源代码,并使用了一个web驱动程序;从源代码中您无法获得任何内容。在

请记住,有时(可能大多数情况下)您在HTML页面中看到的所有数据都无法使用其源代码访问;因为现在web设计者经常使用AJAX,而源代码几乎不包含任何内容;就像这个充满JQuery和JS方法的页面一样。在

这是我使用的代码,也许在其他情况下可以帮助你:

from selenium import webdriver
browser = webdriver.Firefox()

url = "http://www.verizonwireless.com/b2c/store/controller?&item=phoneFirst&action=viewPhoneOverviewByDevice&deviceType=Phones&sortOption=priceSort&lid=//global//phones+and+accessories//cell+phones"

browser.get(url)
html_source = browser.page_source
print html_source

相关问题 更多 >

    热门问题