我正在努力刮网页
https://www-nass.nhtsa.dot.gov/nass/cds/CaseForm.aspx?xsl=main.xsl&CaseID=773013618
它有三个部门。当我手动检查视图源时,我只得到一个有光标的分区数据。带代码
driver = webdriver.Ie()
driver.get('https://www-nass.nhtsa.dot.gov/nass/cds/CaseForm.aspx?xsl=main.xsl&CaseID=773013618')
content = driver.page_source
PAGEU源还提供了一个分区数据
如果我试着用
driver.switch_to_frame(1)
我得到一个错误没有这样的帧可用。网站使用JavaScript
有什么帮助吗
你已经清楚地观察到有
3 divisions
、Top Window
和2 frames
,因此我们可以得到Top Window
的page source
,然后穿过2 frames
来刮取page source
,如下所示:控制台上的输出是:
您的页面有两个框架,您有名称和id。您可以与其中任何一个进行切换
或者
使用
driver.switch_to.default_content()
切换到默认值相关问题 更多 >
编程相关推荐