用Python和Selenium实现JavaScript动态生成html

2024-09-29 02:21:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前在这方面遇到了动态生成html代码的问题:

http://www.economia-sniim.gob.mx/Nuevo/Home.aspx?opcion=Consultas/MercadosNacionales/PreciosDeMercado/Agricolas/ConsultaFrutasYHortalizas.aspx?SubOpcion=4|0

我想在网站上选择“Origen”和“Date”选项,但我没有所有的HTML代码。你知道吗

有人能给我一个提示,如何废弃所有动态生成的html代码?你知道吗

谢谢你


Tags: 代码httphomehtmlwww动态mxgob
1条回答
网友
1楼 · 发布于 2024-09-29 02:21:30

selenium的优点是,您可以从程序中启动浏览器会话,并在javascript中启用事件(如本例中的scroll)

In [8]: from bs4 import BeautifulSoup

In [9]: from selenium import webdriver

In [10]: driver = webdriver.Firefox()

In [11]: driver.get('http://cavemendev.com')

In [12]: html = driver.page_source

In [13]: soup = BeautifulSoup(html)

In [14]: driver.execute_script("window.scrollTo(0, Y)")

In [15]: for tag in soup.find_all('title'):
   ....:     print tag.text

如果说不通的话就告诉我

相关问题 更多 >