如何在python中的HTML上运行jquery命令进行DOM操作/抓取?

2024-09-02 02:48:46 发布

您现在位置:Python中文网/ 问答频道 /正文

{cookeim(^和cookeim)从网站上得到回复。现在,我正在寻找一种简单的方法来使用jQuery从web服务器返回的响应中获取数据。在

我知道python中还有其他模块可以用于web抓取(like),但它是否可能只使用jQuery命令?我假设在python中需要某种js解析器?在

我之所以想使用jQuery,是因为我有大约20个Greasemonkey脚本(大部分是别人写的),它们对许多web站点和web游戏进行了一些有趣的修改。它们使用jQuery完成所有的DOM修改。我希望能够简单地将其移植到python(实现简单而有效的自动化),而不是完全重构这些可工作且可靠的代码。在


Tags: 模块方法命令脚本web解析器游戏站点
2条回答

使用lxml解析HTML并使用其^{} module

from lxml.cssselect import CSSSelector
from lxml import etree

tree = etree.parse(document)
elements = CSSSelector('div.content')(tree)

pyquery非常适合此任务。在

它允许您在Python的(X)HTML/XML上使用类似jQuery的选择器。在

例如:

>>> from pyquery import PyQuery as pq
>>> d = pq("<html><p id="hello">Foo</p></html>")

>>> d("#hello")
[<p#hello.hello>]

>>> d('p:first')
[<p#hello.hello>]

有关详细信息,请参阅complete API documentation,有关源代码和问题跟踪程序,请参阅project page on bitbucket。在

相关问题 更多 >