用于在命令行上解析html的css选择器

que的Python项目详细描述


使用css选择器在命令行上对html进行切片和骰子。

快速启动

假设你想抓住所有的链接 http://example.com/foo/bar

$ curl http://example.com/foo/bar | que "a->href"

假设给了你3行这样的代码:

/some/url?val=1
/some/url2?val=2
/some/url3?val=3

呃,那不是很有帮助,所以让我们稍微修改一下我们的论点:

$ curl http://example.com/foo/bar | que "a->http://example.com{href}"

现在,将打印:

http://example.com/some/url?val=1
http://example.com/some/url2?val=2
http://example.com/some/url3?val=3

选择

不知道如何使用css选择器?

选择器分为两部分,第一部分由->分隔 部分是在上述链接和 第二部分是要为每个 匹配:

$ css.selector->attribute,selector

选择器部分使用Python’s string formatting syntaxso 可以将所需的属性嵌入到较大的字符串中。

示例

查找页面上的所有“下载”链接:

que支持非标准的:contains css selector

$ curl http://example.com | que "a:contains(Download)->href"

选择以“foo”开头的属性data的所有链接:

$ curl http://example.com | que "a[data|=foo]->href"

安装

您可以使用pip安装stable:

$ pip install que

或者最新最伟大的 pypi

$ pip install git+https://github.com/jaymon/que#egg=que

注释

  • 如果需要一种功能更全面的html命令行解析器,请尝试 hq

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在eclipse中查找测试类   sql JAVA如何将数组传递到@NamedNativeQuery   Java通用列表   java JnetPcap:从脱机文件读取非常慢   从java读取Arduino上的LED状态   java NetBeans在安装JAXRPC插件后不会启动   java我只能连接到数据库一次   java如何将Eclipse的自动插入分号移动到光标之前?   java Kotlin Lint测试失败,即使它在生产环境中工作   在java代码中使用python库   安卓 java。lang.IllegalArgumentException:baseUrl必须以/结尾,同时对GET方法使用改型2.1.0   java如何理解servlet中的参数值?   java按子类导入父类包限定符的内部接口   在LibGDX中,在程序运行时更改fixture定义   javajavax。servlet。LocalStrings缺少资源   java如何使用FCM令牌向Android中的特定用户发送通知?   actionscript 3 Flex与Java GWT的集成   java无法解析hibernate。cfg。xml   使用相同的正则表达式时,Python和Java正则表达式的行为不同