智能地漂亮地打印带有内联标记的html/xml。

prettierfier的Python项目详细描述


更漂亮

虽然我喜欢用Beautiful Soup作为解析器,BeautifulSoup.prettify()every标记之间添加换行符。 这会在应该内联的标记之间产生多余的空白,例如<sup><a><span>,等等:

<p>Introducing GitHub<sup>&reg;</sup></p>

介绍Github

<p>
    Introducing GitHub
    <sup>
        &reg;
    </sup>
</p>

Github简介 ?。

此模块将HTML/XML解析为原始字符串,以便更智能地格式化标记。

安装

您有两个选项:

  1. pip install prettierfier在命令行中
  2. prettierfier.py的内容复制到您自己的模块中。

此模块仅使用python标准库构建,不包含外部第三方依赖项。

功能

prettify_xmlxml_string,indent=2,debug=false

  • 无需预先格式化即可使用。
    Args:
        xml_string (str): XML text to prettify.
        indent (int, optional): Set size of XML tag indents.

    Test-only args:
        debug (bool, optional): Show results of each regexp application.

    Returns:
        str: Prettified XML.

prettify_htmlhtml_string,debug=false

  • 最初创建用于处理BeautifulSoup.prettify()输出。
  • 不添加或删除常规换行符。如果常规HTML已经有您要保留的换行符,则可以将其与之一起使用。
    Args:
        html_string (str): HTML string to parse.

    Test-only args:
        debug (bool, optional): Show results of each regexp application.

    Returns:
        str: Prettified HTML.

示例

import prettierfier

ugly_html = """<p>
    Introducing GitHub
    <sup>
        &reg;
    </sup>
</p>"""

pretty_html = prettierfier.prettify_html(ugly_html)
print(pretty_html) 

# Output
>>> <p>Introducing GitHub<sup>&reg;</sup></p>

链接

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
(数组)列出Java中的实现   java检测JDBC连接中尚未提交的开放事务   java H2语句池   java正在使用cardlayout,有一个我无法解决的问题   java Android MTP客户端打开的是整个设备,而不是单个接口   java Querydsl mongodb gradle springboot问题   java XML使用外部xsd验证anytype类型的XML的一部分   java如何使用Hibernate在实体中创建属性表?   intellij理念“BufferedReader”与“java.io.BufferedReader”之比较。这有关系吗?   java解释多线程的输出   Eclipse中的java Android应用程序:编辑未显示在图形布局上的文本   java如何在struts 1中使用显示标记?