用于html tidy(tidylib)的python包装器,与python 2和3兼容

pytidylib6的Python项目详细描述


0.2.0:在Windows上工作!有关可用的dll下载,请参阅文档 位置。重写和扩展文档。

PyTidyLib是包装HTML Tidy库的python包。这个 允许您从python代码“修复”无效(x)html标记。一些 库的许多功能包括:

  • 清除未关闭的标记和未转换的字符,如与号
  • 输出HTML 4或XHTML,严格的或过渡的,并添加缺少的文档类型
  • 将命名实体转换为数字实体,然后可以在XML中使用 没有HTML文档类型的文档。
  • 清除Word等程序中的HTML(在一定程度上)
  • 缩进输出,包括pre元素的正确缩进(即否), 一些(x)html缩进代码忽略了这一点。

使用小示例

以下代码将清除无效的HTML文档并设置一个选项:

from tidylib import tidy_document
document, errors = tidy_document('''<p>f&otilde;o <img src="bar.jpg">''',
  options={'numeric-entities':1})
print document
print errors

文档

文档随源发行版一起提供,可在 网页PyTidyLib

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java RandomAccessFile:在循环中写入(字节)或写入(字节数组),哪个更有效?   从命令行运行maven+eclipse的java   在java中无法用正则表达式替换字符串   java Eclipse输出字符与键盘键值不同   JavaWeb服务(服务器客户端)。服务器使用外部项目   java试图制作“夜间模式”过滤器   java Box2d加速和限制车轮速度   javascript JQuery DataTable页面长度在第1页之后不受尊重   java如何使用DefaultCellEditor使JT的列只能得到数字,并在点后用两个符号进行四舍五入?   无法在Java中实例化泛型类型实例   java My code在我的代码中出现数组越界异常,但在前两次输入出错后,它将运行并崩溃   字符串的Java代码压缩和解压缩   SpringBootJava。lang.IllegalStateException:无法解析公共组织中的参数[0]。springframework。http。响应<java。lang.Object>   java在安卓中访问容器的子级   为什么Java不能从InputStream正确地重新创建此映像?