将HTML转换为降价
html2txt的Python项目详细描述
HTML2XT
html2text将HTML转换为markdown。在
使用
导入模块。在
fromhtml2txtimportconverters
对HTML文本调用Html2Markdown转换器将其转换为markdown。在
^{pr2}$运行转换器进行单元测试
> cd html2txt/converters
> python3 -B html2markdown.py --path path-to-html-directory
测试
创建虚拟环境
> cd html2txt > python3 -m venv venv > source ./venv/bin/activate
进行测试
Commonmark和Breakdance测试是为将markdown转换成HTML而编写的,因此许多测试由于空格和markdown表示方式的选择不同而失败。在
Breakdance由降价编辑器Dillinger使用。在
> cd html2txt/tests
> python3 -B ./config/mkhtml2txt.py --path .
> python3 -B ./config/mkcommonmark.py --path .
> python3 -B ./config/mkbreakdance.py --path .
> python3 -B ./config/mksvgweb.py --path .
> python3 -B ./config/mkmathml.py --path .
运行测试
> pytest -vv
- 项目
标签: