一个HTML到纯文本的转换器。
pyplaintext的Python项目详细描述
一个HTML到纯文本的转换器。
您可以在https://bitmazkdemo.webfactional.com/en/pyplaintext/
安装
从pypi获得最新的稳定版本
pip install pyplaintext
从github获取最新提交
pip install -e git+git://github.com/bitmazk/pyplaintext.git#egg=pyplaintext
用法
frompyplaintextimportconverterhtml='<html><body>Hello world!</body></html>'parser=converter.HTML2PlainParser()result=parser.html_to_plain_text(html)
贡献
如果您想参与此项目,请执行以下步骤
# Fork this repository # Clone your fork mkvirtualenv -p python2.7 pyplaintext make develop make test open htmlcov/index.html git co -b feature_branch master # Implement your feature and tests git add . && git commit git push -u origin feature_branch # Send us a pull request for your feature branch