一个python模块,用于解析docx格式的microsoft word表单,并将所有字段值及其标记提取到字典中。
pywordform的Python项目详细描述
单词形式: 一个python模块,用于解析docx格式的microsoft word表单,以及 将所有字段值及其标记提取到字典中。
项目网站:http://www.decalage.info/python/pywordform
安装:
- 在Windows上,启动install.bat
- 在其他系统上,启动:setup.py install
如何使用本模块:
在MS Word中打开sample_form.docx并编辑字段值。
从shell中提取所有带有标记的字段:
>;python pywordform.py form.docx示例 field1=“你好,世界。” field2=“你好,” field3=“值B” field4=“2012年3月4日”
在python脚本中:
导入PywordForm fields=pywordform.parse_form('sample_form.docx') 打印字段
=>;返回由标记索引的字段值字典。
见http://www.decalage.info/python/pywordform 请参阅模块末尾的主程序,以及docstrings。
许可证:
请参阅license.txt。