我试图使用Lxml解析.docx文档的内容。我知道lxml将名称空间前缀替换为实际的名称空间,但是这使得检查我使用的是哪种元素标记非常困难。我想做点类似的事情
if (someElement.tag == "w:p"):
但是由于lxml坚持在完整的名称空间前面加上前缀,所以我要么做一些类似的事情
if (someElemenet.tag == "{http://schemas.openxmlformats.org/wordprocessingml/2006/main}p'):
或者从元素的nsmap属性中执行完整名称空间名称的查找,如下所示
targetTag = "{%s}p" % someElement.nsmap['w']
if (someElement.tag == targetTag):
如果有更简单的方法说服lxml
在编写这个解析器时,这将节省很多击键。这可能吗?我在文件里遗漏了什么吗?
目前没有回答
相关问题 更多 >
编程相关推荐