迷失在XML和Python中

<ThisIsMyData> <ITEM> <Number>0</Number> <Flag1>TRUE</Flag1> <Flag2>FALSE</Flag2> <Flag3>FALSE</Flag3> <Label>RED</Label> <<-2- After finding 1 I need to change THIS(only this) <Path>C:\\test\\</Path> <-1- I need to find this <file>test.png</file> </ITEM> <ITEM> <Number>1</Number> <Flag1>TRUE</Flag1> <Flag2>FALSE</Flag2> <Flag3>FALSE</Flag3> <Label>Blue</Label> <Path>c:\\test\\test2\\</Path> <file>blue.png</file> </ITEM> </ThisIsMyData>

from xml.etree import ElementTree with open('mydata.xml', 'rt') as f: tree = ElementTree.parse(f) # filelist = ElementTree.ElementTree.find() for node in tree.findall('.//file'): FileName = node.tag, node.text print FileName

3条回答

网友

1楼 · 编辑于 2024-10-06 13:36:45

首先使用python csv模块从csv文件中获取数据。如果数据不是很大，字符串分割就可以正常工作。在

而不是使用etree.XML创建xml。在

示例：

>>>from lxml import etree
>>> csv_value = 'C:\\test\\'
>>> st = '<document>'+'<Flag1>FALSE</Flag1>' + '<Flag2>FALSE</Flag2>'+'<Path>' + csv_value + '</Path>' + '</document>'
>>> tree = etree.XML(st)
>>> etree.tostring(tree)
'<document><Flag1>FALSE</Flag1><Flag2>FALSE</Flag2><Path>C:\\test\\</Path></document>'

提取csv_value留给您作为练习。在

还有take a look at this question。在

网友

2楼 · 编辑于 2024-10-06 13:36:45

下面是一个简单的例子，说明如何使用lxml.etree和xpath来完成我认为您想要的操作。在

from cStringIO import StringIO
from lxml import etree

xmlfile = StringIO("""
<ThisIsMyData>
  <ITEM>
    <Number>0</Number>
    <Flag1>TRUE</Flag1>
    <Flag2>FALSE</Flag2>  
    <Flag3>FALSE</Flag3>
    <Label>RED</Label>
    <Path>C:\\test\\</Path>
    <file>test.png</file>
  </ITEM>
  <ITEM>
    <Number>1</Number>
    <Flag1>TRUE</Flag1>
    <Flag2>FALSE</Flag2>
    <Flag3>FALSE</Flag3>
    <Label>Blue</Label>
    <Path>c:\\test\\test2\\</Path>
    <file>blue.png</file>
  </ITEM>
 </ThisIsMyData>
""".strip())

datafile = StringIO("""
Label;FullPath
YELLOW;C:\\test\\test.png
YELLOW;c:\\test\\test2\\blue.png
""".strip())

# Read "csv". Simple, no error checking, skip first line.
filenameToLabel = {}
for l,f in (x.strip().split(';') for x in datafile.readlines()[1:]):
  filenameToLabel[f] = l

def first(seq,default=None):
  """xpath helper function"""
  for item in seq:
    return item
  return None

doc = etree.XML(xmlfile.read())

for item in doc.xpath('//ITEM'):
  item_filename = first(item.xpath('./Path/text()'),'').strip() + first(item.xpath('./file/text()'),'').strip()
  label = filenameToLabel.get(item_filename)
  if label is not None:
    first(item.xpath('./Flag1')).text = 'TRUE'
    first(item.xpath('./Flag2')).text = 'FALSE'
    first(item.xpath('./Flag3')).text = 'FALSE'
    first(item.xpath('./Label')).text = label

print etree.tostring(doc)

收益率

^{pr2}$

网友

3楼 · 编辑于 2024-10-06 13:36:45

我发现BeautifulSoup和它的姐妹，Beautiful Stone Soup，有非常好的、简洁的、基于示例的文档，有助于深入研究和尝试真实世界的示例。在

但是，我也听说，ElementTree被一些人认为是python中的黄金标准。在

相关问题更多 >

编程相关推荐

热门问题

热门文章