使用getElementsByTagName在python中获取标签<string name="ID">

<list> <ProfileDefinition> <string name="ID">nCGhwaZNpy6</string> <string name="name">02.11.2013 Scott Mobile</string> <decimal name="AccountID">10954</decimal> <decimal name="TimeZoneID">-600</decimal> </ProfileDefinition><ProfileDefinition> <string name="ID">9JsG57bRUu6</string> <string name="name">Huggies US-EN & CA-EN Test Town Responsive - Prod</string> <decimal name="AccountID">10954</decimal> <decimal name="TimeZoneID">-600</decimal> </ProfileDefinition><ProfileDefinition> <string name="ID">I3CJQ4gDkK6</string> <string name="name">Huggies US-EN Brand Desktop - Prod</string> <decimal name="AccountID">10954</decimal> <decimal name="TimeZoneID">-600</decimal></ProfileDefinition>

import urllib2 theurl = 'https://ws.webtrends.com/v2/ReportService/profiles/?format=xml' pagehandle = urllib2.urlopen(theurl) ########################################################################## from xml.dom.minidom import parseString file = pagehandle data = file.read() file.close() dom = parseString(data) xmlTag = dom.getElementsByTagName('string name="ID"')[0].toxml() xmlData=xmlTag.replace('<string name="ID">','').replace('</string>','') print xmlTag print xmlData

1条回答

网友

1楼 · 发布于 2024-05-19 16:36:09

string name="ID"不是标记名。只有string是标记名。

必须比较每个string标记的name属性值。

....
dom = parseString(data)
for s in dom.getElementsByTagName('string'):
    if s.getAttribute('name') == 'ID':
        print s.childNodes[0].data

我建议您使用lxml或BeautifulSoup。

下面是使用lxml的等效代码。

import lxml.html
dom = lxml.html.fromstring(data)
for s in dom.cssselect('string[name=ID]'):
    print s.text

相关问题更多 >

编程相关推荐

热门问题

热门文章