访问用ElementT解析的xml文件中的嵌套子项

import xml.etree.ElementTree as ET import urllib2 tree = ET.parse( file=urllib2.urlopen('http://ratings.food.gov.uk/OpenDataFiles/FHRS408en-GB.xml' % i)) root = tree.getroot() for child in root: print child.tag, child.attrib

2条回答

网友

1楼 · 编辑于 2024-06-28 20:25:59

希望它能有用：

import xml.etree.ElementTree as etree
with open('filename.xml') as tmpfile:
    doc = etree.iterparse(tmpfile, events=("start", "end"))
    doc = iter(doc)
    event, root = doc.next()
    num = 0
    for event, elem in doc:
        print event, elem

网友

2楼 · 编辑于 2024-06-28 20:25:59

你必须在你的根上。

这就是root.iter()的诀窍！

import xml.etree.ElementTree as ET
import urllib2
tree =ET.parse(urllib2.urlopen('http://ratings.food.gov.uk/OpenDataFiles/FHRS408en-GB.xml'))
root = tree.getroot()
for child in root.iter():
   print child.tag, child.attrib

输出：

FHRSEstablishment {}
Header {}
ExtractDate {}
ItemCount {}
ReturnCode {}
EstablishmentCollection {}
EstablishmentDetail {}
FHRSID {}
LocalAuthorityBusinessID {}
...

要在EstablishmentDetail中获取所有标记，您需要找到该标记，然后遍历其子标记！

比如说。

for child in root.find('.//EstablishmentDetail'):
    print child.tag, child.attrib

输出：

FHRSID {}
LocalAuthorityBusinessID {}
BusinessName {}
BusinessType {}
BusinessTypeID {}
RatingValue {}
RatingKey {}
RatingDate {}
LocalAuthorityCode {}
LocalAuthorityName {}
LocalAuthorityWebSite {}
LocalAuthorityEmailAddress {}
Scores {}
SchemeType {}
NewRatingPending {}
Geocode {}

为了得到你在评论中提到的Hygiene的分数

你所做的是，它将得到第一个Scores标记，当你调用for each in root.find('.//Scores'):rating=child.get('Hygiene')时，它将具有卫生性、信任管理、结构标记。也就是说，显然三个孩子都没有这个元素！

你得先 -找到所有标签。 -在找到的每个标记中查找Hygiene！

for each in root.findall('.//Scores'):
    rating = each.find('.//Hygiene')
    print '' if rating is None else rating.text

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章