用lxml解析Python中的XML。

2024-09-25 12:38:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我如何用python解析这个站点(http://www.tvspielfilm.de/tv-programm/rss/heute2015.xml)来获取例如SAT上20:15的电视节目? 我试过Python库lxml.etree,但我失败了:

#!/usr/bin/python
import lxml.etree as ET 
import urllib2

response = urllib2.urlopen('http://www.tvspielfilm.de/tv-programm/rss/heute2015.xml')
xml = response.read()

root = ET.fromstring(xml)

for item in root.findall('SAT'):
    title = item.find('title').text
    print title

Tags: importhttptitlewwwdexmltvsat
1条回答
网友
1楼 · 发布于 2024-09-25 12:38:10

方法Element.findall使用xpath表达式作为参数。'SAT'只查找根节点名为SAT的直接子节点,它是'rss'。如果您仍然需要在文档中找到标记,请使用'.//SAT'。在

表达式'.//items'就是您要查找的:

#!/usr/bin/python
import lxml.etree as ET 
import urllib2

response = urllib2.urlopen('some/url/to.xml')
xml = response.read()

root = ET.fromstring(xml)

for item in root.findall('.//item'):
    title = item.find('title').text
    print title

相关问题 更多 >