用lxml解析RSSFeed不那么痛苦？

def GetRSSFeed(url): out = [] feed = urllib.urlopen(url) feed = etree.parse(feed) feed = feed.getroot() for element in feed.iterfind(".//item"): meta = element.getchildren() title = meta[0].text link = meta[1].text for subel in element.iterfind(".//description"): desc = subel.text entry = [title,link,desc] out.append(entry) return out

2条回答

网友

1楼 · 编辑于 2024-06-26 13:24:51

您可以尝试speedparser，它是Universal Feed Parser与{}的实现。不过还处于测试阶段。在

网友

2楼 · 编辑于 2024-06-26 13:24:51

看看feedparser库。它提供了一个格式良好的RSS对象。在

> import feedparser
> feed = feedparser.parse('http://feeds.marketwatch.com/marketwatch/marketpulse/')
> print feed.keys()
['feed',
 'status',
 'updated',
 'updated_parsed',
 'encoding',
 'bozo',
 'headers',
 'etag',
 'href',
 'version',
 'entries',
 'namespaces']

>  len(feed.entries)
    30

编程相关推荐

CentOS上的java Spring Boot简易应用程序需要很长时间才能启动
java如何检查字符串值是否等于null？
收集器中的java映射值。分组方式（）
java需要支持Azure AD B2C webapp集成
java如何加入线程以停止它？
java如何使用意图传递类的对象？
java如何在战争环境中发现CDI生产者？
多模块项目中java奇怪的编译器行为
java如何在web应用程序中管理密码？
java从http服务器、filehandler中删除冗余代码

相关问题更多 >

编程相关推荐

热门问题

热门文章

用lxml解析RSSFeed不那么痛苦？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >