擅长:python、mysql、java
<p>实际上,<code><description></code>标记中的内容是用html实体编码的,例如<code>&lt;</code>是{<cd3>},因此在解析之前需要对这些实体进行取消转义。您可以使用内置的<code>HTMLParser.HTMLParser().unescape()</code>来完成这项工作。在</p>
<pre><code>import requests
import HTMLParser
from bs4 import BeautifulSoup as soup
response = requests.get('http://lavagra.livejournal.com/data/rss&count=10&ranked=newest&similar=true')
html = soup(HTMLParser.HTMLParser().unescape(response.text), 'lxml')
items = html.find_all('item')
for item in items:
description = item.find('description')
print description
link = description.find('a')
print link
</code></pre>
<p>输出示例:</p>
^{pr2}$