Python FeedParser很好地格式化了Reddit

d = feedparser.parse('https://www.reddit.com/r/cleanjokes/.rss') print("") print("Pulling latest jokes from Reddit. https://www.reddit.com/r/cleanjokes") print("") time.sleep(0.8) print("Displaying First 5 Jokes:") print("") print(d['entries'][0]['title'] + ": " + d['entries'][0]['description']) print(d['entries'][1]['title'] + ": " + d['entries'][1]['description']) print(d['entries'][2]['title'] + ": " + d['entries'][2]['description']) print(d['entries'][3]['title'] + ": " + d['entries'][3]['description']) print(d['entries'][4]['title'] + ": " + d['entries'][4]['description'])

2条回答

网友

1楼 · 编辑于 2024-05-19 07:05:38

你可以用漂亮的肥皂包来做这件事

Link to documention

from bs4 import BeautifulSoup 
soup = BeautifulSoup(html_doc, 'html.parser') 
print(soup.get_text())

网友

2楼 · 编辑于 2024-05-19 07:05:38

Oren使用beauthoulsoup是正确的，但我将尝试提供更完整的答案。在

d['entries'][0]['description']返回html，您需要解析它。bs是一个很好的库。在

您可以使用以下方法安装：

pip install beautifulsoup4

from bs4 import BeautifulSoup 
soup = BeautifulSoup(d['entries'][0]['description'], 'html.parser') 
print(soup.div.get_text())

从条目的div部分获取文本。在

相关问题更多 >

编程相关推荐

热门问题

热门文章