我想读一些新闻网站,例如rss提要纽约时报网rss:
<item>
<title>
White House Signals Acceptance of Russia Sanctions Bill
</title>
<link>
https://www.nytimes.com/2017/07/23/us/politics/trump-russia-
sanctions.html?partner=rss&emc=rss
</link>
<pubDate>Sun, 23 Jul 2017 23:26:41 GMT</pubDate>
</item>
<item>
<title>
News Analysis: For Trump and Putin, Sanctions Are a Setback
Both Sought to Avoid
</title>
<link>
https://www.nytimes.com/2017/07/23/world/europe/trump-putin-
sanctions-hacking.html?partner=rss&emc=rss
</link>
<pubDate>Mon, 24 Jul 2017 00:35:14 GMT</pubDate>
</item>
找到我还没读过的新项目,并为每个项目存储链接,标题和获取链接抓取它的一些内容。 我的问题是我能用scrapy来达到这个目的吗?如果可以,怎么用?在
是的,你可以用刮痧来达到这个目的。有两种方法可以用来构建解决方案:
现在你只需要把这些碎片拼在一起。在
相关问题 更多 >
编程相关推荐