刮取并获得任何网络si的主要内容

2024-09-22 16:31:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我想刮网页一个获得标题和任何网站的主要内容。我看到了this。如果您从该网页的任何文章中复制任何url(例如将http://en-maktoob.news.yahoo.com/pakistani-army-fuels-anger-securing-swat-taliban-025337458.html复制到textbox并按enter键),则获取标题和文章并对其进行摘要。这对大多数网站都是有效的。我想知道如何在没有使用html标记解析任何网站的情况下工作?如何得到每个网页的主要文章?在


Tags: comhttpurl网页标题内容网站html