Python中文
首页
教程
问答
标签
搜索
登录
注册
网络抓取形成新闻数据库
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在为不同的新闻机构创建一个网页刮板。我试图为<code>The Hindu</code>报纸创建一个。在</p> <p>我想从它的档案中提到的各个环节得到新闻。假设我想在第二天的链接上得到新闻:<code>http://www.thehindu.com/archive/web/2010/06/19/</code>那是2010年6月19日。在</p> <p>现在我写了以下几行代码:</p> <pre><code>import mechanize from bs4 import BeautifulSoup url = "http://www.thehindu.com/archive/web/2010/06/19/" br = mechanize.Browser() htmltext = br.open(url).read() articletext = "" soup = BeautifulSoup(htmltext) for tag in soup.findAll('li', attrs={"data-section":"Business"}): articletext += tag.contents[0] print articletext </code></pre> <p>但我无法得到所需的结果。我基本上被卡住了。有人能帮我解决吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我建议你退房。用你的参数试试他们的教程,然后用它来做实验。他们有一个比机械化模块更发达的网络爬行基础设施。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何用强化学习更新函数逼近中的权重?
2 回答
如何用归并排序计算倒数?
2 回答
如何用当前数据拟合正弦波?
9 回答
如何用当前页面的值填充表单?
10 回答
如何用彩色地图在2dpython直方图中勾勒出箱子的轮廓?
8 回答
如何用彩色地图给等高线标签上色?
2 回答
如何用彩色打印到控制台?
2 回答
如何用彩色条绘制2d直方图,在Python中显示第三个变量的平均值?
4 回答
如何用彩色条绘制直方图,其中的颜色应与xaxis中的值一致?
2 回答
如何用彩色贴图填充曲线和原始边之间的区域?
1 回答
如何用循环分割数组并对其应用操作?
6 回答
如何用循环创建多个子集的数据帧
2 回答
如何用循环和递归实现求和
3 回答
如何用循环填充数组?
8 回答
如何用循环当前引用的位置更新变量?
2 回答
如何用循环求这个级数的和
8 回答
如何用循环解这个方程?
6 回答
如何用循环语句逐个读取数据帧中的数据?
1 回答
如何用循环除法?(Python)
7 回答
如何用感知一致性对HSV空间进行采样
1 回答