Python中文
首页
教程
问答
标签
搜索
登录
注册
如何根据网站分页器抓取和解析所有现有页面?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>有人能提供关于这个主题的代码或例子吗?在</p> <p>HTML示例:</p> <pre><code>... <dd><span class="active">1</span></dd> <dd><a href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=2">2</a></dd> <dd><a href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=3">3</a></dd> <dd><a href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=4">4</a></dd> <dd><a href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=5">5</a></dd> <dd><a href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=6">6</a></dd> <dd style="position: absolute; right: 50px;"> <a id="centerZone_vacancyList_gridList_linkNext" href="http://rabota.ua/jobsearch/vacancy_list?regionId=1&amp;pg=2">next »</a> ... </code></pre> <p>我想抓取链接以获取一个大的现有空缺列表,如JSON或XML。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>他们有一个<a href="http://rabota.ua/sitemap.xml" rel="nofollow">sitemap</a>你可以使用,它可能更容易使用。在</p> <p>您可以使用<a href="http://doc.scrapy.org/en/latest/topics/spiders.html#sitemapspider" rel="nofollow">SitemapSpider</a>。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
10 回答
如何添加表示整数的擦边字符串?
9 回答
如何添加要在Bokeh中使用的新font.ttf文件?
9 回答
如何添加要显示的矩阵XY轴编号和XY轴
6 回答
如何添加计数?
6 回答
如何添加计数器函数?
4 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
6 回答
如何添加计数器来跟踪while循环中的月份和年份?
7 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
2 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
7 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
2 回答
如何添加评论拉梅尔亚姆
2 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
6 回答
如何添加谷歌地点自动完成到Flask?
1 回答
如何添加超时、python discord bot
6 回答
如何添加超过1dp的检查
8 回答
如何添加距离方法
3 回答
如何添加跟随游戏的敌人精灵
10 回答
如何添加路径以便python可以找到程序?
6 回答
如何添加身份验证/安全性以使用happybase访问HBase?
10 回答