Python中文
首页
教程
问答
标签
搜索
登录
注册
从页面中提取特定的URL并将它们转换为绝对URL
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我需要你们的帮助:我正在抓取所有以details.php?" 从<a href="http://evenementen.uitslagen.nl/2013/marathonrotterdam/uitslag01002nl.html" rel="nofollow">this page</a>忽略所有其他URL。在</p> <p>然后,我需要将我刚刚抓取的每个url转换成一个绝对url,这样我就可以一个一个地抓取它们。绝对URL以:<a href="http://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php" rel="nofollow">http://evenementen.uitslagen.nl/2013/marathonrotterdam/details.php</a>?。。。在</p> <p>我试着像这样使用<code>re.findall</code>:</p> <pre><code>html = scraperwiki.scrape(url) if html is not None: endofurl = re.findall("details.php?(.*?)>", html) </code></pre> <p>这给了我一张单子,但是我被卡住了。有人能帮我吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果您需要一个接一个地使用最终的url,那么应该使用generator而不是迭代器。在</p> <pre><code>abs_url = "url data" urls = (abs_url+url for url in endofurl) </code></pre> <p>如果您担心对可以使用的url进行编码urllib.urlencode(url)</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
3 回答
如何在python中从数据帧列表中删除引号
4 回答
如何在python中从数据帧创建列表
9 回答
如何在Python中从数据帧创建嵌套的JSON
10 回答
如何在Python中从数据帧显示wordcloud
10 回答
如何在Python中从数据帧的时间戳中删除字符
1 回答
如何在Python中从数据帧绘制简单绘图?
9 回答
如何在python中从数据帧行提取具有特定长度的范围?
3 回答
如何在python中从数据帧设置dict中的值
3 回答
如何在Python中从数据库中获得一个结果
9 回答
如何在python中从数据框中绘制分类条形图
3 回答
如何在Python中从数据框中选择特定细节?
3 回答
如何在python中从数据集中删除unicode
9 回答
如何在python中从数据集中删除某些数值?
5 回答
如何在python中从数据集中选择行
3 回答
如何在Python中从数组中删除元素
7 回答
如何在python中从数组中删除单个倒逗号?
6 回答
如何在python中从数组中删除对象?
4 回答
如何在python中从数组中删除引号
5 回答
如何在python中从数组中删除所有最小值
2 回答