构建一个python web scraper，需要帮助来获得正确的输出

2条回答

网友

1楼 · 编辑于 2024-09-30 14:31:49

像这样使用^{}：

import requests    
from bs4 import BeautifulSoup

r = requests.get("http://www.ebizmba.com/articles/torrent-websites")

soup = BeautifulSoup(r.text, "html.parser")
data = soup.find_all("div", {"class:", "main-container-2"})

for i in data:
    for j in i.contents[1].find_all("a"):
        print(j.get('href'))

全输出：

^{pr2}$

网友

2楼 · 编辑于 2024-09-30 14:31:49

如果你在网上练习，看看正则表达式。这里只会得到标题链接。。。针串是匹配字符串，括号(http://.*?)包含匹配组。在

import urllib2
import re

myURL = "http://www.ebizmba.com/articles/torrent-websites"
req = urllib2.Request(myURL)

Needle1 = '<p><a href="(http:.*?)" rel="nofollow" target="_blank">'
for match in re.finditer(Needle1, urllib2.urlopen(req).read()):
   print(match.group(1))

编程相关推荐

用Java打印布尔数组
java rich:datascroller不使用Internet Explorer上的rich:datatable
java以编程方式将vector drawable/SVG绘制到屏幕上
javacom。fasterxml。杰克逊。数据绑定。exc.InvalidDefinitionException:没有为ObjectReader配置值类型
java无法在Spring Boot中加载静态文件
java“未能延迟初始化角色集合”异常即使在我使用OSIV模式时也会发生
java Glass Fish 3连接拒绝Netbeans IDE 8
java警告：在类型“onLifeCycleeEvent”中找不到注释方法“value（）”：安卓类文件。拱生命周期。未找到OnliFecCycleeEvent
java Android用户界面停止响应
java从字符串末尾获取整数（可变长度）

相关问题更多 >

编程相关推荐

热门问题

热门文章

构建一个python web scraper，需要帮助来获得正确的输出

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >