AttributeError:lxml parse getroot方法的非类型

url = 'http://www.selangortimes.com' br = mechanize.Browser() br.set_handle_robots(False) br.set_handle_refresh(False) br.addheaders = [('User-Agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)')] br.open(url) resp = br.response() html = lxml.html.parse(resp).getroot() link_targets = [link.attrib.get('href') for link in html.xpath(expr)]

1条回答

网友

1楼 · 发布于 2024-09-30 18:13:21

下面是您发布的代码的稍微修订版本，使用lxml2.3.6和mechanize0.2.5生成一个列表，其中列出了<a>元素中位于http://www.selangortimes.comurl的所有href属性。注意关于您最近的评论，您必须import lxml.html。在

import mechanize
import lxml.html

url = 'http://www.selangortimes.com'
br = mechanize.Browser()
br.set_handle_robots(False)
br.set_handle_refresh(False)
br.addheaders = [('User-Agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)')]
br.open(url)
resp = br.response()
html = lxml.html.parse(resp).getroot()
link_targets = [link.attrib.get('href') for link in html.xpath('//a')]
print(link_targets)

相关问题更多 >

编程相关推荐

热门问题

热门文章