我正在尝试解析this site,但由于我无法理解的原因,什么都没有发生。在
url = 'http://www.zap.com.br/imoveis/rio-de-janeiro+rio-de-janeiro/apartamento-padrao/venda/'
response = urllib2.urlopen(url).read()
doc = BeautifulSoup(response)
divs = doc.findAll('div')
print len(divs) # prints 0.
这个网站是巴西里约热内卢的一个真实的州广告。我在html源代码中找不到任何可以阻止beauthulsoup工作的东西。会是这个尺寸吗?在
我使用的是热情的Canopy Python 2.7.6、IPython Notebook 2.0、BeautifulSoup4.3.2。在
您的环境有问题,以下是我得到的输出:
这是因为您让
BeautifulSoup
为您选择最合适的解析器。而且,这实际上取决于在python环境中安装了什么模块。在根据documentation:
所以,不同的解析器-不同的结果:
解决方案是指定一个解析器来处理这个特定页面的解析,您可能需要安装^{} 或{a3}。在
另请参见:Differences between parsers。在
相关问题 更多 >
编程相关推荐