所以我第一次尝试用BeautifulSoup和Python来做web抓取。我要刮的页面位于:http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172
client = request('http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172')
page_html = client.read()
client.close()
page_soup = soup(page_html)
identification = page_soup.find('div', {'data-bind':'text: name'})
print(identification.text)
当我这样做的时候,我只得到一个空字符串。如果我只打印得到的标识变量:
<div class="col-xs-7" data-bind="text: name"></div>
有几种方法可以实现相同的目标。然而,我在我的脚本中使用了选择器,它很容易理解,除非网站的html结构发生重大变化,否则很少有机会被破坏。也试试这个
结果:
顺便说一句,你开始的方式也会起作用:
您可以尝试以下代码:
输出:
相关问题 更多 >
编程相关推荐