这里我有一个非常简单的铲运机,用于llbean上某个项目的名称
import urllib2
from bs4 import BeautifulSoup
def mainTest():
url = "http://www.llbean.com/llb/shop/43281?feat=506697-GN2&page=women-s-l-l-bean-boots-10-shearling-lined&attrValue_0=Brown/Brown&productId=732934"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read(), "html5lib")
name = soup.find('h1', attrs={'itemprop':'name'}).text
print name
print str(soup)[:100]
mainTest()
这个铲运机通常工作。它通常打印我想要的:
^{pr2}$但有时它会打印:
None
<html><head></head><body></body></html>
这是一个很难重复的错误,对此我深表歉意。我相信问题可能出在llbean上,有时装载速度比我的铲运机快,有时我的铲运机先刮。在
也许有人会放慢脚步?在
这也可能是一个完全不同的问题。在
对我来说,下面的代码是工作-注意编码。我试了10多次都成功了。在
它打印-
^{pr2}$相关问题 更多 >
编程相关推荐