靓汤有时有用

2024-09-30 18:34:16 发布

您现在位置:Python中文网/ 问答频道 /正文

这里我有一个非常简单的铲运机,用于llbean上某个项目的名称

import urllib2
from bs4 import BeautifulSoup

def mainTest():
    url = "http://www.llbean.com/llb/shop/43281?feat=506697-GN2&page=women-s-l-l-bean-boots-10-shearling-lined&attrValue_0=Brown/Brown&productId=732934"
    page=urllib2.urlopen(url)
    soup = BeautifulSoup(page.read(), "html5lib")
    name = soup.find('h1', attrs={'itemprop':'name'}).text
    print name
    print str(soup)[:100]

mainTest()

这个铲运机通常工作。它通常打印我想要的:

^{pr2}$

但有时它会打印:

None
<html><head></head><body></body></html>

这是一个很难重复的错误,对此我深表歉意。我相信问题可能出在llbean上,有时装载速度比我的铲运机快,有时我的铲运机先刮。在

也许有人会放慢脚步?在

这也可能是一个完全不同的问题。在


Tags: 项目nameimporturlhtmlpagebodyurllib2
1条回答
网友
1楼 · 发布于 2024-09-30 18:34:16

对我来说,下面的代码是工作-注意编码。我试了10多次都成功了。在

import urllib2
from bs4 import BeautifulSoup

def mainTest():
    url = "http://www.llbean.com/llb/shop/43281?feat=506697-GN2&page=women-s-l-l-bean-boots-10-shearling-lined&attrValue_0=Brown/Brown&productId=732934"
    page=urllib2.urlopen(url)
    page=page.read()
    soup = BeautifulSoup(page, "html5lib")
    name = soup.find('h1', attrs={'itemprop':'name'}).text.encode('utf-8')
    print name
    print unicode(soup)[:100]

mainTest()

它打印-

^{pr2}$

相关问题 更多 >