这是一个函数,我在这个函数中尝试使用beauthoulsouppython库从<li>
标记获取文章,并对其进行编码、替换(“?”," "). 在
def getDoxyDonkeyText(testUrl):
request = urllib.request.urlopen(testUrl)
soup = BeautifulSoup(request)
mydivs = soup.findAll("div", {"class":'post-body'})
posts =[]
for div in mydivs:
posts+=map(lambda p:p.text.encode('ascii', errors='replace').replace("?"," "), div.findAll("li"))
return posts
______________________
articleURL = "http://doxydonkey.blogspot.in"
doxyDonkeyPosts = []
doxyDonkeyPosts=getDoxyDonkeyText(articleURL)
_______________________
这是我得到的错误。在
^{2}$我们将非常感谢错误的原因和解决方法。 提前谢谢。在
str.encode()
将返回类似字节的对象,用str替换将给您一个错误。您需要提供字节替换。比如(b'"?", b" ")
这是简化版。在
相关问题 更多 >
编程相关推荐