Python类型错误：编码和替换时？有“空间”

def getDoxyDonkeyText(testUrl): request = urllib.request.urlopen(testUrl) soup = BeautifulSoup(request) mydivs = soup.findAll("div", {"class":'post-body'}) posts =[] for div in mydivs: posts+=map(lambda p:p.text.encode('ascii', errors='replace').replace("?"," "), div.findAll("li")) return posts ______________________ articleURL = "http://doxydonkey.blogspot.in" doxyDonkeyPosts = [] doxyDonkeyPosts=getDoxyDonkeyText(articleURL) _______________________

1条回答

网友

1楼 · 发布于 2024-09-26 18:14:27

str.encode()将返回类似字节的对象，用str替换将给您一个错误。您需要提供字节替换。比如(b'"?", b" ")

这是简化版。在

import urllib
from bs4 import BeautifulSoup

def getDoxyDonkeyText(testUrl):
    request = urllib.request.urlopen(testUrl)
    soup = BeautifulSoup(request, 'html.parser')
    mydivs = soup.findAll("div", {"class":'post-body'})
    posts =[]
    for div in mydivs:
        for li in div.find_all("li"):
            posts.append(
                li.text.encode('ascii', errors='replace').replace(b"?", b" ")
            )
            # if you want string
            posts.append(
                li.text.encode('ascii', errors='replace').decode().replace("?", " ")
            )
    return posts


articleURL = "http://doxydonkey.blogspot.in"
doxyDonkeyPosts=getDoxyDonkeyText(articleURL)
print(doxyDonkeyPosts)

相关问题更多 >

编程相关推荐

热门问题

热门文章