我应该使用哪种编码标准来支持大多数字符数?

2024-10-02 06:23:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我想解析提要

feed = feedparser.parse(url)
e = feed.entries[0]
summary=e['summary']

现在当我用beauthoulsoap分析摘要时。在

^{pr2}$

我有错误。在

Exception Type: UnicodeEncodeError Exception Value: 'ascii' codec can't encode character u'\xa3' in position 755: ordinal not in range(128)

问题出在4000英镑的字符上。我试过:

summary.encode('utf-8','ignore'), summary.encode('ascii','ignore')

我花了很多时间来解决这个问题,但还是做不到。所以我在这里问这个问题。在

如果你告诉我支持大多数字符数的编码或任何跳过该字符的方法,那将是非常有帮助的。在


Tags: inurlparsefeed错误asciiexceptionsummary
1条回答
网友
1楼 · 发布于 2024-10-02 06:23:51

我尝试将一个带有utf8磅符号的html文件加载到一个字符串“file”中

这和你看到的错误是一样的

soup2=BeautifulSoup(file.encode('utf8'))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 17: ordinal not in range(128)

然而,这似乎很管用

^{pr2}$

我想“编码”和“解码”的概念与你所期望的完全相反。希望这有帮助。在

相关问题 更多 >

    热门问题