UnicodeEncodeError:“ascii”编解码器无法对位置3 2中的字符u“\u2013”进行编码：序号不在范围（128）内

网友

1楼 · 编辑于 2024-09-29 02:19:27

因为这里str(u'\u2013')会导致错误，所以使用isinstance(foo,basestring)检查unicode/string，如果不是base string类型，则将其转换为unicode，然后应用encode

if isinstance(foo,basestring):
    foo.encode('utf8')
else:
    unicode(foo).encode('utf8')

further read

网友

2楼 · 编辑于 2024-09-29 02:19:27

也可以打印Unicode对象，不需要对其执行str（）操作。

假设你真的想要一个str：

在执行str（u'\u2013'）时，尝试将Unicode字符串转换为8位字符串。为此，您需要使用编码，即Unicode数据到8位数据之间的映射。str（）的作用是使用系统默认编码，在Python 2下是ASCII。ASCII只包含Unicode的127个第一代码点，即\u0000到\u007F1。结果是您得到了上述错误，ASCII编解码器只是不知道什么是u2013（顺便说一句，它是一个长破折号）。

因此，需要指定要使用的编码。常见的有ISO-8859-1，最常见的是拉丁语-1，它包含256个第一代码点；UTF-8，它可以使用可变长度编码对所有代码点进行编码；CP1252，在Windows上是常见的；以及各种中文和日语编码。

你这样使用它们：

u'\u2013'.encode('utf8')

结果是一个包含字节序列的str，该字节序列是所讨论字符的uTF8表示：

'\xe2\x80\x93'

你可以打印出来：

>>> print '\xe2\x80\x93'
–

网友

3楼 · 编辑于 2024-09-29 02:19:27

你也可以试试这个来获取文本。

foo.encode('ascii', 'ignore')

相关问题更多 >

编程相关推荐

热门问题

热门文章