用python将异域字符集转换为字符串

3条回答

网友

1楼 · 编辑于 2024-09-27 01:30:49

在this answer的帮助下：

>>> table = dict([(x + 0xFF00 - 0x20, unichr(x)) for x in xrange(0x21, 0x7F)] + [(0x3000, unichr(0x20))])
>>> data.translate(table)
u'A Deuce'

translate方法接受一个将一个Unicode代码点映射到另一个Unicode代码点的字典。在本例中，它将全角拉丁字母（本质上是向上移动到0xFF01-0xFF5E范围的ASCII字符集的一部分）映射到“普通”ASCII字符集。例如，0xFF21（全角A）映射到0x41（ASCII A），0xFF22（全角B）映射到0x42（ASCII B），等等

网友

2楼 · 编辑于 2024-09-27 01:30:49

此功能内置于unicodedata模块中：

>>> unicodedata.normalize('NFKC', 'Ａ　Ｄｅｕｃｅ')
'A Deuce'

网友

3楼 · 编辑于 2024-09-27 01:30:49

考虑使用python3，它对Unicode字符有更好的打印支持。下面是一个示例：

>>> s=u'\uff21\u3000\uff24\uff45\uff55\uff43\uff45'
>>> print(s)
Ａ　Ｄｅｕｃｅ
>>> s
'Ａ\u3000Ｄｅｕｃｅ'
>>> import unicodedata as ud
>>> ud.name('\u3000')
'IDEOGRAPHIC SPACE'
>>> print(ascii(s))
'\uff21\u3000\uff24\uff45\uff55\uff43\uff45'

相关问题更多 >

编程相关推荐

热门问题

热门文章

用python将异域字符集转换为字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >