python2.7中包含元音变音的字符串分割

2条回答

网友

1楼 · 编辑于 2024-10-01 17:36:26

而不是直接处理字符串的问题：

In [1]: k = 'A|B|C|AT|Dxbensäce|S|'  
In [3]: k
Out[3]: 'A|B|C|AT|Dxbens\xc3\xa4ce|S|'
In [9]: print(k)
A|B|C|AT|Dxbensäce|S|

网友

2楼 · 编辑于 2024-10-01 17:36:26

使用unicode类型来处理文本，而不是bytestrings（python2上的str）。使用u''unicode文本或在模块顶部添加from __future__ import unicode_literals
不要混淆对象及其文本表示（repr()）。打印Python列表会对其项调用repr()。要以ascii字符显示不可打印（在Python2上），请自己格式化列表，例如：
```
print ":".join(some_list)
```

无关：如果Python源代码中有非ascii文本字符（例如，u'ä'），那么您应该确保编辑器/IDE遵守编码声明（顶部的# -*- coding: utf-8 -*-行），并使用指定的字符编码来保存Python源文件。在

下面是一个完整的代码示例：

^{pr2}$

A:C:Dxbensäce: