我打赌这是个愚蠢的问题,我来了。在
我在做Fedora21。在
从数据库中,我收到字符串:
16 de enero de 1979 – 25 de agosto de 2001
我要用中间的'-'来分割字符串。
所以我要做的是:
text = '16 de enero de 1979 – 25 de agosto de 2001'
Python 2.7.8:
^{pr2}$Python3.4版。在
text
# returns: '16 de enero de 1979 – 25 de agosto de 2001'
text.split('-')
#returns: ['16 de enero de 1979 – 25 de agosto de 2001']
我知道python3.x的默认编码是utf-8,python2.x的默认编码是ascii,但我从来没有完全理解清楚,我们到底该如何处理这些编码的事情。
当我将这些信息存储在数据库中时,我使用charset='utf-8'
来确保我不会遇到这种麻烦。而且知道我在检索信息,Python处理编码的能力不强。或者。。。我不能很好地处理Python(很可能)。
提前谢谢。在
from __future__ import unicode_literals
,或者调用:text = utf8bytes.decode('utf-8')
u'\N{EN DASH}'
它不是正常的连字符。它是一个unicode字符
\u2013
。我试过这样的方法:在您的例子中,它不工作,因为它找不到
-
(连字符)。在错误是你在错误的字符上分开。在
原始字符串中的字符是长破折号“-”,而split参数中的字符是短破折号“-”。在
相关问题 更多 >
编程相关推荐