我已经尝试了许多方法将其编码到最终结果"BACK RUSHIN'"
,其中最重要的字符是右撇号'
。
我想用Python的一些内置函数得到这个结果,在这些函数中,普通字符串和unicode字符串之间没有区别。
这是我用来检索字符串的代码:str(unicode(etree.tostring(root.xpath('path')[0],method='text', encoding='utf-8'),errors='ignore')).strip()
结果是:'BACK RUSHIN'
撇号'
丢失。
另一种方法是:root.xpath('path/text()')
结果是:python中的u'BACK RUSHIN\u2019'
。
最后,如果我尝试:u'BACK RUSHIN\u2019'.encode('ascii', 'replace')
结果是:'BACK RUSHIN?'
请不要替换函数,我想使用pythons编解码器库。 也不打印字符串,因为它被保存在变量中。
谢谢
unidecode
相关问题 更多 >
编程相关推荐