我有一些行包含一些讨厌的控制字符:
当我试图读取文件并执行str.replace()
操作时,这些控制字符没有被替换。我试过了,但它仍然在附近。在
with io.open('infile', 'r', encoding='utf8') as fin:
for line in fin:
line = line.replace(u'\u0094', '"').replace(u'\u0093', '"').replace(u'\u0092', "'").replace(u'\u0096', '"').replace(u'\u0084', '"')
如何获得这些字符串的替换?有没有一种可以替换这些字符串(它们看起来像引号/各种各样的空格)?
这些角色到底是什么?什么是u'\u0084'
?在
上一次我遇到这个问题,是因为我从ascii范围之外获取字符,我有错误的界限。在
相关问题 更多 >
编程相关推荐