正在删除\u0152 unicode python

2024-06-02 10:29:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我一辈子都不能删除\u0152。在

使用python 2

当我试图做str(table)时,我得到:“ascii”编解码器无法对473位的字符u'\u0152'进行编码:序号不在范围内(128)

我试过了表格.替换('\u0152','')以及正则表达式。在

table = \n2002 \u0152 present Assistant Professor, Department of Development Sociology,    Cornell \n   University, Ithaca, NY   \n \n1999 \u0152 

Tags: of编码编解码器asciitable字符表格department
2条回答

为了避免在执行str(table)时发生UnicodeEncodeError,可以使用table.encode('ascii', errors='ignore')。这将删除所有不能编码为ASCII的字符,根据您的数据,这些字符可能是不需要的。在

如果您确保table和参数都是unicode字符串,例如table.replace(u'\0152', u''),那么replace也可以工作。在

字符串值table不是通过调用replace()就地修改的。而是返回替换的版本。如果要修改变量table,则需要重新赋值。在

table = '\n2002 \u0152 present Assistant Professor, Department of Development Sociology,    Cornell \n   University, Ithaca, NY   \n \n1999 \u0152'
table = table.replace('\u0152', '')
print table # Should have the output you want.

相关问题 更多 >