字符串Python中的Unicode字符

2024-09-30 14:21:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我有熊猫系列和游戏名称列表,例如:

  • \u3010\u6226\u8266\U3011军舰传奇\u30a6
  • \U22C6蜘蛛纸牌+
  • \u25bbches

我想删除所有“不可打印”的Unicode字符(理想的结果应该是这样的-战舰传奇、蜘蛛孤独+、国际象棋)

我试着做他的工作 数据['Name']=数据['Name'].str.encode('ascii').str.decode('ascii')) 但这没用 而且解码也没用。 数据['Name']=数据['Name'].str.decode('ascii') 提前谢谢你


Tags: 数据name名称游戏列表ascii传奇蜘蛛
2条回答

在Python3中,通过添加'ignore'作为参数,这对我是有效的

string = '\u3010\u6226\u8266\u3011Warship Saga \u30a6'
string = string.encode('ascii', 'ignore').decode('ascii')
print(string)

输出:

Warship Saga 

对于整个专栏:

data['Name'] = data['Name'].str.encode('ascii', 'ignore').str.decode('ascii')

我试过这个,如果有用请告诉我;)

s= "\u3010\u6226\u8266\u3011Warship Saga \u30a6"
my_string = [chr(i) for i in ([(ord(c)) for c in s])]
for i in my_string:
    if type(i) == str:
        try:
            print(i.encode('utf-8').decode('ascii'))
        except:
            pass

相关问题 更多 >