如何在python中删除列中所有可能的重音符号

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import re import unicodedata data=pd.read_csv('transactions.csv') data.head() nm=data['Name'] normal = unicodedata.normalize('NFKD', nm).encode('ASCII', 'ignore')

--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-41-1410866bc2c5> in <module>() 1 nm=data['Name'] ----> 2 normal = unicodedata.normalize('NFKD', nm).encode('ASCII', 'ignore') TypeError: normalize() argument 2 must be unicode, not Series

2条回答

网友

1楼 · 编辑于 2024-09-29 21:43:14

在一列中尝试以下操作：

nm = nm.str.normalize('NFKD').str.encode('ascii', errors='ignore').str.decode('utf-8')

对多个列尝试此操作：

obj_cols = data.select_dtypes(include=['O']).columns
data.loc[obj_cols] = data.loc[obj_cols].apply(lambda x: x.str.normalize('NFKD').str.encode('ascii', errors='ignore').str.decode('utf-8'))

网友

2楼 · 编辑于 2024-09-29 21:43:14

它之所以给您这个错误是因为normalize需要第二个参数的字符串，而不是字符串列表。我在网上找到了一个例子：

unicodedata.normalize('NFKD', u"Durrës Åland Islands").encode('ascii','ignore')
'Durres Aland Islands'

相关问题更多 >

编程相关推荐

热门问题

热门文章