我正在尝试删除数据中的所有重音符号。我找到了一个函数,但我不能一次对整个数据帧应用相同的函数。在
import unicodedata
import pandas as pd
def remove_accents(input_str):
nfkd_form = unicodedata.normalize('NFKD', input_str)
only_ascii = nfkd_form.encode('ASCII', 'ignore')
return only_ascii
data = {'name': ['Guzmán', 'Molly'],
'year': [2012, 2012]}
df = pd.DataFrame(data)
df
如何应用上述功能?在
pandas read_csv
中有没有可以用来实现类似输出的参数?在
正如其他人所指出的,这非常简单:
另外,如果您使用的是python3,我建议您更改
^{pr2}$remove_accents
函数的最后一行。only_ascii
返回二进制数据,通常最佳做法是将unicode文本保持为常规(python3)str
。在相关问题 更多 >
编程相关推荐