2024-09-30 16:36:57 发布
网友
我正在研究一个足球数据集,处理一些异国情调的名字。我想问一下如何替换数据集中存在的特殊字母表?以下是这些“异国”名字的一些例子:
“莱昂内尔·安德烈斯·梅西·库西蒂尼”、“内马尔·达席尔瓦·桑托斯小将”、“路易斯·阿尔贝托·苏亚雷斯·迪亚斯”、“大卫·德赫亚·金塔纳”、“兹拉坦·易卜拉希莫维奇”
特殊字母是é、á、ć、等(上面有“上标”的字母)。我想把它们改成“基本”形式-奇变成c,á变成a,依此类推。你知道吗
非常感谢!你知道吗
你可以试试:
import unidecode new_string = unidecode.unidecode(your_string)
您可以使用unidecode包:
import unidecode special_str = [u'Lionel Andrés Messi Cuccittini', u'Neymar da Silva Santos Junior', u'Luis Alberto Suárez Díaz', u'David De Gea Quintana', u'Zlatan Ibrahimović'] for item in special_str: print(unidecode.unidecode(item))
输出为:
Lionel Andres Messi Cuccittini Neymar da Silva Santos Junior Luis Alberto Suarez Diaz David De Gea Quintana Zlatan Ibrahimovic
你可以试试这个
for i in range(len(playernames)): playernames[i] = playernames[i].replace("é", "e")
当然,再加上所有其他字符
你可以试试:
您可以使用unidecode包:
输出为:
你可以试试这个
当然,再加上所有其他字符
相关问题 更多 >
编程相关推荐