排序以小写或大写开头的重音名称

2024-06-28 19:54:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望对以下列表进行排序,其中包含以不同方式书写的名称:

l=['André','Gerald','Nicole','François','Fraçois','andré']

预期结果是:

['André', 'andré', 'Fraçois', 'François' 'Gerald', 'Nicole']

但是,我很遗憾,我无法获得它。到目前为止,我一直尝试使用sorted命令进行双重排序:

l=sorted(sorted(l, key=str.casefold), key=unidecode.unidecode)

但我的结果并不是我想要的:

['André', 'Fraçois', 'François', 'Gerald', 'Nicole', 'andré']

你们知道有没有其他命令能帮我找到正确的分类


Tags: key命令列表排序方式sorted书写unidecode
3条回答

这应该起作用:

import unidecode
l = ['André','Gerald','Nicole','François','Fraçois','andré']

l = sorted(l, key=lambda s: unidecode.unidecode(s).lower())

结果:

['André', 'andré', 'Fraçois', 'François', 'Gerald', 'Nicole']

Python排序是stable,因此嵌套排序实际上可以工作

您可以使用Unicode数据中的normalize来删除反变音符号:

import unicodedata

l=['André','Gerald','Nicole','François','Fraçois','andré']

sl = sorted(l,key=lambda n:unicodedata.normalize("NFD",n).lower())

print(sl)
# ['André', 'andré', 'Fraçois', 'François', 'Gerald', 'Nicole']

如果唯一的问题是区分大小写,则展平大小写(仅)进行排序:

>>> sorted(l, key= lambda x : x.lower())
['André', 'andré', 'François', 'Fraçois', 'Gerald', 'Nicole']

如果您不喜欢这样产生的不区分大小写的Unicode排序,也就是说,如果您真的想将unidecode加入到混合中,请将其折叠到sort key函数中。。。这是@JLam的答案,所以我不会抢他们的风头

相关问题 更多 >