python中.sort（）和sorted（）函数的/wierd输出错误

import pandas as pd entities = pd.read_csv("24142265_0_4577466141408796359.csv", header=None) entitiesUri = [str(ent) for ent in entities[0]] tmp = entitiesUri.copy() #I sort 'entitiesUri' by the second column in 'entities' and the index of the link in tmp entitiesUri.sort(key = lambda k: int(entities[2][tmp.index(k)]))

1条回答

网友

1楼 · 发布于 2024-10-01 04:51:49

第一种方法不能像您预期的那样工作的原因是，您的输入在URL列中有重复项，并且list.index()返回第一个项的索引

$ grep The_Elder_Scrolls_V 24142265_0_4577466141408796359.csv
"http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim","the elder scrolls v: skyrim","3"
"http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim","the elder scrolls v: skyrim","1"
"http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim","the elder scrolls v: skyrim","5"

因此，例如，key = lambda k: int(entities[2][tmp.index(k)])返回3（数据帧最后一列中的值，用于上述URL的第一次出现）用于数据帧中的所有3次出现

>>> for e in tmp:
...   if e == 'http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim':
...       print(e, int(entities[2][tmp.index(e)]))
... 
http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim 3
http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim 3
http://dbpedia.org/resource/The_Elder_Scrolls_V:_Skyrim 3

因为3是最小的值（您可以通过从上面的列表中删除if语句来验证这一点），所以URL会首先出现在sorted()和sort()的输出中，并出现3次。删除if语句也会清楚地说明为什么排序entitiesUri会产生您得到的结果

相关问题更多 >

编程相关推荐

热门问题

热门文章