按计数值排序字典

2024-09-30 04:35:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图按第三列对字典的输出进行排序,或者更具体地说,按示例结果中出现的值的计数进行排序。对于上下文,最初的答案是:https://stackoverflow.com/a/23199901/666891。我无法从https://stackoverflow.com/a/73050/666891https://stackoverflow.com/a/613218/666891得出答案,因此我在这里提问。你知道吗

原始产量来自:

for k in ret.keys():
    print '%s %d' % (k,ret[k])

结果是:

google com 1132
akamaiedge net 378
bing com 381
microsoft com 197

并尝试:

x = ret.keys()
sorted(x,key=operator.itemgetter(3))
for k in x:
    print '%s %d' % (k,ret[k])

结果是:

google com 1132
akamaiedge net 378
bing com 381
microsoft com 197

最后一次尝试:

for k in sorted(ret.keys(),key=operator.itemgetter(3),reverse=True):
    print '%s %d' % (k,ret[k])

其结果与第一个类似:

microsoft com 197
akamaiedge net 378
google com 1132
bing com 381

此外,ret.keys()的值是:

['google com', 'akamaiedge net', 'bing com', 'microsoft com']

我的具体方案是:

for k in sorted(ret.keys(), key=lambda k:ret[k], reverse=True):
    print "{:15} - {}".format(k, ret[k])

Tags: keyinhttpscomfornetgooglekeys
2条回答

我坚持最初的解决方案proposed by Burhan Khalid,它利用了^{}

import re
from collections import Counter

with open('input.txt') as f:
    c = Counter('.'.join(re.findall(r'(\w+\(\d+\))', line.split()[-1])[-2:]) for line in f)

for domain, count in c.most_common():
    print domain, count

它使用^{}方法,该方法本质上是使用sorted()按值按相反顺序对字典项进行排序。不需要手动操作。你知道吗

仅供参考,以下是most_common()源代码在python2.7上的表现:

def most_common(self, n=None):
    '''List the n most common elements and their counts from the most
    common to the least.  If n is None, then list all element counts.

    >>> Counter('abcdeabcdabcaba').most_common(3)
    [('a', 5), ('b', 4), ('c', 3)]

    '''
    # Emulate Bag.sortedByCount from Smalltalk
    if n is None:
        return sorted(self.iteritems(), key=_itemgetter(1), reverse=True)
    return _heapq.nlargest(n, self.iteritems(), key=_itemgetter(1))

如果您试图基于值进行排序,那么key参数应该得到一个函数,该函数可以给出与当前键对应的值,如下所示

d = {'google com':1132,'akamaiedge net':378,'bing com':381,'microsoft com':197}
for key in sorted(d, key=d.get):
    print "{:15} - {}".format(key, d[key])

输出

microsoft com   - 197
akamaiedge net  - 378
bing com        - 381
google com      - 1132

现在,每当排序算法在字典中选取一个键时,它都会调用key函数,这是字典的getter函数,它将给出对应于键的值。因此,与键对应的值将用于比较。你知道吗

注意1:上一个代码的问题是,您使用的是operator.itemgetter(3),它将获得键中索引3处的元素。键是字符串,因此键中的第四个字符将用于比较。这就是为什么你问题的最后一个例子

mic*r*osoft com 197
aka*m*aiedge net 378
goo*g*le com 1132
bin*g* com 381

按字母顺序r > m > g。你知道吗

注2:第二个示例的问题是,sorted不改变x,它返回一个新列表。所以,您仍然只使用未排序的x。你知道吗

相关问题 更多 >

    热门问题