使用类的Python前20个名称代码

year 1992: Ashley,F,38451 Jessica,F,38349 Amanda,F,25027 Brittany,F,24974 Sarah,F,24632 Samantha,F,24402 Emily,F,21831 Stephanie,F,19670 Elizabeth,F,19020 Megan,F,17843 ... Michael,M,54373 Christopher,M,42459 Matthew,M,37729 Joshua,M,36207 Andrew,M,30530 Brandon,M,29618 Daniel,M,29138 Tyler,M,28792 James,M,28502

2条回答

网友

1楼 · 编辑于 2024-05-19 12:25:36

Martijn的回答说明了如何读入数据。但是，假设每个名字和性别在每个文件中只出现一次，就不需要计数器了。你可以用heapq.n最大. 这使它成为一行代码而不是三行代码，这意味着您一次只需要足够的内存来存储20个名称，而不是文件中的所有名称。

当我不在电话上的时候，我会用真实的测试代码来编辑这个，但是类似这样的东西：

# above here the same as Martijn's code up to reader
top20 = heapq.nlargest(reader, operator.itemgetter(2))
for name, sex, count in top20:
    # same print line as in Martijn's code

网友

2楼 · 编辑于 2024-05-19 12:25:36

打开文件时需要连接字符串，或使用字符串格式；open()的工作方式与print()不同，它不会猜测应该连接哪些参数：

for line in open('names/yob{}.txt'.format(year)):

接下来，您有CSV文件，所以使用csv模块来读取它们：

^{pr2}$

接下来，我将使用^{}来跟踪名称计数：

from collections import Counter
counts = Counter()

for row in reader:
    name, sex, count = row
    counts[name, sex] += int(count)

现在你有了每个人的姓名和性别统计，并可以要求前20名：

for (name, sex), count in counts.most_common(20):
    print('{} ({}): {}'.format(name, sex, count))

相关问题更多 >

编程相关推荐

热门问题

热门文章