这是在字符串中查找最长单词（复数）的有效方法吗？

网友

1楼 · 编辑于 2024-09-24 22:22:12

如果您只使用少量的文本来完成这项工作，则无需担心运行时效率：编程效率，在编码、审查和调试中，要重要得多。所以你的解决方案是好的，因为它是清晰的，足够有效的，甚至数千字。（但是，您应该在for循环之前只计算一次len(max(inputsentence, key=len))。）

但是，假设您确实想用一个可能有几GB长的大型语料库来完成这项工作？下面是如何在一个过程中完成这项工作，而不将每个单词存储在内存中（注意，inputcorpus可能是一个迭代器函数，它分阶段读取语料库）：只保存所有最长的单词。如果你看到一个单词的长度超过了当前的最大值，那么它显然是这个长度的第一个单词，所以你可以开始一个新的列表。在

maxlength = 0
maxwords = [ ]  # unnecessary: will be re-initialized below
for word in inputcorpus:
    if len(word) > maxlength:
        maxlength = len(word)
        maxwords = [ word ]
    elif len(word) == maxlength:
        maxwords.append(word)

如果某个最大长度的单词重复出现，你将得到几个副本。要避免这种情况，只需使用set( )而不是列表（并调整初始化和扩展）。在

网友

2楼 · 编辑于 2024-09-24 22:22:12

将其设为defaultdict，并调整以下内容：

words = inputsentence.split()
from collections import defaultdict
dd = defaultdict(list)
for word in words:
    dd[len(word)].append(word)

key_by_len = sorted(dd)
print dd[key_by_len[0]]

网友

3楼 · 编辑于 2024-09-24 22:22:12

这个怎么样：

from itertools import groupby as gb

inputsentence = raw_input("Write a sentence: ").split() 

lwords = list(next(gb(sorted(inputsentence, key=len, reverse=True), key=len))[1])

相关问题更多 >

编程相关推荐

热门问题

热门文章