在Python中将列表从文本拆分为ngram

3条回答

网友

1楼 · 编辑于 2024-09-29 23:22:48

定义：

def ngrams(text, n):
    words = text.split()
    return [ words[i:i+n] for i in range(len(words)-n+1) ]

并使用：

^{pr2}$

网友

2楼 · 编辑于 2024-09-29 23:22:48

我相信有一种更像Python的方式来做这件事。它不是一个函数（但应该很容易适应），而是一个程序。我想它符合你的规格：

import sys

num = int(sys.argv[1])

cad = "i am having a good day today"

listCad =  cad.split(" ")

listOfLists = []
i = 0
while i <= len(listCad) - num:
   listOfLists.append(listCad[i:i+num])
   i = i + (num - 1)

print listOfLists

网友

3楼 · 编辑于 2024-09-29 23:22:48

我会这样做：

def ngrams(words, n):
    return zip(*(words[i:] for i in range(n)))

用法：

^{pr2}$

其思想是从原始列表生成n列表，第i个列表移动i。然后简单地zip将这些移位的列表放在一起并返回结果。在

n=3的可视化：

^{3}$

zip函数将相同索引中的元素缝合在一起，直到用尽最短的列表，从而产生所需的输出。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中将列表从文本拆分为ngram

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >