Python顶级Bigrams

import nltk from nltk.collocations import * tokens = ['a','b','c','d','b','c','a','b','c'] tokens2 = [['a','b','c','d'],['b','c','a','b','c']] bigrams = nltk.bigrams(tokens) fdist = nltk.FreqDist(bigrams) for i,j in fdist.items(): print i,j`` print fdist.most_common(2)

1条回答

网友

1楼 · 发布于 2024-06-30 15:48:33

如果您有一个令牌列表列表（比如token2）

import collections
cnt = collections.Counter()

for toks in token2:
    cnt.update(nltk.bigrams(toks))

print(cnt.most_common(2))

会有用的。如果你所拥有的是完全不同的，比如像tokens，或者你提到的set，一切都可能改变——但是我们无法读懂你的想法，所以你最好编辑你的Q来准确地解释你的目标是什么！在

编程相关推荐

java调试gzip错误的最佳方法
java web和iOS应用程序之间的关系是什么
java在哪个线程上执行在new CompletableFuture（）上注册的回调？
PGBouncer+JDBC中的java connect_查询设置
Hadoop中java奇怪的不满意链接错误
从java（cx\U oracle）中的python代码连接到oracle DB时出错
java如何找到广播接收器的调用？
java如何在SpringMVC中使用自定义日期属性编辑器验证日期
java二叉树如何帮助将表达式编译成机器语言
Java illegale从集合到抽象集合的转换

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python顶级Bigrams

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >