Python：如何计算NLTK语料库中最常用的前X个单词？

>>> from nltk import * >>> fdist = FreqDist(['hi','my','name','is','my','name']) >>> fdist FreqDist({'my': 2, 'name':2, 'is':1, 'hi':1} >>> fdist.items() [('is',1),('hi',1),('my',2),('name',2)] >>> fdist.items[:2] [('is',1),('hi',1)]

1条回答

网友

1楼 · 发布于 2024-05-19 07:56:58

默认情况下，不排序FreqDist。我想你在找most_common方法：

from nltk import FreqDist
fdist = FreqDist(['hi','my','name','is','my','name'])
fdist.most_common(2)

[('my', 2), ('name', 2)]

编程相关推荐

java如何在JUnit5中定义优先级
Web驱动程序将焦点切换到iframe的java困难
java JFileChooser没有文件名文本字段选项
本地化是否可以回退到Java中resourcebundle的宏语言（例如，nynorsk>norsk）
禁用时Java断言的性能拖动
未考虑执行中的java jsonschema2pojo maven插件配置
java微调器。setSelection未调用setOnItemSelectedListener函数
序列化XStream：序列化java的反序列化。sql。时间导致错误
java无法理解为什么“ajpnio8009execXX”线程在AbstractQueuedSynchronizer$ConditionObject上阻塞/等待时间。等候
Java date给我的格式是mm/dd/yyyy，其中jquery datepicker的日期格式是dd/mm/yyyy

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：如何计算NLTK语料库中最常用的前X个单词？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >