（生物医学）词干的所有可能的词形补全

1条回答

网友

1楼 · 发布于 2024-10-02 02:39:00

这个解决方案需要对语料库进行预处理。但一旦完成，这是一个非常快速的字典查找。在

from collections import defaultdict
from stemming.porter2 import stem

with open('/usr/share/dict/words') as f:
    words = f.read().splitlines()

stems = defaultdict(list)

for word in words:
    word_stem = stem(word)
    stems[word_stem].append(word)

if __name__ == '__main__':
    word = 'leukocyte'
    word_stem = stem(word)
    print(stems[word_stem])

对于/usr/share/dict/words语料库，这将产生结果

^{pr2}$

它使用^{}模块，该模块可以与

pip install stemming

编程相关推荐

java传感器名称和供应商Android
在JDK1.7中使用neo4j时出现java错误
对Sharepoint 2010 oData的Java HTTP调用失败
cloud foundry如何从java应用程序连接到PCF，并列出组织、空间、应用程序及其配置？
java在按下按钮后尝试绘制
类是在Java中实例化大量子类的最有效方法？
java Kotlin有BigDecimal setPrecision实用程序方法吗？
java使用for循环获取最小值及其索引
java如何限制json与jpa对象之间的映射工作
Java JFrame中电子邮件验证的While循环

相关问题更多 >

编程相关推荐

热门问题

热门文章

（生物医学）词干的所有可能的词形补全

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >