如何从nltk pos_标记获取标记集？

1条回答

网友

1楼 · 发布于 2024-10-01 09:35:10

我在为我写的一篇论文做NLP分析时也遇到了同样的问题。我必须使用这样的映射函数：

import nltk
from nltk.tokenize import word_tokenize

def get_full_tag_pos(pos_tag):
    tag_dict = {"J": "ADJ",
                "N": "NOUN",
                "V": "VERB",
                "R": "ADV"}
    # assuming pos_tag comes in as capital letters i.e. 'JJR' or 'NN'
    return tag_dict.get(pos_tag[0], 'NOUN')

# example
words = word_tokenize(text)
words_pos = nltk.pos_tag(words)
full_tag_words_pos = [word_pos[0] + "/" + get_full_tag_pos(word_pos[1]) for word_pos in words_pos]

编程相关推荐

bash杀戮屏幕但java进程未结束
java Spring批处理回滚项
java Android材质设计工具栏未在活动\u main中正确显示。xml
java“%sR”中的R在字符串中做什么。格式（）
java UCanaAccess异常“不支持的更新版本：5”
通过https连接到专用ip时出现java“不存在主题替代名称”错误
java有人能解释一下这种移位/长时间修补输出吗？
java识别从forloop创建的数组中的对象
JavaPostXML文件
为什么逗号（，）不会导致编译错误？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从nltk pos_标记获取标记集？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >