打印NP组块词

2024-06-26 14:30:29 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试从一个文本文件中提取NP块是的，但是我想把那些NP拼音打印出来一个人。怎么了我能做吗。你知道吗

import nltk
from nltk.tokenize import sent_tokenize
from nltk.tokenize import word_tokenize
file =open("l2.txt","r")
text=file.read()
tokenized_words = word_tokenize(text)
pos_list=nltk.pos_tag(tokenized_words)
grammar = "NP : {<JJ|JJR|JJS> *(<NNP> + <POS> *)?<NN|NNS|NNP|NNPS>+}"
cp = nltk.RegexpParser(grammar)
result = cp.parse(pos_list)
print(result)

这是我的代码。我想输出 NP单词：后跟单词，而不是整个输出与其他标签。你知道吗

Tags： text from pos import np cp list word

1条回答

网友

1楼 · 发布于 2024-06-26 14:30:29

代码末尾的以下几行应该可以做到这一点：

for r in result:
    if type(r) == nltk.tree.Tree:
        if r.label() == 'NP':
            print('NP:', ' '.join([x[0] for x in r.leaves()]))

打印NP组块词

相关问题更多 >

编程相关推荐

热门问题

热门文章

打印NP组块词

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >