Python中的词性词性标注

import nltk import pos_tag import nltk.tokenize import word_tokenize f = open('C:\Users\test_data.txt') data = f.readlines() #Parse the text file for NER with POS Tagging for line in data: tokens = nltk.word_tokenize(line) tagged = nltk.pos_tag(tokens) entities = nltk.chunk.ne_chunk(tagged) print entities f.close()

1条回答

网友

1楼 · 发布于 2024-06-26 14:20:03

（从我的计算机上运行的纯复制粘贴）

运行代码（注意简单的import语句）：

#!/usr/bin/env python3
# encoding: utf-8
import nltk
f = open('/home/matthieu/Téléchargements/testtext.txt')
data = f.readlines()

for line in data:
    tokens = nltk.word_tokenize(line)
    tagged = nltk.pos_tag(tokens)
    entities = nltk.chunk.ne_chunk(tagged)
    print(entities)
f.close()

在以下unicode原始文本文件（3行）：

^{pr2}$

我得到以下结果：

(S
(/(
this/DT
is/VBZ
a/DT
first/JJ
example/NN
./.
)/)
(/(
Another/DT
sentence/NN
in/IN
another/DT
parentheses/NNS
./.
)/))
(S (/( onlyone/NN in/IN that/DT line/NN )/))
(S
this/DT
...

如你所见，没有什么特别的问题。你的csv数据解析正确吗？csv对你有用吗？你试过用一个简单的文本文件吗？在

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中的词性词性标注

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >