<p>我正在使用一个名为nlpnet的python库。
这个库是一个来自巴西葡萄牙语单词的标签,经过多次诱惑,最终达到了这样的效果:
<a href="https://i.stack.imgur.com/Ga9IU.jpg" rel="nofollow noreferrer">Output of tagged data in terminal</a>
</p><p>
我们能从词尾的图像中感觉到什么,以及它用语法类的缩写对每个单词进行单独分类。该算法的挑战是搜索整个分析文档,并且只重写包含我选择的某些语法类的5个以上单词的句子。在</p>
<p/><p>
示例:分析一个包含多个句子的文本文档,并在另一个文件中重写只有5个以上动词或形容词的句子。在</p>
<p/><p>
使用的代码:
类来准备贴标器:</p>
<pre><code>#!/usr/bin/python
# -*- coding: utf8 -*-
import nlpnet
def get_tags(content):
#Labeling templates directory
data_dir = 'pos-pt';
#Definition of the directory and language to be used
tagger = nlpnet.POSTagger(data_dir, language='pt');
for i in range(content.__len__()):
str = content[i];
# Método para a etiquetação da sentença
tagged_str = tagger.tag(str);
print(tagged_str);
return content;
</code></pre>
<p/><p>
文件类别:`</p>
^{pr2}$