在使用crfsui时,如何使用以前令牌的实体类作为NER的功能

2024-09-30 08:32:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我在python中使用python crfsuite包,这是由Naoaki okakazi(http://www.chokkan.org/software/crfsuite/)开发的crfsuite的实现

我想使用前一个令牌的实体类作为一个特性,这将帮助我识别多个单词命名的实体。 我的培训数据示例:

[(Raheja,建筑工人),(vista,I-builder),(is,O),(非常,O),(著名,O)]

如果我可以使用上一个类功能训练。但是在预测时,我们将特征列表传递给tagger对象。 测试时的问题是上一个类是未知的。在

有谁能告诉我这在python crfsuite中是否可行。 我觉得我们把特征传递给tager对象的方式是不可能的。在


Tags: 数据对象org实体httpwwwsoftware特征
2条回答

上一个令牌的类在CRFSuite中默认用作功能。CRFSuite使用两种功能:

  1. “状态特征”-I(current_label=A and f(sequence, current_position))
  2. “过渡特征”-I(current_label=A and previous_label=B)

您定义的特性实际上是(1)中的f函数;为标签的所有可能值生成状态特征。要使用转换特性,您不必做任何事情,它们是默认生成的。在

CRFsuite中没有实现的是第三种特性:I(current_label=A and previous_label=B and f(sequence, current_position));这就是本教程所说的“以属性和标签双元组为条件的特性”。在

基于tutorial中的这句话,我相信crfsuite(和python crfsuite)是不可能做到的:

Features conditioned with attributes and label bigrams are not supported.

相关问题 更多 >

    热门问题