使用(python)crfsui的自定义功能函数

2024-10-01 17:29:34 发布

您现在位置:Python中文网/ 问答频道 /正文

到目前为止,我只阅读了有关CRF的theorey,并希望在我的硕士论文中使用python crfsuite从配方中提取成分。感谢每一个帮助。在

据我所知,我可以用下图的形式向crfsuite提供训练数据,其中w[0]提供当前单词的身份,w[I]相对于I的世界,pos[I]其相对于I的词性标签

training data format

然后crfsuite根据给定的属性训练自己的特征函数。在

但是我找不到一种方法来提供定制的特性函数,比如“w[I]在字典中”(例如配方成分的字典)或“in the sentence is a negation”(例如“not”或“don't”)。在

一般来说,好的教程是受欢迎的,因为在我看来,手册(https://python-crfsuite.readthedocs.io/en/latest/http://www.chokkan.org/software/crfsuite/manual.html)对初学者并不友好


Tags: 数据pos字典世界配方身份标签单词
1条回答
网友
1楼 · 发布于 2024-10-01 17:29:34

对于python-crfsuite(或sklearn-crfsuite),训练数据不必采用您所描述的格式;单个训练序列应该是{"feature_name": <feature_value>"}dict的列表,每个序列元素都有特征(例如句子中的一个标记)。功能不必是单词或POS标记。还有一些其他受支持的特性格式(参见http://python-crfsuite.readthedocs.io/en/latest)。在

有关更完整的示例,请检查https://github.com/TeamHG-Memex/sklearn-crfsuite/blob/master/docs/CoNLL2002.ipynb-它使用自定义功能。在

相关问题 更多 >

    热门问题