Python nereval包_程序模块 - PyPI

基于f1分数的命名实体识别系统评价脚本。

nereval的Python项目详细描述

https://travis-ci.org/jantrienes/nereval.svg?branch=master

基于实体级别f1分数的命名实体识别（ner）系统的评估脚本。

定义

nadeau和sekine（2007）描述了此处实现的度量，并广泛用作消息理解会议的一部分（grishman和sundheim，1996）。它根据两个轴评估一个ner系统：它是否能够为一个实体指定正确的类型，以及它是否能够找到确切的实体边界。对于这两个轴，计算正确预测数（cor）、实际预测数（act）和可能预测数（pos）。从这些统计数据中，可以得出精确性和召回率：

precision = COR/ACT
recall = COR/POS

最终得分是类型轴和边界轴精度和召回率的微观平均F1度量。

安装

pip install nereval

用法

该脚本既可以在python中使用，也可以在将分类结果写入json文件时从命令行使用。

从命令行使用

假设我们在input.json中有以下分类结果：

[{"text":"CILINDRISCHE PLUG","true":[{"text":"CILINDRISCHE PLUG","type":"Productname","start":0}],"predicted":[{"text":"CILINDRISCHE","type":"Productname","start":0},{"text":"PLUG","type":"Productname","start":13}]}]

然后可以按如下方式执行脚本：

python nereval.py input.json
F1-score: 0.33

来自python的用法

或者，可以从python中直接调用求值度量。示例：

importnerevalfromnerevalimportEntity# Ground-truth:# CILINDRISCHE PLUG# B_PROD       I_PRODy_true=[Entity('CILINDRISCHE PLUG','Productname',0)]# Prediction:# CILINDRISCHE PLUG# B_PROD       B_PRODy_pred=[# correct type, wrong textEntity('CILINDRISCHE','Productname',0),# correct type, wrong textEntity('PLUG','Productname',13)]score=nereval.evaluate([y_true],[y_pred])print('F1-score: %.2f'%score)F1-score:0.33

关于对称性的注释

由于ner中的词重叠问题，度量本身是不对称的。所以evaluate(y_true, y_pred) != evaluate(y_pred, y_true)。如果我们考虑以下示例（tagger使用bio方案），这一点就很明显了：

# Example 1:
Input:     CILINDRISCHE PLUG     DIN908  M10X1   Foo
Truth:     B_PROD       I_PROD   B_PROD  B_DIM   O
Predicted: B_PROD       B_PROD   B_PROD  B_PROD  B_PROD

Correct Text: 2
Correct Type: 2# Example 2 (inversed):
Input:     CILINDRISCHE PLUG     DIN908  M10X1   Foo
Truth:     B_PROD       B_PROD   B_PROD  B_PROD  B_PROD
Predicted: B_PROD       I_PROD   B_PROD  B_DIM   O

Correct Text: 2
Correct Type: 3

注释和参考资料

用于University of Twente, Netherlands的学生自然语言处理研究项目。

引用

Grishman，R.，&Sundheim，B.（1996年）。Message understanding conference-6: A brief history。载于《科林1996》第一卷：第16届计算语言学国际会议（第一卷）。
Nadeau，D.，&Sekine，S.（2007年）。A survey of named entity recognition and classification。lingvisticae调查，30（1），3-26。

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库

导航栏
项目描述
版本历史
下载文件
项目链接
首页
标签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
维护者
jantrienes
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
如何重塑数组、迭代列的所有行并将重塑后的数组分配给新列？Python/Pandas/Numpy
如何重塑数组的形状？
如何重塑文本数据以适应keras的LSTM模型
如何重塑未对齐的数据集，并使用numpy丢弃剩余数据？
如何重塑此数据以使用绘图
如何重塑此数据帧？
如何重塑此数据集以适应RNN
如何重塑没有列的数组？
如何重塑测试数据帧，使其维数与训练和预测工作中使用的维数相同？
如何重塑系列以在StandardScaler中使用它
如何重塑线性回归的数据
如何重塑线性回归的数据？
如何重塑表格？
如何重塑要堆叠的重复宽数据帧？
如何重塑输入以放入二维层？

nereval 0.2.5

nereval的Python项目详细描述

定义

安装

用法

从命令行使用

来自python的用法

关于对称性的注释

注释和参考资料

推荐PyPI第三方库

pytest-recordings

uuu

kahypar

hklp

djangorestframeworksocialoauth2

xu-test-distributions

pythonzunclient

gsheet-plots

gardener-cicd-base

nanomonsv

arubafi

robocadSim

mkautodoc

ldr

timebomb

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

nereval 0.2.5

nereval的Python项目详细描述

定义

安装

用法

从命令行使用

来自python的用法

关于对称性的注释

注释和参考资料

推荐PyPI第三方库

pytest-recordings

uuu

kahypar

hklp

djangorestframeworksocialoauth2

xu-test-distributions

pythonzunclient

gsheet-plots

gardener-cicd-base

nanomonsv

arubafi

robocadSim

mkautodoc

ldr

timebomb

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签