命名实体识别：用于新实体/最新实体

2条回答

网友
1楼 · 编辑于 2024-10-01 05:05:33

我认为你的问题有两个部分：

净入学率的目的是什么？

这是一个巨大的问题，通常用于信息检索（IR）任务，如索引、文档分类、知识库填充（KBP），但也有许多其他任务（语音识别、翻译）。。。很难找出一份详尽的清单。。。在

如何扩展我们也能识别新的/未知的实体？

例如，我们如何识别从未被NER系统发现的实体。一目了然，有两种解决方案可能奏效：

假设你有一些链接的数据库定期更新：而系统可能依赖于通用类别。例如，假设“玛丽娜·席尔瓦”出现在新闻中，现在被添加到与“政治家”相关的词汇中。因为这个系统知道每个政客都应该被标记为一个人，也就是说，不依赖词汇项而是类别，因此会将“Marina Silva”标记为PERS命名的实体。你不需要重新训练整个系统，只是为了更新它的词典。在
利用形态学和上下文线索，系统可以猜测从未见过（也不在词典中）的新命名实体。例如，像“总统候选人XXX YYY”（或“Marina YYY”）这样的规则将猜测“XXX YYY”（或仅“YYY”）是PERS（或PERS的一部分）。大多数情况下，这涉及概率建模。在

希望这有帮助：）

网友

2楼 · 编辑于 2024-10-01 05:05:33

通常，内线是管道中的一个步骤。例如，一旦所有实体都被标记了，如果您有许多句子，如[PER John Smith], CEO of [ORG IBM] said...，那么您就可以建立一个公司和ceo表。这是knowledge base population的一种形式。在

不过，还有很多其他用途，这取决于您已经拥有的数据类型以及您要实现的目标。在