擅长:python、mysql、java
<p>我认为你的问题有两个部分:</p>
<p>净入学率的目的是什么?</strong></p>
<p>这是一个巨大的问题,通常用于信息检索(IR)任务,如索引、文档分类、知识库填充(KBP),但也有许多其他任务(语音识别、翻译)。。。很难找出一份详尽的清单。。。在</p>
<p><strong>如何扩展我们也能识别新的/未知的实体?</strong></p>
<p>例如,我们如何识别从未被NER系统发现的实体。一目了然,有两种解决方案可能奏效:</p>
<ul>
<li>假设你有一些链接的数据库定期更新:而系统可能依赖于通用类别。例如,假设“玛丽娜·席尔瓦”出现在新闻中,现在被添加到与“政治家”相关的词汇中。因为这个系统知道每个政客都应该被标记为一个人,也就是说,不依赖词汇项而是类别,因此会将“Marina Silva”标记为PERS命名的实体。你不需要重新训练整个系统,只是为了更新它的词典。在</li>
<li>利用形态学和上下文线索,系统可以猜测从未见过(也不在词典中)的新命名实体。例如,像“总统候选人XXX YYY”(或“Marina YYY”)这样的规则将猜测“XXX YYY”(或仅“YYY”)是PERS(或PERS的一部分)。大多数情况下,这涉及概率建模。在</li>
</ul>
<p>希望这有帮助:)</p>