在进行命名实体识别后，如何从句子中提取意义？

3条回答

网友

1楼 · 编辑于 2024-06-14 07:33:35

Named entity recognition（NER）系统通常使用基于语法的规则或统计语言模型。不过，您在这里所描述的似乎只是基于关键字。在

通常，和大多数复杂的NLP任务一样，NER系统应该根据特定于域的数据进行训练，以便在以前看不到的（测试）数据上表现良好。你需要足够的机器学习知识才能走上这条道路。在

在“普通”语言中，如果您想提取单词或短语并将它们分类到您定义的类中（例如诉讼），如果在外部本体论中使用类别标签通常是有意义的。例如：

这样的分类（即检测一个词是否真的与体育有关）并不是一个“普遍”的问题。这意味着你找不到现成的可以解决问题的系统（例如NLTK库中的算法）。但是，您可以使用像Wikipedia这样的本体，并利用那里可用的类别标签。在

请注意，wikipedia类别标签形成了一个有向图。如果您构建了一个利用这样一个本体的类别结构的系统，那么您应该能够在您认为合适的情况下对文本中的术语进行分类。此外，您甚至可以控制分类的粒度（例如，您只想要“运动”，还是“个人运动”和“团队运动”）。在

我已经建立了这样一个系统来对与计算机科学相关的术语进行分类，而且效果非常好。以类似方式工作的最近的免费可用系统是伊利诺伊大学香槟分校认知计算小组建立的Wikifier。在

注意事项：您可能需要调整一个简单的基于类别的代码，以满足您的需要。E、维基百科没有“诉讼”页面。相反，它会将你重定向到一个名为“诉讼”的页面。这类案件需要分开处理。在

最后一点说明：这个解决方案实际上不在NLP领域，但我过去的经验表明，对于某些领域，这种基于本体的方法非常有效。另外，我在回答中使用了“体育”这个例子，因为我对法律术语一无所知。但我希望我的例子能帮助您理解基本过程。在

网友

2楼 · 编辑于 2024-06-14 07:33:35

网友

3楼 · 编辑于 2024-06-14 07:33:35

我不认为你的“算法”是在做实体识别。。。但是，如果你提出了一个问题，你想做的看起来像是在包含省略号的协调结构中的共指消解。一点也不容易：从谷歌上搜索语言学和计算语言学的相关文献开始。我使用以下字段中的标准术语。在

实际上，您可以从指定最近的先行词（英语中最常用的方法）开始。举个例子：