一种分割连接名称的算法

2024-09-30 18:17:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我的问题是

我的全名是连在一起的,比如“davidrobert-jones”。我想把它分成“大卫·罗伯特·琼斯”。你知道吗

我使用最长前缀匹配算法和名称字典测试了解决方案,但没那么简单,因为名称可以用多种方式书写。 我也添加了语音匹配算法,但也有许多名字可能有相同的发音,所以他们非常含糊不清。你知道吗

最好的解决办法是什么?,我相信机器学习可以找到答案,但我对机器学习知之甚少。你知道吗


Tags: 名称算法机器字典方式语音解决方案名字
2条回答

我认为你的问题类似于Named Entity Recognizer命名实体识别(NER)标记文本中的单词序列,这些单词是事物的名称,例如人名和公司名。在第5节中,这个article具有Named Entity Recognition的python方法。你知道吗

一种可能的算法解决方案是创建一个较长的合成字典,表示所有可能的名字姓氏。然后,对于任何给定的作为名称的令牌列表(用空格分隔的单词),对于每个令牌,查找到该令牌的编辑距离最短的所有字典条目

相关问题 更多 >