用于名称匹配的Knn无监督学习

2024-09-28 19:22:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究一个使用合成数据的名字匹配问题,例如

alertname   custname
0   wlison  wilson
1   dais    said
2   4dams   adams
3   ad4ms   adams
4   ad48s   adams
5   smyth   smith
6   smythe  smith
7   gillan  gillan
8   gilen   gillan
9   scott-smith scottsmith
10  scott smith scottsmith
11  perrson person
12  persson person

现在我想以无监督的方式将Knn应用于此任务,因为我没有任何明确的标签。我想为每一行输出匹配的分数。我已经使用了模糊匹配,现在只想探索knn的一些自动化。如果有人能提供出发点,我将不胜感激。话虽如此,我们这里没有外部标签。你知道吗


Tags: 数据标签名字scottpersonsmithwilsondais