JaroWinkler距离在数据帧中的应用

2024-10-02 20:36:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两列的数据帧。第一个是正确的字符串,第二个是损坏的。我想应用Jaro Winkler距离并将其存储在新的第三列中。在

import pandas as pd
from pyjarowinkler.distance import get_jaro_distance

df = pd.DataFrame(
        {"Correct" : ['Hello' , 'bread' , 'situation'],
         "Corrupt" : ['Hlloe' , 'braed' , 'sitatuion']},
        index = [1, 2, 3])

Tags: 数据字符串fromimport距离pandasdfget