使用模糊模糊

def fuzzy(string, df, columnname): fullrange = len(df[columnname]) for i in range(fullrange): if fuzz.partial_ratio(string, df[columnname][i]) > 70: df.loc[df.index == i, 'istanbul mu'] = True else: df.loc[df.index == i, 'istanbul mu'] = False

2条回答

网友

1楼 · 编辑于 2024-09-28 21:41:37

这种方法做得更好。使用.process可能会获得更好的结果，但仅供参考：

def applyfuzzy(row):
    if fuzz.partial_ratio('the string', row['column holding the address to be queried']) > 65:
        return True
    else:
        return False
df['preferredcolumn'] = df.apply(applyfuzzy, axis=1)

网友

2楼 · 编辑于 2024-09-28 21:41:37

作为您自己答案的快速替代，您可以用RapidFuzz替换FuzzyWuzzy，它具有更快的fuzz.partial_ratio实现

from rapidfuzz import fuzz
def applyfuzzy(row):
    return fuzz.partial_ratio('the string', row['address_column'], score_cutoff=70) > 70

df['column'] = df.apply(applyfuzzy, axis=1)

编程相关推荐

API调用时返回java Null
JavaJAXB：如何从嵌套元素中检索文本属性？
java如何在Windows机器上用Maven创建Dockerfile，然后发送到远程Linux服务器以构建映像，然后运行？
并行处理集群java独立应用程序
java使用POST将图像上传到服务器
分发组的java JavaMail/Exchange AuthAs标头
swing Java JScrollPane多个组件
JAXB将XML文档映射到Java对象
java如何在JDK中实现OpenCSV CSVReader，我正在使用VSC代码
基于屏幕大小的java翻译动画

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用模糊模糊

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >