我对python比较陌生,这可能是一个基本问题。如果是这样,请提前道歉!在
我正在努力完成以下任务:
court_region_df[['court_long']]
列中搜索df3['court_short']
的值。在court_region_df[['court_long']]
中有匹配项,则为court_region_df[['hmcts_region']]
选择该行的值并将其复制到df3['region']
df3['court_short']
接受的值是一个字符串,通常是一个类似的城镇名称,而court_region_df[['court_long']]
则采用较长字符串的值,例如完整地址。在
我对如何完成第一步有点迷茫。我发现的大多数python搜索函数似乎不适合在较长的字符串中查找特定模式。在
这是一个玩具的例子,但和你的差不多:
输出:
^{pr2}$编辑:我尝试了你的数据,并能想出一个非矢量化的解决方案,这是一个有点慢,但可管理的解决方案(使用你共享的文件需要几秒钟的时间)。这里是:
稍微快一点的是把它们藏在字典里,完全避免使用熊猫魔术:
结果:
如您所见,给定您共享的数据,它只返回两个匹配项。你可能需要研究一个更模糊的匹配系统。在
相关问题 更多 >
编程相关推荐