在pandas数据帧列中,我需要检查该列是否有字典中的任何单词值,然后我应该返回键。在
my_dict = {'woodhill': ["woodhill"],'woodcocks': ["woodcocks"], 'whangateau' : ["whangateau","whangate"],'whangaripo' : ["whangaripo","whangari","whangar"],
'westmere' : ["westmere"],'western springs': ["western springs","western springs","western spring","western sprin",
"western spri","western spr","western sp","western s"]}
我可以为此编写一个for循环,但是,我的数据帧中有近150万条记录,字典中有100多条条目,在某些情况下每个条目可能最多有20个值。我如何有效地做到这一点?我是否可以在字典中创建“值为键”和“键为值”以使其更快?谢谢。在
首先颠倒字典中的条目。#作为限量项目,所以会很快。在
从字典创建数据帧。#与其搜索每个与dataframe比较的键,不如执行join。因此,创建数据帧。在
第三,从大尺寸数据帧左连接到小尺寸数据帧(在本例中是字典)。在
你可以把字典倒过来
然后用你的数据帧映射
^{pr2}$试试这个代码,这可能对你有帮助。在
相关问题 更多 >
编程相关推荐