Pandas：效率更高的.map（）函数还是方法？

网友

1楼 · 编辑于 2024-10-01 11:25:17

对唯一的国家名称调用guess_country()，并创建一个country_map系列对象，原始名称作为索引，转换后的名称作为值。然后可以使用country_map[df.country]进行转换。在

import pandas as pd
c = ["abc","abc","ade","ade","ccc","bdc","bxy","ccc","ccx","ccb","ccx"]
v = range(len(c))
df = pd.DataFrame({"country":c, "data":v})

def guess_country(c):
    return c[0]

uc = df.country.unique()
country_map = pd.Series(list(map(guess_country, uc)), index=uc)
df["country_id"] = country_map[df.country].values
print(df)

网友

2楼 · 编辑于 2024-10-01 11:25:17

解决方案是利用数据帧中的分层索引！在

data = data.set_index(keys=['COUNTRY', 'PRODUCTCODE', 'YEAR'])
data.index.levels[0] = pd.Index(data.index.levels[0].map(lambda x: guess_country(x, country_names)[0]))

这很有效。。。通过替换数据索引级别[0]->；当国家/地区在索引中为0级时，则替换通过数据模型传播。在

网友

3楼 · 编辑于 2024-10-01 11:25:17

没有，但是如果你只想应用于唯一值，那就自己去做。获取mySeries.unique()，然后使用函数为这些唯一值预先计算映射的替代项，并创建一个包含结果映射的字典。然后在字典中使用pandasmap。这应该和你所期望的一样快。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：效率更高的.map（）函数还是方法？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >