Python中文
首页
教程
问答
标签
搜索
登录
注册
Pandas:效率更高的.map()函数还是方法?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我使用的是一个相当大的数据集,大约有3700万个数据点,这些数据点按层次分为三类:country、productcode和year。country变量(即countryname)是一个相当混乱的数据,由代表“Austral”的“Austral”等项组成。我构建了一个简单的guess_country(),它将字母与单词进行匹配,并从已知的国家名称列表中返回最佳猜测和置信区间。考虑到数据的长度和层次结构的性质,将.map()用于Series:country是非常低效的。[guess_country函数需要~2ms/请求]</p> <p>我的问题是:有没有更高效的.map()来获取序列并只对唯一值执行映射?(考虑到有很多重复的国家名称)</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>没有,但是如果你只想应用于唯一值,那就自己去做。获取<code>mySeries.unique()</code>,然后使用函数为这些唯一值预先计算映射的替代项,并创建一个包含结果映射的字典。然后在字典中使用pandas<code>map</code>。这应该和你所期望的一样快。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
2 回答
如何添加表示整数的擦边字符串?
7 回答
如何添加要在Bokeh中使用的新font.ttf文件?
4 回答
如何添加要显示的矩阵XY轴编号和XY轴
5 回答
如何添加计数?
2 回答
如何添加计数器函数?
3 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
2 回答
如何添加计数器来跟踪while循环中的月份和年份?
3 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
10 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
10 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
4 回答
如何添加评论拉梅尔亚姆
5 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
1 回答
如何添加谷歌地点自动完成到Flask?
10 回答
如何添加超时、python discord bot
2 回答
如何添加超过1dp的检查
5 回答
如何添加距离方法
9 回答
如何添加跟随游戏的敌人精灵
5 回答
如何添加路径以便python可以找到程序?
9 回答
如何添加身份验证/安全性以使用happybase访问HBase?
9 回答