Python中文
首页
教程
问答
标签
搜索
登录
注册
Pandas:数数
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>在下文中,雄熊猫旅行是一个大熊猫数据框架,而站点是一个小熊猫数据框架。我想知道每个车站都有多少男性乘客。以下操作完成任务,但需要很长时间:</p> <pre><code>mc = [ sum( male_trips['start_station_id'] == id ) for id in stations['id'] ] </code></pre> <p>我该怎么做呢?</p> <hr/> <p>更新!所以主要有两种方法:<code>groupby()</code>然后是<code>size()</code>,以及更简单的<code>.value_counts()</code>。我做了一个快速的<code>timeit</code>,并且<code>groupby</code>方法以相当大的优势获胜!代码如下:</p> <pre><code>from timeit import Timer setup = "import pandas; male_trips=pandas.load('maletrips')" a = "male_trips.start_station_id.value_counts()" b = "male_trips.groupby('start_station_id').size()" Timer(a,setup).timeit(100) Timer(b,setup).timeit(100) </code></pre> <p>结果是:</p> <pre><code>In [4]: Timer(a,setup).timeit(100) # <- this is value_counts Out[4]: 9.709594964981079 In [5]: Timer(b,setup).timeit(100) # <- this is groupby / size Out[5]: 1.5574288368225098 </code></pre> <p>注意,在这种速度下,对于探索数据而言,输入“eem”值计数要快得多,记住的也少得多!</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我喜欢Vishal,但不想使用sum()using size()来获取分配给每组“start_station_I d”的行数。所以:</p> <pre><code>df = male_trips.groupby('start_station_id').size() </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
1 回答
如何在python中从数据帧列表中删除引号
9 回答
如何在python中从数据帧创建列表
9 回答
如何在Python中从数据帧创建嵌套的JSON
5 回答
如何在Python中从数据帧显示wordcloud
6 回答
如何在Python中从数据帧的时间戳中删除字符
4 回答
如何在Python中从数据帧绘制简单绘图?
6 回答
如何在python中从数据帧行提取具有特定长度的范围?
10 回答
如何在python中从数据帧设置dict中的值
10 回答
如何在Python中从数据库中获得一个结果
8 回答
如何在python中从数据框中绘制分类条形图
10 回答
如何在Python中从数据框中选择特定细节?
7 回答
如何在python中从数据集中删除unicode
5 回答
如何在python中从数据集中删除某些数值?
7 回答
如何在python中从数据集中选择行
7 回答
如何在Python中从数组中删除元素
10 回答
如何在python中从数组中删除单个倒逗号?
8 回答
如何在python中从数组中删除对象?
8 回答
如何在python中从数组中删除引号
9 回答
如何在python中从数组中删除所有最小值
5 回答