擅长:python、mysql、java
<p>我也是R的dplyr的忠实粉丝,我正在努力提高我对熊猫的认识。既然你没有什么特别的问题,我建议你看看下面的帖子,它分解了整个介绍性的dplyr小插曲,并展示了如何利用熊猫完成所有这些。</p>
<p>例如,作者演示了在R中使用管道运算符链接:</p>
<pre><code> flights %>%
group_by(year, month, day) %>%
select(arr_delay, dep_delay) %>%
summarise(
arr = mean(arr_delay, na.rm = TRUE),
dep = mean(dep_delay, na.rm = TRUE)
) %>%
filter(arr > 30 | dep > 30)
</code></pre>
<p>以下是熊猫的实施:</p>
<pre><code>flights.groupby(['year', 'month', 'day'])
[['arr_delay', 'dep_delay']]
.mean()
.query('arr_delay > 30 | dep_delay > 30')
</code></pre>
<p>关于如何在原来的岗位上与熊猫实施类似dplyr的操作还有很多比较。
<a href="http://nbviewer.ipython.org/gist/TomAugspurger/6e052140eaa5fdb6e8c0" rel="noreferrer">http://nbviewer.ipython.org/gist/TomAugspurger/6e052140eaa5fdb6e8c0</a></p>