擅长:python、mysql、java
<p>如果你真的想用熊猫,记住这个简单的事情:<strong>永远不要使用循环</strong>。循环是不可伸缩的,所以尝试使用内置函数。首先让我们读一下你的数据帧:</p>
<pre><code>import pandas as pd
data = pd.read_csv('bus.csv',sep = ';')
</code></pre>
<p>这是我回答的不足之处,我不知道如何有效地管理约会。因此,创建一个名为<code>day</code>的列,其中包含来自<code>UtcTime</code>的日期(我将使用类似于<code>data['day'] = data['UtcTime'].apply(lambda x: x[:10])</code>的apply方法,但它是一个隐藏的循环,所以不要这样做!)在</p>
<p>然后,要只获取单个总线的数据,请尝试一种切片方法:</p>
^{pr2}$
<p>最后使用groupby函数:</p>
<pre><code>data_bus1[['Modename','Value','day']].groupby(['ModeName','day'],as_index = False).mean()
</code></pre>
<p>或者,如果您不需要在不同的数据帧中分离总线,您可以对整个数据使用<code>groupby</code>:</p>
<pre><code>data[['BusID','ModeName','Value','day']].groupby(['BusID','ModeName','day'],as_index = False).mean()
</code></pre>