擅长:python、mysql、java
<p>我认为op的问题更多的是关于如何同时在所有(或一系列)列中执行此操作。以下是熊猫和格拉芙拉布的比较。在</p>
<pre><code># imports
import graphlab as gl
import pandas as pd
import numpy as np
# generate data
data = np.random.randint(0,10,size=100).reshape(10,10)
col_names = list('ABCDEFGHIJ')
# make dataframe and sframe
df = pd.DataFrame(data, columns=names)
sf = graphlab.SFrame(df)
# get sum for all columns (pandas). Returns a series.
df.sum().sort_values(ascending=False)
D 65
A 61
J 59
B 50
H 46
G 46
I 45
F 43
C 37
E 36
# sf.sum() does not work
# get sum for each of the columns (graphlab)
for col in col_names:
print col, sf[col].sum()
A 61
B 50
C 37
D 65
E 36
F 43
G 46
H 46
I 45
J 59
</code></pre>
<p>我也有同样的问题。Pandas提供了一个简单的界面,可以跨数据帧的行或列应用聚合函数。找不到相同的SFrame?我唯一能想到的方法就是迭代列列表。在</p>
<p>有更好的方法吗?在</p>