我正在加载一个csv文件,该文件包含以下列: 日期,文本A,文本B,数字A,数字B
我想按列进行分组:date、textA和textB-但是想对numberA应用“sum”,而对numberB应用“min”。
data = pd.read_table("file.csv", sep=",", thousands=',')
grouped = data.groupby(["date", "textA", "textB"], as_index=False)
…但是我看不出如何将两个不同的聚合函数应用到两个不同的列上?
一、 e.sum(numberA), min(numberB)
agg
方法可以接受dict,在这种情况下,键指示应用函数的列:例如
收益率
这也表明Pandas可以处理列名中的空格。我不确定问题的根源是什么,但是文字空间不应该造成问题。如果你想进一步调查
在不重新分配列名的情况下,将显示名称的
repr
。例如,列名中可能有一个看起来像空格(或其他字符)但实际上是u'\xa0'
(不间断空格)的难看字符。相关问题 更多 >
编程相关推荐