我有个问题:
import pandas as pd
stripline = "----------------------------"
rawData = {
'order number': ['11xa', '11xa', '11xa', '21xb', '31xc'],
'working area': ['LLA', 'LLE', 'LLS', 'MLA', 'MLE'],
'time': [1, 6, 13, 35, 24]
}
df = pd.DataFrame(rawData)
print("original data:")
print(df.head())
print(stripline)
rawData2 = {
'order number': ['11xa', '21xb', '31xc'],
'working area': ['LLS', 'MLA', 'MLE'],
'time': [20, 35, 24]
}
df2 = pd.DataFrame(rawData2)
print("expected result:")
print("group after order number, sum all times to that order and choose working field with the biggest time")
print(df2.head())
如何操作数据帧df来获得df2?你知道吗
我要将时间列中与订单号对应的所有值相加。我想使用时间最长的工作字段,特别是我想保留其余的数据。新的数据帧有三个顺序,旧的一个有五个。你知道吗
试着这样做,您可以使用
agg
来实现这一点:(注意:列名中的小更改):输出:
给你
输出
相关问题 更多 >
编程相关推荐