在我的数据帧中,我有一个列“away\u lineup”,它包含5个字符串的分组,还有一个“play\u length”列,每行有一个持续时间值。我知道np.unique可以检测唯一的字符串值,np.sum值在列中添加值,但是如何使用像np.unique这样的函数来检测每个唯一的字符串,并对字符串所在行中的“play\u length”值求和
away_lineup play_length
0 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, Ben Simmons 0:00:05
1 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, Ben Simmons 0:00:10
2 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, Ben Simmons 0:00:20
3 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, Ben Simmons 0:00:07
4 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, Ben Simmons 0:00:25
5 Dario Saric, Robert Covington, Joel Embiid, Markelle Fultz, JJ Redick 0:00:14
我想要的结果是
player play_length
Dario Saric 0:01:21
Robert Covington 0:01:21
Joel Embiid 0:01:21
Markelle Fultz 0:01:21
Ben Simmons 0:01:07
JJ Redick 0:00:14
其中从“客场\阵容”中提取唯一的名称,存储在新的列“player”中,并且存在player值的行添加了它们的“play \ u length”值
你可以像这样使用explode和group by
输出
使用^{} 和^{} :
注:
pandas.DataFrame.explode
与pandas
>;一起提供0.25英寸输出:
如果您的熊猫不支持
explode
:输出:
相关问题 更多 >
编程相关推荐