我有一个CSV文件,如下所示:
|innings | bowler |
|--------|---------------|
|1 | P Kumar |
|1 | P Kumar |
|1 | P Kumar |
|1 | P Kumar |
|1 | Z Khan |
|1 | Z Khan |
|1 | Z Khan |
|2 | AB Dinda |
|2 | AB Dinda |
|2 | I Sharma |
所需输出
|innings | bowler |
|--------|----------------------|
|1 | P Kumar,Z Khan |
|2 | AB Dinda,I Sharma |
我应用的代码:
df.groupby(['innings']).bowler.sum().drop_duplicates(subset="bowler",keep='first',inplace=True)
但出于某种原因,它给了我一个错误 TypeError:drop_duplicates()获得意外的关键字参数“subset”
然后我尝试不使用子集: 删除重复项(“保龄球手”,keep='first',inplace=True) 现在我得到了这个错误 TypeError:drop_duplicates()为参数“keep”获取了多个值
首先对两列使用^{} ,然后聚合
join
:相关问题 更多 >
编程相关推荐