从一个两列字符串的数据框中,如下所示:
d = {'SCHOOL' : ['Yale', 'Yale', 'LBS', 'Harvard','UCLA', 'Harvard', 'HEC'],
'NAME' : ['John', 'Marc', 'Alex', 'Will', 'Will','Miller', 'Tom']}
df = pd.DataFrame(d)
注意,NAME与SCHOOL之间的关系是n:1。 我想得到最后一所学校,以防一个人去了两所不同的学校(见“威尔”案例)。你知道吗
到目前为止我得到了:
df = df.groupby('NAME')['SCHOOL'].unique().reset_index()
退货:
NAME SCHOOL
0 Alex [LBS]
1 John [Yale]
2 Marc [Yale]
3 Miller [Harvard]
4 Tom [HEC]
5 Will [Harvard, UCLA]
问题:
这两个问题都是基于@IanS注释解决的。你知道吗
使用
last()
而不是unique()
:退货:
将^{} 与参数
last
一起使用,并指定检查重复项的列:如果需要排序,请添加^{} :
相关问题 更多 >
编程相关推荐