给定一个数据帧,例如:
fName lName smokes eye_color
Bob McCain 1 black
Bob McCain 0 black
Bob McCain 1 black
Ryan Diedre 0 brown
Ryan Diedre 0 brown
Ryan Diedre 1 brown
John Madden 1 green
John Madden 0 green
由不同家庭成员对一个人的看法构成
如何创建数据帧,例如:
fName lName smokes eye_color
Bob McCain 1 black
Ryan Diedre 0 brown
John Madden 1 green
在Python中
基本上,我希望第二个(新的)数据帧对于数据帧1中fName和lName的每个唯一组合都有一行。如果没有重复值,只需选择第一个。Smokes值只能为0或1
我可能正在处理包含数千行的数据帧,因此一个有效的答案是可取的。但现在任何答案都足够了
编辑:添加了一个场景,其中模式不仅仅是样本数据的一个数字
可以使用groupby,然后使用pd.Series.mode:
pd.Series.mode
返回最频繁的值对第一个值使用^{} ,因为它应该返回2个值并且只需要一个值,对于} :
eye_color
,如果每个组的所有值都相同,则使用^{如果每个组的两列中都需要最频繁的值:
试试
groupby
:相关问题 更多 >
编程相关推荐