我有一个熊猫数据框,如下所示:
如何将所有列表(在“val”列中)组合成一个唯一的列表(集合),例如[val1, val2, val33, val9, val6, val7]
?
我可以用下面的代码解决这个问题。我想知道是否有一种更简单的方法可以在不迭代数据帧行的情况下从列中获取所有唯一值?
def_contributors=[]
for index, row in df.iterrows():
contri = ast.literal_eval(row['val'])
def_contributors.extend(contri)
def_contributors = list(set(def_contributors))
另一个解决方案是将
Series
导出到嵌套的lists
,然后应用set
展开列表:计时:
如果类型不是} 和^{} :
list
,而是string
,请使用^{您可以使用^{} 和一些
string
操作来获得所需的list
。使用
.apply(pd.Series)
将该列转换为数据帧。如果堆栈列,则可以对返回的序列调用unique
方法。相关问题 更多 >
编程相关推荐