我的数据帧几乎没有重复的列名。如果发现重复的列名,请将重复的列合并为一个。我还想保留用逗号分隔的重复列数据。有谁能给我一个建议吗。在
我在下面构建了一个例子。在我的实际数据帧列名是未知的。在
输入数据帧:
Col1 Col2 Col3 Col2
A CA1 CA5 CA3 CA5
B CB1 CB5 CB3 CB5
C CC1 CC5 CC3 CC5
D CD1 CD5 CD3 None
E CE1 CE5 CE3 CE5
可通过以下方式读取:
^{pr2}$输出数据帧:
Col1 Col2 Col3
A CA1 CA5,CA5 CA3
B CB1 CB5,CB5 CB3
C CC1 CC5,CC5 CC3
D CD1 CD5 CD3
E CE1 CE5,CE5 CE3
你可以这样做:
数据:
^{2}$输出:
说明:
我觉得很惭愧发这个。但它是有效的。在
有点崩溃了。在
^{2}$您还可以:
详细信息:在
^{2}$df.columns
上使用.groupby()
对重复项进行分组:然后,使用},如下所示:
.agg()
和','.join()
折叠grouped
列中的{由于只有重复列具有多个值,因此只有它们将被联接,因此您可以得到:
使用
None
类型值,您可以:获得:
相关问题 更多 >
编程相关推荐